<html>
<head>
<style>
.hmmessage P
{
margin:0px;
padding:0px
}
body.hmmessage
{
font-size: 10pt;
font-family:Verdana
}
</style>
</head>
<body class='hmmessage'>
Hi,<br>
<br>
We have for now concluded that this is probably an issue related to lam7.1.4.<br>
<br>
There were a few other users with mdrun crashes/hangs.<br>
What it the status of your problems?<br>
<br>
Berk<br><br><br>&gt; Date: Tue, 13 Jan 2009 13:02:47 +0100<br>&gt; From: patrick.fuchs@univ-paris-diderot.fr<br>&gt; To: gmx-users@gromacs.org<br>&gt; Subject: Re: Subject: Re: Re: [gmx-users] Gromacs 4 bug?<br>&gt; <br>&gt; Hi Berk,<br>&gt; it hangs after approximatively 45000 steps (the system is a simple DLPC <br>&gt; bilayer), and there was a cpt file that has been generated (but it was <br>&gt; generated [09:48] before it started to hang [9:58]) :<br>&gt; ---------<br>&gt; [fuchs@cumin 2]$ ls -ltrh<br>&gt; [snip]<br>&gt; -rw-r--r-- 1 fuchs dsimb 384K janv. 13 09:33 traj.trr<br>&gt; -rw-r--r-- 1 fuchs dsimb 385K janv. 13 09:48 state.cpt<br>&gt; -rw-r--r-- 1 fuchs dsimb  66K janv. 13 09:57 md.log<br>&gt; -rw-r--r-- 1 fuchs dsimb 5,4M janv. 13 09:58 traj.xtc<br>&gt; -rw-r--r-- 1 fuchs dsimb  92K janv. 13 09:58 ener.edr<br>&gt; [fuchs@cumin 2]$ date<br>&gt; Tue Jan 13 10:16:22 CET 2009<br>&gt; ---------<br>&gt; The version of MPI is: LAM 7.1.4/MPI 2 C++/ROMIO - Indiana University.<br>&gt; So shall I send you the tpr and cpt files off list ?<br>&gt; Ciao,<br>&gt; <br>&gt; Patrick<br>&gt; <br>&gt; Berk Hess a écrit :<br>&gt; &gt; Hi,<br>&gt; &gt; <br>&gt; &gt; This is strange.<br>&gt; &gt; You run on 4 nodes and all processes hang at the same MPI call.<br>&gt; &gt; I see no reason why they should hang if they are all at the correct call.<br>&gt; &gt; <br>&gt; &gt; After how many steps does this happen?<br>&gt; &gt; If it is not much I can try to see if it also hangs on our system.<br>&gt; &gt; Otherwise, could you try to generate a checkpoint file with<br>&gt; &gt; which it hangs quickly?<br>&gt; &gt; <br>&gt; &gt; What version of MPI are you using?<br>&gt; &gt; <br>&gt; &gt; Berk<br>&gt; &gt; <br>&gt; &gt; <br>&gt; &gt;  &gt; Date: Tue, 13 Jan 2009 10:53:25 +0100<br>&gt; &gt;  &gt; From: patrick.fuchs@univ-paris-diderot.fr<br>&gt; &gt;  &gt; To: gmx-users@gromacs.org<br>&gt; &gt;  &gt; Subject: Re: Subject: Re: Re: [gmx-users] Gromacs 4 bug?<br>&gt; &gt;  &gt;<br>&gt; &gt;  &gt; Hi Berk,<br>&gt; &gt;  &gt; I did a test on gromacs-4.0.2 under Fedora 10 (with fftw-3.0.1 and<br>&gt; &gt;  &gt; lam-7.1.4), using a slightly upgraded version of gcc compared to my<br>&gt; &gt;  &gt; previous post (gcc version 4.3.2 20081105 (Red hat 4.3.2-7)) on the same<br>&gt; &gt;  &gt; hardware but it still hangs (so both FC9 and FC10 give the same problem,<br>&gt; &gt;  &gt; while FC8 does not). Finally I could test mdrun_mpi in the debugger and<br>&gt; &gt;  &gt; here are the results of my tests. You were right, it seems that mdrun<br>&gt; &gt;  &gt; hangs at an MPI call, here are the outputs of each xterm:<br>&gt; &gt;  &gt;<br>&gt; &gt;  &gt; XTERM1<br>&gt; &gt;  &gt; ===================================================================<br>&gt; &gt;  &gt; GNU gdb Fedora (6.8-29.fc10)<br>&gt; &gt;  &gt; Copyright (C) 2008 Free Software Foundation, Inc.<br>&gt; &gt;  &gt; License GPLv3+: GNU GPL version 3 or later<br>&gt; &gt;  &gt; &lt;http://gnu.org/licenses/gpl.html&gt;<br>&gt; &gt;  &gt; This is free software: you are free to change and redistribute it.<br>&gt; &gt;  &gt; There is NO WARRANTY, to the extent permitted by law. Type "show copying"<br>&gt; &gt;  &gt; and "show warranty" for details.<br>&gt; &gt;  &gt; This GDB was configured as "x86_64-redhat-linux-gnu"...<br>&gt; &gt;  &gt; (gdb) run<br>&gt; &gt;  &gt; Starting program: /usr/local/gromacs-4.0.2/bin/mdrun_mpi<br>&gt; &gt;  &gt; [Thread debugging using libthread_db enabled]<br>&gt; &gt;  &gt; [New Thread 0x12df30 (LWP 8285)]<br>&gt; &gt;  &gt; NNODES=4, MYRANK=0, HOSTNAME=cumin.dsimb.inserm.fr<br>&gt; &gt;  &gt; NODEID=0 argc=1<br>&gt; &gt;  &gt; :-) G R O M A C S (-:<br>&gt; &gt;  &gt;<br>&gt; &gt;  &gt; Giant Rising Ordinary Mutants for A Clerical Setup<br>&gt; &gt;  &gt;<br>&gt; &gt;  &gt; :-) VERSION 4.0.2 (-:<br>&gt; &gt;  &gt;<br>&gt; &gt;  &gt; [snip]<br>&gt; &gt;  &gt;<br>&gt; &gt;  &gt; starting mdrun 'Pure DLPC bilayer with 128 lipids and 3655 SPC water'<br>&gt; &gt;  &gt; 5000000 steps, 10000.0 ps.<br>&gt; &gt;  &gt; ^C<br>&gt; &gt;  &gt; Program received signal SIGINT, Interrupt.<br>&gt; &gt;  &gt; 0x0000003b978cc087 in sched_yield () from /lib64/libc.so.6<br>&gt; &gt;  &gt; Missing separate debuginfos, use: debuginfo-install<br>&gt; &gt;  &gt; e2fsprogs-libs-1.41.3-2.fc10.x86_64 glibc-2.9-3.x86_64<br>&gt; &gt;  &gt; libICE-1.0.4-4.fc10.x86_64 libSM-1.1.0-2.fc10.x86_64<br>&gt; &gt;  &gt; libX11-1.1.4-6.fc10.x86_64 libXau-1.0.4-1.fc10.x86_64<br>&gt; &gt;  &gt; libXdmcp-1.0.2-6.fc10.x86_64 libxcb-1.1.91-5.fc10.x86_64<br>&gt; &gt;  &gt; (gdb) where<br>&gt; &gt;  &gt; #0 0x0000003b978cc087 in sched_yield () from /lib64/libc.so.6<br>&gt; &gt;  &gt; #1 0x0000000000770c83 in lam_ssi_rpi_usysv_proc_read_env ()<br>&gt; &gt;  &gt; #2 0x0000000000784a39 in lam_ssi_rpi_usysv_advance_common ()<br>&gt; &gt;  &gt; #3 0x000000000074a1e0 in _mpi_req_advance ()<br>&gt; &gt;  &gt; #4 0x000000000073ced0 in lam_send ()<br>&gt; &gt;  &gt; #5 0x000000000075328e in MPI_Send ()<br>&gt; &gt;  &gt; #6 0x000000000074d7ec in MPI_Sendrecv ()<br>&gt; &gt;  &gt; #7 0x00000000004aebfd in gmx_sum_qgrid_dd ()<br>&gt; &gt;  &gt; #8 0x00000000004b40bb in gmx_pme_do ()<br>&gt; &gt;  &gt; #9 0x0000000000479a58 in do_force_lowlevel ()<br>&gt; &gt;  &gt; #10 0x00000000004d1d32 in do_force ()<br>&gt; &gt;  &gt; #11 0x00000000004214d2 in do_md ()<br>&gt; &gt;  &gt; #12 0x000000000041bea0 in mdrunner ()<br>&gt; &gt;  &gt; #13 0x0000000000422b94 in main ()<br>&gt; &gt;  &gt; (gdb)<br>&gt; &gt;  &gt; ===================================================================<br>&gt; &gt;  &gt;<br>&gt; &gt;  &gt;<br>&gt; &gt;  &gt; XTERM2<br>&gt; &gt;  &gt; ===================================================================<br>&gt; &gt;  &gt; GNU gdb Fedora (6.8-29.fc10)<br>&gt; &gt;  &gt; Copyright (C) 2008 Free Software Foundation, Inc.<br>&gt; &gt;  &gt; License GPLv3+: GNU GPL version 3 or later<br>&gt; &gt;  &gt; &lt;http://gnu.org/licenses/gpl.html&gt;<br>&gt; &gt;  &gt; This is free software: you are free to change and redistribute it.<br>&gt; &gt;  &gt; There is NO WARRANTY, to the extent permitted by law. Type "show copying"<br>&gt; &gt;  &gt; and "show warranty" for details.<br>&gt; &gt;  &gt; This GDB was configured as "x86_64-redhat-linux-gnu"...<br>&gt; &gt;  &gt; (gdb) run<br>&gt; &gt;  &gt; Starting program: /usr/local/gromacs-4.0.2/bin/mdrun_mpi<br>&gt; &gt;  &gt; [Thread debugging using libthread_db enabled]<br>&gt; &gt;  &gt; [New Thread 0x12df30 (LWP 8294)]<br>&gt; &gt;  &gt; NNODES=4, MYRANK=1, HOSTNAME=cumin.dsimb.inserm.fr<br>&gt; &gt;  &gt; NODEID=1 argc=1<br>&gt; &gt;  &gt; ^C<br>&gt; &gt;  &gt; Program received signal SIGINT, Interrupt.<br>&gt; &gt;  &gt; 0x0000003b978cc087 in sched_yield () from /lib64/libc.so.6<br>&gt; &gt;  &gt; Missing separate debuginfos, use: debuginfo-install<br>&gt; &gt;  &gt; e2fsprogs-libs-1.41.3-2.fc10.x86_64 glibc-2.9-3.x86_64<br>&gt; &gt;  &gt; libICE-1.0.4-4.fc10.x86_64 libSM-1.1.0-2.fc10.x86_64<br>&gt; &gt;  &gt; libX11-1.1.4-6.fc10.x86_64 libXau-1.0.4-1.fc10.x86_64<br>&gt; &gt;  &gt; libXdmcp-1.0.2-6.fc10.x86_64 libxcb-1.1.91-5.fc10.x86_64<br>&gt; &gt;  &gt; (gdb) where<br>&gt; &gt;  &gt; #0 0x0000003b978cc087 in sched_yield () from /lib64/libc.so.6<br>&gt; &gt;  &gt; #1 0x0000000000770c83 in lam_ssi_rpi_usysv_proc_read_env ()<br>&gt; &gt;  &gt; #2 0x0000000000784a39 in lam_ssi_rpi_usysv_advance_common ()<br>&gt; &gt;  &gt; #3 0x000000000074a1e0 in _mpi_req_advance ()<br>&gt; &gt;  &gt; #4 0x000000000073ea90 in MPI_Wait ()<br>&gt; &gt;  &gt; #5 0x000000000074d800 in MPI_Sendrecv ()<br>&gt; &gt;  &gt; #6 0x00000000004aed44 in gmx_sum_qgrid_dd ()<br>&gt; &gt;  &gt; #7 0x00000000004b40bb in gmx_pme_do ()<br>&gt; &gt;  &gt; #8 0x0000000000479a58 in do_force_lowlevel ()<br>&gt; &gt;  &gt; #9 0x00000000004d1d32 in do_force ()<br>&gt; &gt;  &gt; #10 0x00000000004214d2 in do_md ()<br>&gt; &gt;  &gt; #11 0x000000000041bea0 in mdrunner ()<br>&gt; &gt;  &gt; #12 0x0000000000422b94 in main ()<br>&gt; &gt;  &gt; (gdb)<br>&gt; &gt;  &gt; ===================================================================<br>&gt; &gt;  &gt;<br>&gt; &gt;  &gt;<br>&gt; &gt;  &gt; XTERM3<br>&gt; &gt;  &gt; ===================================================================<br>&gt; &gt;  &gt; GNU gdb Fedora (6.8-29.fc10)<br>&gt; &gt;  &gt; Copyright (C) 2008 Free Software Foundation, Inc.<br>&gt; &gt;  &gt; License GPLv3+: GNU GPL version 3 or later<br>&gt; &gt;  &gt; &lt;http://gnu.org/licenses/gpl.html&gt;<br>&gt; &gt;  &gt; This is free software: you are free to change and redistribute it.<br>&gt; &gt;  &gt; There is NO WARRANTY, to the extent permitted by law. Type "show copying"<br>&gt; &gt;  &gt; and "show warranty" for details.<br>&gt; &gt;  &gt; This GDB was configured as "x86_64-redhat-linux-gnu"...<br>&gt; &gt;  &gt; (gdb) run<br>&gt; &gt;  &gt; Starting program: /usr/local/gromacs-4.0.2/bin/mdrun_mpi<br>&gt; &gt;  &gt; [Thread debugging using libthread_db enabled]<br>&gt; &gt;  &gt; [New Thread 0x12df30 (LWP 8276)]<br>&gt; &gt;  &gt; NNODES=4, MYRANK=2, HOSTNAME=cumin.dsimb.inserm.fr<br>&gt; &gt;  &gt; NODEID=2 argc=1<br>&gt; &gt;  &gt; ^C<br>&gt; &gt;  &gt; Program received signal SIGINT, Interrupt.<br>&gt; &gt;  &gt; 0x0000000000770c70 in lam_ssi_rpi_usysv_proc_read_env ()<br>&gt; &gt;  &gt; Missing separate debuginfos, use: debuginfo-install<br>&gt; &gt;  &gt; e2fsprogs-libs-1.41.3-2.fc10.x86_64 glibc-2.9-3.x86_64<br>&gt; &gt;  &gt; libICE-1.0.4-4.fc10.x86_64 libSM-1.1.0-2.fc10.x86_64<br>&gt; &gt;  &gt; libX11-1.1.4-6.fc10.x86_64 libXau-1.0.4-1.fc10.x86_64<br>&gt; &gt;  &gt; libXdmcp-1.0.2-6.fc10.x86_64 libxcb-1.1.91-5.fc10.x86_64<br>&gt; &gt;  &gt; (gdb) where<br>&gt; &gt;  &gt; #0 0x0000000000770c70 in lam_ssi_rpi_usysv_proc_read_env ()<br>&gt; &gt;  &gt; #1 0x0000000000784a39 in lam_ssi_rpi_usysv_advance_common ()<br>&gt; &gt;  &gt; #2 0x000000000074a1e0 in _mpi_req_advance ()<br>&gt; &gt;  &gt; #3 0x000000000073ced0 in lam_send ()<br>&gt; &gt;  &gt; #4 0x000000000075328e in MPI_Send ()<br>&gt; &gt;  &gt; #5 0x000000000074d7ec in MPI_Sendrecv ()<br>&gt; &gt;  &gt; #6 0x00000000004aed44 in gmx_sum_qgrid_dd ()<br>&gt; &gt;  &gt; #7 0x00000000004b40bb in gmx_pme_do ()<br>&gt; &gt;  &gt; #8 0x0000000000479a58 in do_force_lowlevel ()<br>&gt; &gt;  &gt; #9 0x00000000004d1d32 in do_force ()<br>&gt; &gt;  &gt; #10 0x00000000004214d2 in do_md ()<br>&gt; &gt;  &gt; #11 0x000000000041bea0 in mdrunner ()<br>&gt; &gt;  &gt; #12 0x0000000000422b94 in main ()<br>&gt; &gt;  &gt; (gdb)<br>&gt; &gt;  &gt; ===================================================================<br>&gt; &gt;  &gt;<br>&gt; &gt;  &gt;<br>&gt; &gt;  &gt; XTERM4<br>&gt; &gt;  &gt; ===================================================================<br>&gt; &gt;  &gt; GNU gdb Fedora (6.8-29.fc10)<br>&gt; &gt;  &gt; Copyright (C) 2008 Free Software Foundation, Inc.<br>&gt; &gt;  &gt; License GPLv3+: GNU GPL version 3 or later<br>&gt; &gt;  &gt; &lt;http://gnu.org/licenses/gpl.html&gt;<br>&gt; &gt;  &gt; This is free software: you are free to change and redistribute it.<br>&gt; &gt;  &gt; There is NO WARRANTY, to the extent permitted by law. Type "show copying"<br>&gt; &gt;  &gt; and "show warranty" for details.<br>&gt; &gt;  &gt; This GDB was configured as "x86_64-redhat-linux-gnu"...<br>&gt; &gt;  &gt; (gdb) run<br>&gt; &gt;  &gt; Starting program: /usr/local/gromacs-4.0.2/bin/mdrun_mpi<br>&gt; &gt;  &gt; [Thread debugging using libthread_db enabled]<br>&gt; &gt;  &gt; [New Thread 0x12df30 (LWP 8267)]<br>&gt; &gt;  &gt; NNODES=4, MYRANK=3, HOSTNAME=cumin.dsimb.inserm.fr<br>&gt; &gt;  &gt; NODEID=3 argc=1<br>&gt; &gt;  &gt; ^C<br>&gt; &gt;  &gt; Program received signal SIGINT, Interrupt.<br>&gt; &gt;  &gt; 0x0000000000770c70 in lam_ssi_rpi_usysv_proc_read_env ()<br>&gt; &gt;  &gt; Missing separate debuginfos, use: debuginfo-install<br>&gt; &gt;  &gt; e2fsprogs-libs-1.41.3-2.fc10.x86_64 glibc-2.9-3.x86_64<br>&gt; &gt;  &gt; libICE-1.0.4-4.fc10.x86_64 libSM-1.1.0-2.fc10.x86_64<br>&gt; &gt;  &gt; libX11-1.1.4-6.fc10.x86_64 libXau-1.0.4-1.fc10.x86_64<br>&gt; &gt;  &gt; libXdmcp-1.0.2-6.fc10.x86_64 libxcb-1.1.91-5.fc10.x86_64<br>&gt; &gt;  &gt; (gdb) where<br>&gt; &gt;  &gt; #0 0x0000000000770c70 in lam_ssi_rpi_usysv_proc_read_env ()<br>&gt; &gt;  &gt; #1 0x0000000000784a39 in lam_ssi_rpi_usysv_advance_common ()<br>&gt; &gt;  &gt; #2 0x000000000074a1e0 in _mpi_req_advance ()<br>&gt; &gt;  &gt; #3 0x000000000073ea90 in MPI_Wait ()<br>&gt; &gt;  &gt; #4 0x000000000074d800 in MPI_Sendrecv ()<br>&gt; &gt;  &gt; #5 0x00000000004aebfd in gmx_sum_qgrid_dd ()<br>&gt; &gt;  &gt; #6 0x00000000004b40bb in gmx_pme_do ()<br>&gt; &gt;  &gt; #7 0x0000000000479a58 in do_force_lowlevel ()<br>&gt; &gt;  &gt; #8 0x00000000004d1d32 in do_force ()<br>&gt; &gt;  &gt; #9 0x00000000004214d2 in do_md ()<br>&gt; &gt;  &gt; #10 0x000000000041bea0 in mdrunner ()<br>&gt; &gt;  &gt; #11 0x0000000000422b94 in main ()<br>&gt; &gt;  &gt; (gdb)<br>&gt; &gt;  &gt; ===================================================================<br>&gt; &gt;  &gt;<br>&gt; &gt;  &gt;<br>&gt; &gt;  &gt; Cheers,<br>&gt; &gt;  &gt;<br>&gt; &gt;  &gt; Patrick<br>&gt; &gt;  &gt;<br>&gt; &gt; <br>&gt; &gt; <br>&gt; &gt; ------------------------------------------------------------------------<br>&gt; &gt; Express yourself instantly with MSN Messenger! MSN Messenger <br>&gt; &gt; &lt;http://clk.atdmt.com/AVE/go/onm00200471ave/direct/01/&gt;<br>&gt; &gt; <br>&gt; &gt; <br>&gt; &gt; ------------------------------------------------------------------------<br>&gt; &gt; <br>&gt; &gt; _______________________________________________<br>&gt; &gt; gmx-users mailing list    gmx-users@gromacs.org<br>&gt; &gt; http://www.gromacs.org/mailman/listinfo/gmx-users<br>&gt; &gt; Please search the archive at http://www.gromacs.org/search before posting!<br>&gt; &gt; Please don't post (un)subscribe requests to the list. Use the <br>&gt; &gt; www interface or send it to gmx-users-request@gromacs.org.<br>&gt; &gt; Can't post? Read http://www.gromacs.org/mailing_lists/users.php<br>&gt; <br>&gt; -- <br>&gt; _________________________________________________________________<br>&gt; !!!! new E-mail address: patrick.fuchs@univ-paris-diderot.fr !!!!<br>&gt; !!!! new postal address !!!<br>&gt; Patrick FUCHS<br>&gt; Equipe de Bioinformatique Genomique et Moleculaire<br>&gt; INTS, INSERM UMR-S726, Université Paris Diderot,<br>&gt; 6 rue Alexandre Cabanel, 75015 Paris<br>&gt; Tel : +33 (0)1-44-49-30-57 - Fax : +33 (0)1-47-34-74-31<br>&gt; Web Site: http://www.dsimb.inserm.fr/~fuchs<br>&gt; _______________________________________________<br>&gt; gmx-users mailing list    gmx-users@gromacs.org<br>&gt; http://www.gromacs.org/mailman/listinfo/gmx-users<br>&gt; Please search the archive at http://www.gromacs.org/search before posting!<br>&gt; Please don't post (un)subscribe requests to the list. Use the <br>&gt; www interface or send it to gmx-users-request@gromacs.org.<br>&gt; Can't post? Read http://www.gromacs.org/mailing_lists/users.php<br><br /><hr />What can you do with the new Windows Live? <a href='http://www.microsoft.com/windows/windowslive/default.aspx' target='_new'>Find out</a></body>
</html>