Hi,<div><br></div><div>the reason turned out to be that the lock daemon (lockd) on the NFS server was hanging. The error could be found by dmesg. </div><div><br></div><div>BTW: Is it somehow possible to print the kernel error messages that are shown by dmesg to the user from within GROMACS? That would help the user to directly see the reason of the error. Thus I&#39;m looking for a function similar to strerror but which returns the kernel message not just the message of the error code (which in this case was just &quot;Input/Output errror&quot;.</div>

<div><br></div><div>Roland</div><div><br></div><div> <br><br><div class="gmail_quote">On Wed, Nov 3, 2010 at 12:05 PM, Carsten Kutzner <span dir="ltr">&lt;<a href="mailto:ckutzne@gwdg.de" target="_blank">ckutzne@gwdg.de</a>&gt;</span> wrote:<br>



<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi,<br>
<br>
there was also an issue with the locking of the general md.log<br>
output file which was resolved for 4.5.2. An update might help.<br>
<font color="#888888"><br>
Carsten<br>
</font><div><div></div><div><br>
<br>
On Nov 3, 2010, at 3:50 PM, Florian Dommert wrote:<br>
<br>
&gt; -----BEGIN PGP SIGNED MESSAGE-----<br>
&gt; Hash: SHA1<br>
&gt;<br>
&gt; On 11/03/2010 03:38 PM, Hong, Liang wrote:<br>
&gt;&gt; Dear all,<br>
&gt;&gt; I&#39;m performing a three-day simulation. It runs well for the first day, but stops for the second one. The error message is below. Does anyone know what might be the problem? Thanks<br>
&gt;&gt; Liang<br>
&gt;&gt;<br>
&gt;&gt; Program mdrun, VERSION 4.5.1-dev-20101008-e2cbc-dirty<br>
&gt;&gt; Source code file: /home/z8g/download/gromacs.head/src/gmxlib/checkpoint.c, line: 1748<br>
&gt;&gt;<br>
&gt;&gt; Fatal error:<br>
&gt;&gt; Failed to lock: md100ns.log. Already running simulation?<br>
&gt;&gt; For more information and tips for troubleshooting, please check the GROMACS<br>
&gt;&gt; website at <a href="http://www.gromacs.org/Documentation/Errors" target="_blank">http://www.gromacs.org/Documentation/Errors</a><br>
&gt;&gt; -------------------------------------------------------<br>
&gt;&gt;<br>
&gt;&gt; &quot;Sitting on a rooftop watching molecules collide&quot; (A Camp)<br>
&gt;&gt;<br>
&gt;&gt; Error on node 0, will try to stop all the nodes<br>
&gt;&gt; Halting parallel program mdrun on CPU 0 out of 32<br>
&gt;&gt;<br>
&gt;&gt; gcq#348: &quot;Sitting on a rooftop watching molecules collide&quot; (A Camp)<br>
&gt;&gt;<br>
&gt;&gt; --------------------------------------------------------------------------<br>
&gt;&gt; MPI_ABORT was invoked on rank 0 in communicator MPI_COMM_WORLD<br>
&gt;&gt; with errorcode -1.<br>
&gt;&gt;<br>
&gt;&gt; NOTE: invoking MPI_ABORT causes Open MPI to kill all MPI processes.<br>
&gt;&gt; You may or may not see output from other processes, depending on<br>
&gt;&gt; exactly when Open MPI kills them.<br>
&gt;&gt; --------------------------------------------------------------------------<br>
&gt;&gt; [node139:04470] [[37327,0],0]-[[37327,1],0] mca_oob_tcp_msg_recv: readv failed: Connection reset by peer (104)<br>
&gt;&gt; --------------------------------------------------------------------------<br>
&gt;&gt; mpiexec has exited due to process rank 0 with PID 4471 on<br>
&gt;&gt; node node139 exiting without calling &quot;finalize&quot;. This may<br>
&gt;&gt; have caused other processes in the application to be<br>
&gt;&gt; terminated by signals sent by mpiexec (as reported here).<br>
&gt;<br>
&gt; Perhaps the queueing system of your cluster does not allow running a job<br>
&gt; longer than 24h. Or the default is 24h and you have to supply the<br>
&gt; corresponding information to the submission script.<br>
&gt;<br>
&gt; /Flo<br>
&gt;<br>
&gt; - --<br>
&gt; Florian Dommert<br>
&gt; Dipl.-Phys.<br>
&gt;<br>
&gt; Institute for Computational Physics<br>
&gt;<br>
&gt; University Stuttgart<br>
&gt;<br>
&gt; Pfaffenwaldring 27<br>
&gt; 70569 Stuttgart<br>
&gt;<br>
&gt; Phone: +49(0)711/685-6-3613<br>
&gt; Fax:   +49-(0)711/685-6-3658<br>
&gt;<br>
&gt; EMail: <a href="mailto:dommert@icp.uni-stuttgart.de" target="_blank">dommert@icp.uni-stuttgart.de</a><br>
&gt; Home: <a href="http://www.icp.uni-stuttgart.de/~icp/Florian_Dommert" target="_blank">http://www.icp.uni-stuttgart.de/~icp/Florian_Dommert</a><br>
&gt; -----BEGIN PGP SIGNATURE-----<br>
&gt; Version: GnuPG v1.4.10 (GNU/Linux)<br>
&gt; Comment: Using GnuPG with Mozilla - <a href="http://enigmail.mozdev.org/" target="_blank">http://enigmail.mozdev.org/</a><br>
&gt;<br>
&gt; iEYEARECAAYFAkzRdrEACgkQLpNNBb9GiPm1sgCg3LkRUWgiZvOOH/GIjp5ifbZI<br>
&gt; bJcAn1aamCMWlWTokD1+eDCLG1WhT/rd<br>
&gt; =4Vs3<br>
&gt; -----END PGP SIGNATURE-----<br>
&gt; --<br>
&gt; gmx-users mailing list    <a href="mailto:gmx-users@gromacs.org" target="_blank">gmx-users@gromacs.org</a><br>
&gt; <a href="http://lists.gromacs.org/mailman/listinfo/gmx-users" target="_blank">http://lists.gromacs.org/mailman/listinfo/gmx-users</a><br>
&gt; Please search the archive at <a href="http://www.gromacs.org/Support/Mailing_Lists/Search" target="_blank">http://www.gromacs.org/Support/Mailing_Lists/Search</a> before posting!<br>
&gt; Please don&#39;t post (un)subscribe requests to the list. Use the<br>
&gt; www interface or send it to <a href="mailto:gmx-users-request@gromacs.org" target="_blank">gmx-users-request@gromacs.org</a>.<br>
&gt; Can&#39;t post? Read <a href="http://www.gromacs.org/Support/Mailing_Lists" target="_blank">http://www.gromacs.org/Support/Mailing_Lists</a><br>
<br>
<br>
<br>
<br>
<br>
--<br>
gmx-users mailing list    <a href="mailto:gmx-users@gromacs.org" target="_blank">gmx-users@gromacs.org</a><br>
<a href="http://lists.gromacs.org/mailman/listinfo/gmx-users" target="_blank">http://lists.gromacs.org/mailman/listinfo/gmx-users</a><br>
Please search the archive at <a href="http://www.gromacs.org/Support/Mailing_Lists/Search" target="_blank">http://www.gromacs.org/Support/Mailing_Lists/Search</a> before posting!<br>
Please don&#39;t post (un)subscribe requests to the list. Use the<br>
www interface or send it to <a href="mailto:gmx-users-request@gromacs.org" target="_blank">gmx-users-request@gromacs.org</a>.<br>
Can&#39;t post? Read <a href="http://www.gromacs.org/Support/Mailing_Lists" target="_blank">http://www.gromacs.org/Support/Mailing_Lists</a><br>
<br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br>ORNL/UT Center for Molecular Biophysics <a href="http://cmb.ornl.gov" target="_blank">cmb.ornl.gov</a><br>865-241-1537, ORNL PO BOX 2008 MS6309<br>
</div>