<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<meta name="Generator" content="Microsoft Word 14 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:SimSun;
        panose-1:2 1 6 0 3 1 1 1 1 1;}
@font-face
        {font-family:SimSun;
        panose-1:2 1 6 0 3 1 1 1 1 1;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:"\@SimSun";
        panose-1:2 1 6 0 3 1 1 1 1 1;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri","sans-serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
p.MsoPlainText, li.MsoPlainText, div.MsoPlainText
        {mso-style-priority:99;
        mso-style-link:"Plain Text Char";
        margin:0cm;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri","sans-serif";}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri","sans-serif";
        color:windowtext;}
span.PlainTextChar
        {mso-style-name:"Plain Text Char";
        mso-style-priority:99;
        mso-style-link:"Plain Text";
        font-family:"Calibri","sans-serif";}
.MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri","sans-serif";}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-GB" link="blue" vlink="purple">
<div class="WordSection1">
<p class="MsoPlainText">Dear gromacs developers,<o:p></o:p></p>
<p class="MsoPlainText"><o:p>&nbsp;</o:p></p>
<p class="MsoPlainText">I posted this over in the users forum a couple of days ago, but haven't had much luck there so I hope it's ok to re-post it here (and apologies if this has been posted multiple times, I didn&#8217;t intend to.)<o:p></o:p></p>
<p class="MsoPlainText"><o:p>&nbsp;</o:p></p>
<p class="MsoPlainText">A week ago I tried to extend a protein simulation using RDC derived orientation restraints using gromacs 4.5.3 and it failed and I then found this bug relating to extending a distance restraint simulation that was giving a similar error
 to mine: <a href="http://bugzilla.gromacs.org/issues/1174">http://bugzilla.gromacs.org/issues/1174</a><o:p></o:p></p>
<p class="MsoPlainText">which Mark says is resolved in the latest version.<o:p></o:p></p>
<p class="MsoPlainText"><o:p>&nbsp;</o:p></p>
<p class="MsoPlainText">So I requested an upgrade to gromacs 4.6.4 on our cluster. This has been compiled using:<o:p></o:p></p>
<p class="MsoPlainText">Intel compilers: v13.1.2<o:p></o:p></p>
<p class="MsoPlainText">MKL Libraries: v11.1<o:p></o:p></p>
<p class="MsoPlainText">fftw v3.3.3<o:p></o:p></p>
<p class="MsoPlainText">OpenMPI library version v1.6.4<o:p></o:p></p>
<p class="MsoPlainText"><o:p>&nbsp;</o:p></p>
<p class="MsoPlainText">When I run an initial test with this command, where nprocs = 4, it works<o:p></o:p></p>
<p class="MsoPlainText">fine:<o:p></o:p></p>
<p class="MsoPlainText"><o:p>&nbsp;</o:p></p>
<p class="MsoPlainText">mpirun -np $nprocs mdrun_mpi -pd -deffnm pr_test_md -s pr_test_md -cpi pr_test_md.cpt -nice 0 &gt;&amp; pr_test_md.out
<o:p></o:p></p>
<p class="MsoPlainText"><o:p>&nbsp;</o:p></p>
<p class="MsoPlainText">But when I try to extend it, I get this segmentation fault in my log file pr_test_md.out :<o:p></o:p></p>
<p class="MsoPlainText"><o:p>&nbsp;</o:p></p>
<p class="MsoPlainText">Reading file pr_test_md.tpr, VERSION 4.6.4 (single precision)<o:p></o:p></p>
<p class="MsoPlainText"><o:p>&nbsp;</o:p></p>
<p class="MsoPlainText">[green0069:28137] * Process received signal *<o:p></o:p></p>
<p class="MsoPlainText"><o:p>&nbsp;</o:p></p>
<p class="MsoPlainText">[green0069:28137] Signal: Segmentation fault (11)<o:p></o:p></p>
<p class="MsoPlainText"><o:p>&nbsp;</o:p></p>
<p class="MsoPlainText">[green0069:28137] Signal code: Address not mapped (1)<o:p></o:p></p>
<p class="MsoPlainText"><o:p>&nbsp;</o:p></p>
<p class="MsoPlainText">[green0069:28137] Failing at address: 0xc0<o:p></o:p></p>
<p class="MsoPlainText"><o:p>&nbsp;</o:p></p>
<p class="MsoPlainText">[green0069:28137] [ 0] /lib64/libpthread.so.0(&#43;0xf500) [0x7fd91a329500]<o:p></o:p></p>
<p class="MsoPlainText"><o:p>&nbsp;</o:p></p>
<p class="MsoPlainText">[green0069:28137] [ 1] /lib64/libc.so.6(_IO_vfprintf&#43;0x39) [0x7fd918efcd49]<o:p></o:p></p>
<p class="MsoPlainText"><o:p>&nbsp;</o:p></p>
<p class="MsoPlainText"><span lang="IT">[green0069:28137] [ 2] /lib64/libc.so.6(_IO_fprintf&#43;0x88) [0x7fd918f07a28]<o:p></o:p></span></p>
<p class="MsoPlainText"><span lang="IT"><o:p>&nbsp;</o:p></span></p>
<p class="MsoPlainText"><span lang="IT">[green0069:28137] [ 3] mdrun_mpi(init_orires&#43;0x7f8) [0x7abdf8]<o:p></o:p></span></p>
<p class="MsoPlainText"><span lang="IT"><o:p>&nbsp;</o:p></span></p>
<p class="MsoPlainText"><span lang="IT">[green0069:28137] [ 4] mdrun_mpi(mdrunner&#43;0x1e74) [0x433c74]<o:p></o:p></span></p>
<p class="MsoPlainText"><span lang="IT"><o:p>&nbsp;</o:p></span></p>
<p class="MsoPlainText">[green0069:28137] [ 5] mdrun_mpi(cmain&#43;0xdea) [0x446f1a]<o:p></o:p></p>
<p class="MsoPlainText"><o:p>&nbsp;</o:p></p>
<p class="MsoPlainText">[green0069:28137] [ 6] mdrun_mpi(main&#43;0x4b) [0x44da1b]<o:p></o:p></p>
<p class="MsoPlainText"><o:p>&nbsp;</o:p></p>
<p class="MsoPlainText">[green0069:28137] [ 7] /lib64/libc.so.6(__libc_start_main&#43;0xfd)<o:p></o:p></p>
<p class="MsoPlainText">[0x7fd918ed7cdd]<o:p></o:p></p>
<p class="MsoPlainText"><o:p>&nbsp;</o:p></p>
<p class="MsoPlainText">[green0069:28137] [ 8] mdrun_mpi() [0x42d419]<o:p></o:p></p>
<p class="MsoPlainText"><o:p>&nbsp;</o:p></p>
<p class="MsoPlainText">[green0069:28137] * End of error message *<o:p></o:p></p>
<p class="MsoPlainText"><o:p>&nbsp;</o:p></p>
<p class="MsoPlainText">My understanding is that the first error&nbsp; &quot;Address not mapped&quot; means that the program tried to access a memory location that is not part of the process' address space (e.g. a null pointer). What follows is a backtrace of the functions
 currently being executed (in reverse order, as found on the stack). I would suspect that the problem relates to Gromacs rather than OpenMPI -- looking at the origin of the trace.<o:p></o:p></p>
<p class="MsoPlainText"><o:p>&nbsp;</o:p></p>
<p class="MsoPlainText">So I'm guessing that it's this error that is the issue:<o:p></o:p></p>
<p class="MsoPlainText"><span lang="FR">mdrun_mpi(init_orires&#43;0x7f8) [0x7abdf8]<o:p></o:p></span></p>
<p class="MsoPlainText"><span lang="FR"><o:p>&nbsp;</o:p></span></p>
<p class="MsoPlainText">Would anyone be able to help me with this? The simulation I need to run uses about 180 hours of walltime and I am only allowed 60 hours for one job, hence I need to extend my initial run.<o:p></o:p></p>
<p class="MsoPlainText"><o:p>&nbsp;</o:p></p>
<p class="MsoPlainText">Many thanks,<o:p></o:p></p>
<p class="MsoPlainText"><o:p>&nbsp;</o:p></p>
<p class="MsoPlainText">Alistair Bailey<o:p></o:p></p>
</div>
</body>
</html>