<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<meta name="Generator" content="Microsoft Word 12 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
@font-face
        {font-family:"Arial Narrow";
        panose-1:2 11 6 6 2 2 2 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-reply;
        font-family:"Calibri","sans-serif";
        color:#1F497D;}
.MsoChpDefault
        {mso-style-type:export-only;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-AU" link="blue" vlink="purple">
<div class="WordSection1">
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1F497D">Hi Luck,<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1F497D">Could you give all the necessary information about your system to help us to figure where the problem could be?
<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1F497D">What kind of compounds are you simulating?<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1F497D">What size of box are you using?<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1F497D">Do&nbsp; you run on multiple thread when you run it on your iMac?<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1F497D">How many CPU&#8217;s are you using on the cluster?<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1F497D">Cheers,<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1F497D">Emanuel<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Arial Narrow&quot;,&quot;sans-serif&quot;;color:black"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Arial Narrow&quot;,&quot;sans-serif&quot;;color:black"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Arial Narrow&quot;,&quot;sans-serif&quot;;color:black"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Arial Narrow&quot;,&quot;sans-serif&quot;;color:black"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Arial Narrow&quot;,&quot;sans-serif&quot;;color:black"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Arial Narrow&quot;,&quot;sans-serif&quot;;color:black"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Arial Narrow&quot;,&quot;sans-serif&quot;;color:black">=========================================================<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:black">Emanuel Birru<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:black">PhD Candidate<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:black"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:black">Faculty of Pharmacy and Pharmaceutical Sciences<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:black">Monash University (Parkville Campus)<br>
381 Royal Parade, Parkville<br>
Victoria 3052, Australia<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:black"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:black">Tel: Int &#43; 61 3 9903 9187<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:black">E-mail:
</span><span lang="EN-US" style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1F497D"><a href="mailto:firstname.lastname@monash.edu"><span lang="EN-AU" style="color:blue">emanuel.birru@monash.edu</span></a></span><span lang="EN-US" style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:black">
</span><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:black"><o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:black"><a href="http://www.pharm.monash.edu.au"><span style="color:blue">www.pharm.monash.edu.au</span></a><o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<div style="border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0cm 0cm 0cm">
<p class="MsoNormal"><b><span lang="EN-US" style="font-size:10.0pt;font-family:&quot;Tahoma&quot;,&quot;sans-serif&quot;">From:</span></b><span lang="EN-US" style="font-size:10.0pt;font-family:&quot;Tahoma&quot;,&quot;sans-serif&quot;"> gmx-users-bounces@gromacs.org [mailto:gmx-users-bounces@gromacs.org]
<b>On Behalf Of </b>Luke Goodsell<br>
<b>Sent:</b> Wednesday, 13 July 2011 5:36 PM<br>
<b>To:</b> GROMACS Users mailinglist<br>
<b>Subject:</b> [gmx-users] Simulation runs on iMac but explodes on cluster<o:p></o:p></span></p>
</div>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<p class="MsoNormal">Hi,<o:p></o:p></p>
<div>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
</div>
<div>
<p class="MsoNormal">As the subject suggests, I have a simulation that runs correctly on my iMac, but fails when I try to run it on a cluster, and I am hoping someone may be able to suggest which things to try first to resolve the issue.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
</div>
<div>
<p class="MsoNormal">Background:<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">The simulation proceeds perfectly well on the iMac (OS X 10.5) without error/warning. On the cluster, it begins producing multiple LINCS warnings at step&nbsp;14555 (of 7500000) and then segfaults after step 14556 with:<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
</div>
<div>
<div>
<p class="MsoNormal">[node-005:13244] *** Process received signal ***<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">[node-005:13244] Signal: Segmentation fault (11)<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">[node-005:13244] Signal code: Address not mapped (1)<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">[node-005:13244] Failing at address: 0x2aaab1380520<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">[node-005:13244] [ 0] /lib64/libpthread.so.0 [0x2aaaac402b10]<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">[node-005:13244] [ 1] mdrun_mpi(nb_kernel410_x86_64_sse&#43;0xa65) [0x947e25]<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">[node-005:13244] [ 2] mdrun_mpi(do_nonbonded&#43;0x780) [0x8ce890]<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">[node-005:13244] [ 3] mdrun_mpi(do_force_lowlevel&#43;0x308) [0x6842b8]<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">[node-005:13244] [ 4] mdrun_mpi(do_force&#43;0xc59) [0x6f7c19]<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">[node-005:13244] [ 5] mdrun_mpi(do_md&#43;0x5785) [0x626f75]<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">[node-005:13244] [ 6] mdrun_mpi(mdrunner&#43;0xa07) [0x61e8a7]<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">[node-005:13244] [ 7] mdrun_mpi(main&#43;0x1363) [0x62c5f3]<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">[node-005:13244] [ 8] /lib64/libc.so.6(__libc_start_main&#43;0xf4) [0x2aaaac62d994]<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">[node-005:13244] [ 9] mdrun_mpi(__gxx_personality_v0&#43;0x479) [0x44b659]<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">[node-005:13244] *** End of error message ***<o:p></o:p></p>
</div>
</div>
<div>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
</div>
<div>
<p class="MsoNormal">Things I have tried:<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">* Both MPI and non-MPI versions on cluster (same result)<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">* Harmonising FFTW - configured and compiled fftw3 from same source using same configuration and ensured correct library was included during configure step<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">* Checking the Reproducibility documentation<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">* Searching the archives - I didn't find anything that described a similar problem.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
</div>
<div>
<p class="MsoNormal">Things I think may be involved:<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">* Different architectures - i686 vs x86_64 - don't know how to test for this<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">* Different BLAS/LAPACK libraries - I believe gromacs uses the vecLb on OS X; maybe I could compile without external BLAS/LAPACK and see if this makes a difference<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">* Some other unknown problem<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
</div>
<div>
<p class="MsoNormal">I've currently spent more than 2 weeks trying to diagnose this problem and don't seem to be making progress. Could anyone suggest what is the most likely cause of this significant difference in output, and what I could do to test/fix it?<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
</div>
<div>
<p class="MsoNormal">Any help is greatly appreciated.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
</div>
<div>
<p class="MsoNormal">Luke<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
</div>
</div>
</body>
</html>