<div class="gmail_quote">On Fri, Jul 27, 2012 at 4:34 AM, Roland Schulz <span dir="ltr">&lt;<a href="mailto:roland@utk.edu" target="_blank">roland@utk.edu</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div class="im">On Thu, Jul 26, 2012 at 10:26 PM, Szilárd Páll &lt;<a href="mailto:szilard.pall@cbr.su.se">szilard.pall@cbr.su.se</a>&gt; wrote:<br>
&gt; On Fri, Jul 27, 2012 at 4:06 AM, Szilárd Páll &lt;<a href="mailto:szilard.pall@cbr.su.se">szilard.pall@cbr.su.se</a>&gt;<br>
&gt; wrote:<br>
&gt;&gt;<br>
</div><div><div class="h5">&gt;&gt; On Thu, Jul 26, 2012 at 2:09 PM, Jochen Hub &lt;<a href="mailto:jhub@gwdg.de">jhub@gwdg.de</a>&gt; wrote:<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Hi,<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; I am trying to compile and run the git master on my Macbook air (OS X<br>
&gt;&gt;&gt; Lion). Without success. If I compile with a newer gcc (4.5 or newer,<br>
&gt;&gt;&gt; installed from Macports), I get errors like (does this have to do with AVX?)<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; [  1%] Building C object<br>
&gt;&gt;&gt; src/gromacs/CMakeFiles/libgromacs.dir/gmxpreprocess/add_par.c.o<br>
&gt;&gt;&gt; /var/folders/ys/rh9lzqpj7854h34d2__mznph0000gn/T//ccPxJmjg.s:66:no such<br>
&gt;&gt;&gt; instruction: `vmovups 0(%r13), %ymm0&#39;<br>
&gt;&gt;&gt; /var/folders/ys/rh9lzqpj7854h34d2__mznph0000gn/T//ccPxJmjg.s:69:no such<br>
&gt;&gt;&gt; instruction: `vmovups %ymm0, 24(%rdi)&#39;<br>
&gt;&gt;&gt; /var/folders/ys/rh9lzqpj7854h34d2__mznph0000gn/T//ccPxJmjg.s:79:no such<br>
&gt;&gt;&gt; instruction: `vmovss 0(%r13), %xmm1&#39;<br>
&gt;&gt;&gt; /var/folders/ys/rh9lzqpj7854h34d2__mznph0000gn/T//ccPxJmjg.s:83:no such<br>
&gt;&gt;&gt; instruction: `vmovss %xmm1, 24(%rdi,%r9,4)&#39;<br>
&gt;&gt;&gt; /var/folders/ys/rh9lzqpj7854h34d2__mznph0000gn/T//ccPxJmjg.s:99:no such<br>
&gt;&gt;&gt; instruction: `vmovss 0(%r13), %xmm2&#39;<br>
&gt;&gt;&gt; /var/folders/ys/rh9lzqpj7854h34d2__mznph0000gn/T//ccPxJmjg.s:102:no such<br>
&gt;&gt;&gt; instruction: `vmovss %xmm2, 24(%rdi,%r9,4)&#39;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; I can confirm this, works on Linux, fails on Mac OS Lion with gcc 4.5 -<br>
&gt;&gt; 4.7 with GMX_ACCELERATION=AVX_256. It looks like AVX instructions are<br>
&gt;&gt; somehow not recognized, although the aforementioned compilers are supposed<br>
&gt;&gt; to have support for it.<br>
&gt;&gt;<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; On a gcc 4.4 or earlier, compiling works fine, but mdruns stops with a<br>
&gt;&gt;&gt; segfault. A backtrace in gdb<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; That&#39;s strange as gcc 4.4 is supposed to have AVX support<br>
&gt;&gt; (<a href="http://goo.gl/Rt3BM" target="_blank">http://goo.gl/Rt3BM</a>).<br>
&gt;<br>
&gt;<br>
</div></div><div class="im">&gt; Just checked and, as expected, the same compiler errors show up with gcc<br>
&gt; 4.4.7 as well. I&#39;m not sure what did you change in the configuration to get<br>
&gt; the code built, but you must have used GMX_ACCELERATION != AVX_256.<br>
&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;&gt;<br>
</div><div><div class="h5">&gt;&gt;&gt; gives the following. Seems like something goes wrong in FFTW (which was<br>
&gt;&gt;&gt; compiled with the same gcc and with --enable-threads --enable-sse<br>
&gt;&gt;&gt; --enable-sse2).<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Program received signal EXC_BAD_ACCESS, Could not access memory.<br>
&gt;&gt;&gt; Reason: KERN_INVALID_ADDRESS at address: 0x0000000000000048<br>
&gt;&gt;&gt; [Switching to process 44300 thread 0x1b03]<br>
&gt;&gt;&gt; 0x0000000100050ebd in gomp_resolve_num_threads ()<br>
&gt;&gt;&gt; (gdb) bt<br>
&gt;&gt;&gt; #0  0x0000000100050ebd in gomp_resolve_num_threads ()<br>
&gt;&gt;&gt; #1  0x0000000100050fc3 in GOMP_parallel_start ()<br>
&gt;&gt;&gt; #2  0x00000001004c0bc2 in fft5d_plan_3d ()<br>
&gt;&gt;&gt; #3  0x0000000100434a52 in gmx_parallel_3dfft_init ()<br>
&gt;&gt;&gt; #4  0x000000010046b6fc in gmx_pme_init ()<br>
&gt;&gt;&gt; #5  0x0000000100026ab3 in mdrunner (nthreads_requested=4, fplog=0x0,<br>
&gt;&gt;&gt; cr=0x102100b40, nfile=36, fnm=0x103808200, oenv=0x101000c10, bVerbose=0,<br>
&gt;&gt;&gt; bCompact=1, nstglobalcomm=-1, ddxyz=0x1013c0e04, dd_node_order=1, rdd=0,<br>
&gt;&gt;&gt; rconstr=0, dddlb_opt=0x10002e26a &quot;auto&quot;, dlb_scale=0.800000012, ddcsx=0x0,<br>
&gt;&gt;&gt; ddcsy=0x0, ddcsz=0x0, nstepout=100, resetstep=-1, nmultisim=0,<br>
&gt;&gt;&gt; repl_ex_nst=0, repl_ex_nex=0, repl_ex_seed=-1, pforce=-1, cpt_period=15,<br>
&gt;&gt;&gt; max_hours=-1, deviceOptions=0x10002e276 &quot;&quot;, Flags=7168) at<br>
&gt;&gt;&gt; /Users/jhub/src/gmx/gromacs/src/programs/mdrun/runner.c:844<br>
&gt;&gt;&gt; #6  0x0000000100024f2d in mdrunner_start_fn (arg=0x101005d60) at<br>
&gt;&gt;&gt; /Users/jhub/src/gmx/gromacs/src/programs/mdrun/runner.c:173<br>
&gt;&gt;&gt; #7  0x0000000100242bfb in tMPI_Thread_starter ()<br>
&gt;&gt;&gt; #8  0x00007fff9785f8bf in _pthread_start ()<br>
&gt;&gt;&gt; #9  0x00007fff97862b75 in thread_start ()<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Can&#39;t confirm this one right now as there&#39;s no gcc 4.4 on the Mac OS build<br>
&gt;&gt; server. Will check it later. However, it sounds like it&#39;s a similar issue to<br>
&gt;&gt; the ones we&#39;ve had with an ordered clause in a #pragma omp statment.<br>
&gt;<br>
&gt;<br>
</div></div><div class="im">&gt; Unfortunately, I can confirm this crash. It seems to occur with<br>
&gt; OMP_NUM_THREADS=m and -nt n, where m&gt;1 and n &gt;1.<br>
<br>
</div>Could you check whether this the error goes away with a version prior<br>
to d75b7537ed4df95fd3796d9432e9c1e64adec26a<br>
Maybe the new locking added in that commit is not OK.<br></blockquote><div><br></div><div>No, it does not:</div><div><div><br></div><div>$ mdrun -version 2&gt;&amp;1 | tail -n 5</div><div>Version:          VERSION 4.6-dev-20120704-103d98c</div>
<div>GIT SHA1 hash:    103d98cf31f064cce7c6ec14fcccd081aa2bbfac</div><div>Precision:        single</div><div>Parallellization: thread_mpi</div><div>FFT Library:      fftw3</div></div><div><br></div><div>and in fact it looks like it&#39;s a steange tMPI+OpenMP issue because the crash happens even with one omp thread:</div>
<div><br></div><div>$ OMP_NUM_THREADS=1 $mdrun -nt 2 -quiet  -stepout 1 2&gt;/dev/null</div><div><div>[...]</div><div><br></div><div>Segmentation fault: 11</div></div><div><br></div><div><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<span class="HOEnZb"><br><font color="#888888">
Roland</font><br>
</span><div class="HOEnZb"><div class="h5"><br>
&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Can anyone give me a hint how to fix this? Or is the master so<br>
&gt;&gt;&gt; experimental that it is not interned to be used at all right now?<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Unfortunately, this affects the release-4-6 branch as well. Could you<br>
&gt;&gt; please file a bug on Redmine on the first issue and have a look at the<br>
&gt;&gt; related issue on the second.<br>
&gt;&gt;<br>
&gt;&gt; Cheers,<br>
&gt;&gt; --<br>
&gt;&gt; Sz.<br>
&gt;&gt;<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Many thanks,<br>
&gt;&gt;&gt; Jochen<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; --<br>
&gt;&gt;&gt; ---------------------------------------------------<br>
&gt;&gt;&gt; Dr. Jochen Hub<br>
&gt;&gt;&gt; Computational Molecular Biophysics Group<br>
&gt;&gt;&gt; Institute for Microbiology and Genetics<br>
&gt;&gt;&gt; Georg-August-University of Göttingen<br>
&gt;&gt;&gt; Justus-von-Liebig-Weg 11, 37077 Göttingen, Germany.<br>
&gt;&gt;&gt; Phone: <a href="tel:%2B49-551-39-14189" value="+495513914189">+49-551-39-14189</a><br>
&gt;&gt;&gt; <a href="http://cmb.bio.uni-goettingen.de/" target="_blank">http://cmb.bio.uni-goettingen.de/</a><br>
&gt;&gt;&gt; ---------------------------------------------------<br>
&gt;&gt;&gt; --<br>
&gt;&gt;&gt; gmx-developers mailing list<br>
&gt;&gt;&gt; <a href="mailto:gmx-developers@gromacs.org">gmx-developers@gromacs.org</a><br>
&gt;&gt;&gt; <a href="http://lists.gromacs.org/mailman/listinfo/gmx-developers" target="_blank">http://lists.gromacs.org/mailman/listinfo/gmx-developers</a><br>
&gt;&gt;&gt; Please don&#39;t post (un)subscribe requests to the list. Use the www<br>
&gt;&gt;&gt; interface or send it to <a href="mailto:gmx-developers-request@gromacs.org">gmx-developers-request@gromacs.org</a>.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;<br>
<br>
<br>
<br>
</div></div><div class="im HOEnZb">--<br>
ORNL/UT Center for Molecular Biophysics <a href="http://cmb.ornl.gov" target="_blank">cmb.ornl.gov</a><br>
865-241-1537, ORNL PO BOX 2008 MS6309<br>
</div><div class="HOEnZb"><div class="h5">--<br>
gmx-developers mailing list<br>
<a href="mailto:gmx-developers@gromacs.org">gmx-developers@gromacs.org</a><br>
<a href="http://lists.gromacs.org/mailman/listinfo/gmx-developers" target="_blank">http://lists.gromacs.org/mailman/listinfo/gmx-developers</a><br>
Please don&#39;t post (un)subscribe requests to the list. Use the<br>
www interface or send it to <a href="mailto:gmx-developers-request@gromacs.org">gmx-developers-request@gromacs.org</a>.<br>
</div></div></blockquote></div><br>