Thanks a lot!<br><br><div><span class="gmail_quote">2006/9/14, Cesar Araujo &lt;<a href="mailto:cesar.araujo@oulu.fi">cesar.araujo@oulu.fi</a>&gt;:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<br>&gt; ------------------------------<br>&gt;<br>&gt; Message: 7<br>&gt; Date: Thu, 14 Sep 2006 09:27:45 +0200<br>&gt; From: &quot;Qiao Baofu&quot; &lt;<a href="mailto:qiaobf@gmail.com">qiaobf@gmail.com</a>&gt;<br>&gt; Subject: Re: [gmx-users] Re: Question about parallazing Gromacs (Qiao
<br>&gt; Baofu)<br>&gt; To: &quot;Discussion list for GROMACS users&quot; &lt;<a href="mailto:gmx-users@gromacs.org">gmx-users@gromacs.org</a>&gt;<br>&gt; Message-ID:<br>&gt; &lt;<a href="mailto:6a91f07b0609140027u68ac3085tb01120f19b854545@mail.gmail.com">
6a91f07b0609140027u68ac3085tb01120f19b854545@mail.gmail.com</a>&gt;<br>&gt; Content-Type: text/plain; charset=&quot;iso-8859-1&quot;<br>&gt;<br>&gt; Hi,<br>&gt;<br>&gt; Thanks. I have test different cpus. Our institute has two clusters: one is
<br>&gt; each node has 4 cpu (A), one is one node has only 1 cpu (B).&nbsp;&nbsp; I made<br>&gt; different tests on the two clusters and my local computer using the same<br>&gt; system. See the following result:<br>&gt;<br>&gt; A&nbsp;&nbsp;&nbsp;&nbsp; (For 1 hour)
<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp;# of cpus&nbsp;&nbsp; ;&nbsp;&nbsp;&nbsp;&nbsp;MD steps<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;4&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; finished (200000steps for 26:21)<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;8&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; finished (200000steps for 40:57)<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp; 12&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 87950<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp; 20&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 42749
<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp; 44&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 5962&nbsp;&nbsp; !!!!!<br>&gt; B&nbsp;&nbsp; (For 1 hour)<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp; # of cpu&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ; MD steps<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;156991&nbsp;&nbsp;for 56:12<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;179820<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 3&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;200,000 for 54:20
<br>&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 4&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;200,000 for 51:12<br>&gt; c. Local(single cpu), 200000 steps&nbsp;&nbsp;For 1h52:38<br>&gt;<br>&gt; One can see that<br>&gt; 1. On cluster A, one nodes(4 cpu) is just as 4 times fast as my local<br>&gt; computer.
<br>&gt; 2. More than one nodes will decrease the performancs the gromacs,<br>&gt; 3. On cluster B, the more cpu used, the faster gromacs runs. But the<br>&gt; difference of speed is not apparent.<br>&gt; 4. Cluster B with 4 cpus is slow as half as that Cluster A with 1 node (4
<br>&gt; cpus)<br>&gt;<br>&gt; I wonder if anyone can tell the bottlenack: the hardware on the cluster or<br>&gt; gromacs?<br>&gt;<br>&gt;<br><br>Well, probably it is a combination of bottlenecks in both software and<br>hardware.
<br>Both of them should be optimized to guarantee the best performance. From the<br>hardware side the delays in inter-node communication across the network can<br>be the reason. But also, it can be related with software issues related to
<br>the operating<br>system and network configuration. I think that the first thing to do is work<br>in cluster<br>setup to achieve the best performance for your hardware configuration.<br><br>In addition, take into account that inter-node communication between two
<br>CPU's<br>inside the same machine should be faster than between two CPU's across the<br>network.<br><br>&gt;From the software side (Gromacs) the algorithms should be optimized with<br>regard<br>to the parallel programming model. David said in a previous answer that they
<br>have detected some problems in the software implementation and they are<br>working<br>to solve that issue in the next version of Gromacs.<br><br>Regards,<br>-----------------------------------------------------------<br>
Cesar Araujo, Lic. of Chemistry<br>Department of Molecular Endocrynology<br>Oulu University Hospital<br>FIN-90029 OYS, OULU, FINLAND<br><br>phone: +358 8 3155632<br>e-mail: <a href="mailto:cesar.araujo@oulu.fi">cesar.araujo@oulu.fi
</a><br><br>_______________________________________________<br>gmx-users mailing list&nbsp;&nbsp;&nbsp;&nbsp;<a href="mailto:gmx-users@gromacs.org">gmx-users@gromacs.org</a><br><a href="http://www.gromacs.org/mailman/listinfo/gmx-users">http://www.gromacs.org/mailman/listinfo/gmx-users
</a><br>Please don't post (un)subscribe requests to the list. Use the<br>www interface or send it to <a href="mailto:gmx-users-request@gromacs.org">gmx-users-request@gromacs.org</a>.<br>Can't post? Read <a href="http://www.gromacs.org/mailing_lists/users.php">
http://www.gromacs.org/mailing_lists/users.php</a><br></blockquote></div><br><br clear="all"><br>-- <br>Sincerely yours,<br>**********************************************<br>Baofu Qiao, PhD<br>Frankfurt Institute for Advanced Studies
<br>Max-von-Laue-Str. 1<br>60438 Frankfurt am Main, Germany TEL:+49-69-7984-7529<br>**********************************************