Hi all,<br><br>I have a question about parallazing gromacs: I run the same system on a cluster of my institute and my local computer,<br>&nbsp;&nbsp; &nbsp; Cluster:<font size="6"><strong><span style="font-weight: bold;"> </span></strong>
</font>dual processor boards AMD Opteron 270 (Dual-Core), 2.0 GHz<br>&nbsp;&nbsp; &nbsp; Local computer: AMD X86-64 Cpu, double precision<br><br>1. The cluster (nodes=3:ppn=4) runs&nbsp; 87950 MD steps&nbsp; for one hour<br>2. The cluster (nodes=5:ppn=4) runs&nbsp; 42749 MD&nbsp; steps&nbsp; for one hour
<br>3.  The cluster (nodes=11:ppn=4) runs&nbsp; 5962 MD&nbsp; steps&nbsp; for one hour <br>3. My local computer runs&nbsp; 179090 MD steps&nbsp; For 1hour 51 mintues.<br><br>It is verry strange that the more cpus I use, the slowest the gromacs runs.!! 
<br><br>Who knows what's wrong with my job?&nbsp;&nbsp; And for paralleled gromacs, how many cpus is prefered?<br><br><br><br>The grompp command is: &nbsp; grompp -np 12 -o md3.mdp -c md3in.gro -p MCl.top -o md3.tpr<br><br>The following is one of the the job scripts on the cluster:
<br><br>#<br># MD NTP(Berendsen&amp;Berendsen, T=425&amp;P=1bar),200ps tau_p=4<br>#<br>#<br>#!/bin/bash<br>#PBS -N &quot;md3&quot;<br>#<br>#PBS -l walltime=01:00:00,nodes=3:ppn=4<br>#<br>#PBS -m abe<br>#<br>#PBS -o md3.out
<br>#<br>#PBS -e md3.err<br>#<br>#<br>cd /work/fias/qiao/time_checking/nodes3/<br>/usr/local/Cluster-Apps/lam/gcc/64/7.1.1/bin/lamboot $PBS_NODEFILE<br>/usr/local/Cluster-Apps/lam/gcc/64/7.1.1/bin/mpirun -np 12 mdrun -v -s 
md3.tpr -x md3 -e md3 -c md3 -g md3<br>exit 0<br><br>&nbsp; <br>-- <br>Sincerely yours,<br>**********************************************<br>Baofu Qiao, PhD<br>Frankfurt Institute for Advanced Studies<br>**********************************************