Hi,<div><br></div><div>what is nsteps in the mdp file?</div><div><br></div><div>Did the simulation up to this point really did 3377000 steps?</div><div><br></div><div>Roland<br><br><div class="gmail_quote">2010/3/15 Alexey Shvetsov <span dir="ltr">&lt;<a href="mailto:alexxyum@gmail.com">alexxyum@gmail.com</a>&gt;</span><br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">Hi,<br>
<br>
It crashed with this error.<br>
In md.log i can see<br>
<br>
-----------------------------------------------------------<br>
Restarting from checkpoint, appending to previous log file.<br>
<br>
Log file opened on Sat Mar 13 01:48:10 2010<br>
Host: n1  pid: 5575  nodeid: 0  nnodes:  128<br>
The Gromacs distribution was built Sun Feb 28 02:57:38 MSK 2010 by<br>
root@n1 (Linux 2.6.31-gentoo-r6 x86_64)<br>
<br>
<br>
<br>
Initializing Domain Decomposition on 128 nodes<br>
Dynamic load balancing: auto<br>
Will sort the charge groups at every domain (re)decomposition<br>
Initial maximum inter charge-group distances:<br>
    two-body bonded interactions: 0.430 nm, LJ-14, atoms 6915 6922<br>
  multi-body bonded interactions: 0.430 nm, Ryckaert-Bell., atoms 6915 6922<br>
Minimum cell size due to bonded interactions: 0.473 nm<br>
Maximum distance for 5 constraints, at 120 deg. angles, all-trans: 0.819 nm<br>
Estimated maximum distance required for P-LINCS: 0.819 nm<br>
This distance will limit the DD cell size, you can override this with -rcon<br>
Domain decomposition grid 16 x 7 x 1, separate PME nodes 16<br>
Interleaving PP and PME nodes<br>
This is a particle-particle only node<br>
<br>
Domain decomposition nodeid 0, coordinates 0 0 0<br>
<br>
Using two step summing over 16 groups of on average 7.0 processes<br>
<br>
Table routines are used for coulomb: TRUE<br>
Table routines are used for vdw:     TRUE<br>
Will do PME sum in reciprocal space.<br>
<br>
++++ PLEASE READ AND CITE THE FOLLOWING REFERENCE ++++<br>
U. Essman, L. Perela, M. L. Berkowitz, T. Darden, H. Lee and L. G. Pedersen<br>
A smooth particle mesh Ewald method<br>
J. Chem. Phys. 103 (1995) pp. 8577-8592<br>
-------- -------- --- Thank You --- -------- --------<br>
<br>
Using a Gaussian width (1/beta) of 0.480244 nm for Ewald<br>
Using shifted Lennard-Jones, switch between 1.2 and 1.5 nm<br>
Cut-off&#39;s:   NS: 1.7   Coulomb: 1.5   LJ: 1.5<br>
System total charge: 0.000<br>
Generated table with 5400 data points for Ewald-Switch.<br>
Tabscale = 2000 points/nm<br>
Generated table with 5400 data points for LJ6Switch.<br>
Tabscale = 2000 points/nm<br>
Generated table with 5400 data points for LJ12Switch.<br>
Tabscale = 2000 points/nm<br>
Generated table with 5400 data points for 1-4 COUL.<br>
Tabscale = 2000 points/nm<br>
Generated table with 5400 data points for 1-4 LJ6.<br>
Tabscale = 2000 points/nm<br>
Generated table with 5400 data points for 1-4 LJ12.<br>
Tabscale = 2000 points/nm<br>
<br>
Enabling SPC water optimization for 115416 molecules.<br>
<br>
Configuring nonbonded kernels...<br>
Testing x86_64 SSE2 support... present.<br>
<br>
<br>
<br>
Initializing Parallel LINear Constraint Solver<br>
<br>
++++ PLEASE READ AND CITE THE FOLLOWING REFERENCE ++++<br>
B. Hess<br>
P-LINCS: A Parallel Linear Constraint Solver for molecular simulation<br>
J. Chem. Theory Comput. 4 (2008) pp. 116-122<br>
-------- -------- --- Thank You --- -------- --------<br>
<br>
The number of constraints is 43710<br>
There are inter charge-group constraints,<br>
will communicate selected coordinates each lincs iteration<br>
<br>
++++ PLEASE READ AND CITE THE FOLLOWING REFERENCE ++++<br>
S. Miyamoto and P. A. Kollman<br>
SETTLE: An Analytical Version of the SHAKE and RATTLE Algorithms for Rigid<br>
Water Models<br>
J. Comp. Chem. 13 (1992) pp. 952-962<br>
-------- -------- --- Thank You --- -------- --------<br>
<br>
<br>
Linking all bonded interactions to atoms<br>
There are 237282 inter charge-group exclusions,<br>
will use an extra communication step for exclusion forces for PME-Switch<br>
<br>
The initial number of communication pulses is: X 2 Y 1<br>
The initial domain decomposition cell size is: X 1.18 nm Y 2.54 nm<br>
<br>
The maximum allowed distance for charge groups involved in interactions is:<br>
                 non-bonded interactions           1.700 nm<br>
(the following are initial values, they could change due to box deformation)<br>
            two-body bonded interactions  (-rdd)   1.700 nm<br>
          multi-body bonded interactions  (-rdd)   1.178 nm<br>
  atoms separated by up to 5 constraints  (-rcon)  1.178 nm<br>
<br>
When dynamic load balancing gets turned on, these settings will change to:<br>
The maximum number of communication pulses is: X 2 Y 2<br>
The minimum size for domain decomposition cells is 0.850 nm<br>
The requested allowed shrink of DD cells (option -dds) is: 0.80<br>
The allowed shrink of domain decomposition cells is: X 0.72 Y 0.33<br>
The maximum allowed distance for charge groups involved in interactions is:<br>
                 non-bonded interactions           1.700 nm<br>
            two-body bonded interactions  (-rdd)   1.700 nm<br>
          multi-body bonded interactions  (-rdd)   0.850 nm<br>
  atoms separated by up to 5 constraints  (-rcon)  0.850 nm<br>
<br>
<br>
Making 2D domain decomposition grid 16 x 7 x 1, home cell index 0 0 0<br>
<br>
Center of mass motion removal mode is Linear<br>
We have the following groups for center of mass motion removal:<br>
  0:  rest<br>
There are: 390476 Atoms<br>
Charge group distribution at step 3377000: 1125 1142 1147 1166 1139 1158 1135<br>
1146 1216 1139 1298 1162 1139 1138 1182 1279 1151 1525 1334 1173 1162 1364<br>
1509 1368 1884 1513 1149 1151 1286 1358 1714 2023 1752 1191 1150 1167 1480<br>
2099 2239 2327 1411 1170 1132 1668 2235 1647 2174 1812 1195 1258 1542 1919<br>
1307 1861 1793 1141 1415 1590 1810 1435 2106 1755 1149 1564 1711 2424 2156<br>
2122 1457 1158 1278 1291 1862 2071 1775 1564 1118 1144 1175 1938 2062 1858<br>
1637 1136 1141 1326 1685 1438 1348 1277 1144 1162 1159 1361 1142 1226 1184<br>
1153 1142 1144 1195 1154 1144 1151 1124 1149 1148 1171 1140 1127 1145 1158<br>
Grid: 5 x 7 x 17 cells<br>
Initial temperature: 309.173 K<br>
<br>
Started mdrun on node 0 Sat Mar 13 01:48:12 2010<br>
<br>
        &lt;======  ###############  ==&gt;<br>
        &lt;====  A V E R A G E S  ====&gt;<br>
        &lt;==  ###############  ======&gt;<br>
<br>
   Energies (kJ/mol)<br>
          Angle    Proper Dih. Ryckaert-Bell.          LJ-14     Coulomb-14<br>
    3.11012e+11    1.88259e+10    3.84061e+11    1.60351e+11    1.48403e+12<br>
        LJ (SR)  Disper. corr.   Coulomb (SR)   Coul. recip.      Potential<br>
    2.00208e+12   -3.71589e+10   -1.93169e+13   -2.65842e+12   -1.76521e+13<br>
    Kinetic En.   Total Energy    Temperature Pressure (bar)  Cons. rmsd ()<br>
    3.40082e+12   -1.42513e+13    1.04681e+09    3.09179e+06    0.00000e+00<br>
<br>
          Box-X          Box-Y          Box-Z         Volume   Density (SI)<br>
    6.36496e+07    6.00618e+07    3.96178e+07    1.32807e+10    3.44326e+09<br>
             pV<br>
    7.21862e+08<br>
<br>
   Total Virial (kJ/mol)<br>
    1.13360e+12    1.84057e+08    1.42298e+08<br>
    1.84057e+08    1.13321e+12    1.72446e+08<br>
    1.42298e+08    1.72446e+08    1.13293e+12<br>
<br>
   Pressure (bar)<br>
    1.96772e+06    3.52902e+05   -4.76710e+05<br>
    3.52902e+05    3.34068e+06   -5.56943e+05<br>
   -4.76710e+05   -5.56943e+05    3.96697e+06<br>
<br>
   Total Dipole (Debye)<br>
    2.04296e+09    7.00647e+08    1.82307e+09<br>
<br>
  Epot (kJ/mol)        Coul-SR          LJ-SR        Coul-14          LJ-14<br>
Protein-Protein   -1.05061e+12   -2.88200e+11    1.48403e+12    1.60351e+11<br>
Protein-Non-Protein   -9.55694e+11   -7.40905e+10    0.00000e+00<br>
0.00000e+00<br>
Non-Protein-Non-Protein   -1.73106e+13    2.36437e+12    0.00000e+00<br>
0.00000e+00<br>
<br>
      T-Protein  T-Non-Protein<br>
    1.04653e+09    1.04684e+09<br>
<br>
        &lt;======  ###############################  ==&gt;<br>
        &lt;====  R M S - F L U C T U A T I O N S  ====&gt;<br>
        &lt;==  ###############################  ======&gt;<br>
<br>
   Energies (kJ/mol)<br>
          Angle    Proper Dih. Ryckaert-Bell.          LJ-14     Coulomb-14<br>
    9.01957e+05    1.88394e+05    8.36483e+05    3.32678e+05    1.56961e+06<br>
        LJ (SR)  Disper. corr.   Coulomb (SR)   Coul. recip.      Potential<br>
    4.49504e+06    1.61531e+04    7.36949e+06    4.74527e+05    5.31921e+06<br>
    Kinetic En.   Total Energy    Temperature Pressure (bar)  Cons. rmsd ()<br>
    2.96016e+06    6.07351e+06    9.11168e+02    8.50221e+04    0.00000e+00<br>
<br>
          Box-X          Box-Y          Box-Z         Volume   Density (SI)<br>
    9.22282e+00    8.70294e+00    5.74061e+00    5.77310e+03    1.49680e+03<br>
             pV<br>
    2.01360e+07<br>
<br>
   Total Virial (kJ/mol)<br>
    1.43640e+07    8.71197e+06    8.72558e+06<br>
    8.71197e+06    1.43505e+07    8.72679e+06<br>
    8.72558e+06    8.72679e+06    1.39238e+07<br>
<br>
   Pressure (bar)<br>
    1.22151e+05    7.44143e+04    7.44974e+04<br>
    7.44143e+04    1.22011e+05    7.44967e+04<br>
    7.44974e+04    7.44967e+04    1.18187e+05<br>
<br>
   Total Dipole (Debye)<br>
    6.14300e+06    5.87464e+06    5.12540e+06<br>
<br>
  Epot (kJ/mol)        Coul-SR          LJ-SR        Coul-14          LJ-14<br>
Protein-Protein    7.16780e+06    1.41743e+06    1.56961e+06    3.32678e+05<br>
Protein-Non-Protein    1.08780e+07    9.73569e+05    0.00000e+00<br>
0.00000e+00<br>
Non-Protein-Non-Protein    9.00044e+06    4.32503e+06    0.00000e+00<br>
0.00000e+00<br>
<br>
      T-Protein  T-Non-Protein<br>
    2.66136e+03    9.69716e+02<br>
<br>
<br>
        M E G A - F L O P S   A C C O U N T I N G<br>
<br>
   RF=Reaction-Field  FE=Free Energy  SCFE=Soft-Core/Free Energy<br>
   T=Tabulated        W3=SPC/TIP3p    W4=TIP4p (single or pairs)<br>
   NF=No Forces<br>
<br>
 Computing:                         M-Number         M-Flops  % Flops<br>
-----------------------------------------------------------------------<br>
 CG-CoM                             0.390476           1.171   100.0<br>
-----------------------------------------------------------------------<br>
 Total                                                 1.171   100.0<br>
-----------------------------------------------------------------------<br>
<br>
<br>
    D O M A I N   D E C O M P O S I T I O N   S T A T I S T I C S<br>
<br>
 av. #atoms communicated per step for force:  2 x 1120267.0<br>
 av. #atoms communicated per step for LINCS:  2 x 34671.0<br>
<br>
<br>
     R E A L   C Y C L E   A N D   T I M E   A C C O U N T I N G<br>
<br>
 Computing:         Nodes     Number     G-Cycles    Seconds     %<br>
-----------------------------------------------------------------------<br>
 Rest                 112               34860.808        0.0   100.0<br>
-----------------------------------------------------------------------<br>
 Total                128               34860.808        0.0   100.0<br>
-----------------------------------------------------------------------<br>
<div class="im"><br>
nodetime = 0! Infinite Giga flopses!<br>
        Parallel run - timing based on wallclock.<br>
<br>
</div>Finished mdrun on node 0 Sat Mar 13 01:48:12 2010<br>
<div><div></div><div class="h5"><br>
On Вторник 16 марта 2010 00:58:50 Roland Schulz wrote:<br>
&gt; Alexey,<br>
&gt;<br>
&gt; your not giving enough information.<br>
&gt;<br>
&gt; What exactly is the error? What happens? Does it hang or does it crash with<br>
&gt; an error?<br>
&gt;<br>
&gt; Roland<br>
&gt;<br>
&gt; On Fri, Mar 12, 2010 at 7:01 PM, Alexey Shvetsov &lt;<a href="mailto:alexxyum@gmail.com">alexxyum@gmail.com</a>&gt; wrote:<br>
&gt; &gt; Hi all<br>
&gt; &gt; Seem like there is bug with continuation from checkpoint for gromacs<br>
&gt; &gt; 4.0.7 Steps to reproduce<br>
&gt; &gt; 1. submit parrallel job to pbs<br>
&gt; &gt; 2. kill job<br>
&gt; &gt; 3. try to resume from checkpoint<br>
&gt; &gt;<br>
&gt; &gt; relevant output from mdrun<br>
&gt; &gt; Reading checkpoint file md.cpt generated: Thu Mar 11 12:20:46 2010<br>
&gt; &gt;<br>
&gt; &gt; Loaded with Money<br>
&gt; &gt;<br>
&gt; &gt; Making 2D domain decomposition 16 x 7 x 1<br>
&gt; &gt;<br>
&gt; &gt; WARNING: This run will generate roughly 20607979313638129664 Mb of data<br>
&gt; &gt;<br>
&gt; &gt; starting mdrun &#39;Protein in water&#39;<br>
&gt; &gt; 500000 steps,   1000.0 ps (continuing from step 3377000,   6754.0 ps).<br>
&gt; &gt;<br>
&gt; &gt; nodetime = 0! Infinite Giga flopses!<br>
&gt; &gt;<br>
&gt; &gt;        Parallel run - timing based on wallclock.<br>
&gt; &gt;<br>
&gt; &gt; --<br>
&gt; &gt; Best Regards,<br>
&gt; &gt; Alexey &#39;Alexxy&#39; Shvetsov<br>
&gt; &gt; Petersburg Nuclear Physics Institute, Russia<br>
&gt; &gt; Department of Molecular and Radiation Biophysics<br>
&gt; &gt; Gentoo Team Ru<br>
&gt; &gt; Gentoo Linux Dev<br>
&gt; &gt; mailto:<a href="mailto:alexxyum@gmail.com">alexxyum@gmail.com</a><br>
&gt; &gt; mailto:<a href="mailto:alexxy@gentoo.org">alexxy@gentoo.org</a><br>
&gt; &gt; mailto:<a href="mailto:alexxy@omrb.pnpi.spb.ru">alexxy@omrb.pnpi.spb.ru</a><br>
&gt; &gt;<br>
&gt; &gt; --<br>
&gt; &gt; gmx-developers mailing list<br>
&gt; &gt; <a href="mailto:gmx-developers@gromacs.org">gmx-developers@gromacs.org</a><br>
&gt; &gt; <a href="http://lists.gromacs.org/mailman/listinfo/gmx-developers" target="_blank">http://lists.gromacs.org/mailman/listinfo/gmx-developers</a><br>
&gt; &gt; Please don&#39;t post (un)subscribe requests to the list. Use the<br>
&gt; &gt; www interface or send it to <a href="mailto:gmx-developers-request@gromacs.org">gmx-developers-request@gromacs.org</a>.<br>
<br>
--<br>
Best Regards,<br>
Alexey &#39;Alexxy&#39; Shvetsov<br>
Petersburg Nuclear Physics Institute, Russia<br>
Department of Molecular and Radiation Biophysics<br>
Gentoo Team Ru<br>
Gentoo Linux Dev<br>
mailto:<a href="mailto:alexxyum@gmail.com">alexxyum@gmail.com</a><br>
mailto:<a href="mailto:alexxy@gentoo.org">alexxy@gentoo.org</a><br>
mailto:<a href="mailto:alexxy@omrb.pnpi.spb.ru">alexxy@omrb.pnpi.spb.ru</a><br>
</div></div><br>--<br>
gmx-developers mailing list<br>
<a href="mailto:gmx-developers@gromacs.org">gmx-developers@gromacs.org</a><br>
<a href="http://lists.gromacs.org/mailman/listinfo/gmx-developers" target="_blank">http://lists.gromacs.org/mailman/listinfo/gmx-developers</a><br>
Please don&#39;t post (un)subscribe requests to the list. Use the<br>
www interface or send it to <a href="mailto:gmx-developers-request@gromacs.org">gmx-developers-request@gromacs.org</a>.<br></blockquote></div><br><br clear="all"><br>-- <br>ORNL/UT Center for Molecular Biophysics <a href="http://cmb.ornl.gov">cmb.ornl.gov</a><br>

865-241-1537, ORNL PO BOX 2008 MS6309<br>
</div>