<br><font size=2 face="sans-serif">Hi,</font>
<br>
<br><font size=2 face="sans-serif">Espresso file format, like most other
ascii formats has a serious problem,</font>
<br><font size=2 face="sans-serif">if you worry about parallel IO: They
are hardly parallelizable.</font>
<br><font size=2 face="sans-serif">Even though IO may not be a problem
today, given time, it will,</font>
<br><font size=2 face="sans-serif">as simulated systems and number of compute
nodes get larger</font>
<br><font size=2 face="sans-serif">and serial CPU power for ASCII formatting
on rank 0 no longer scales.</font>
<br><font size=2 face="sans-serif">I would seriously recommend to consider
John's suggestion and go for HDF5,</font>
<br><font size=2 face="sans-serif">which parallelizes well and offers high
flexibility.</font>
<br><font size=2 face="sans-serif">For those who want the simplicity of
Fortran array IO, I would rather spend</font>
<br><font size=2 face="sans-serif">a bit of extra effort to develop a comfortable
reader tool, that can extract ascii</font>
<br><font size=2 face="sans-serif">readable data for those who don't want
the complexity of having to deal</font>
<br><font size=2 face="sans-serif">with HDF5 directly (although HDF5 comes
with it's own flexible ascii readers</font>
<br><font size=2 face="sans-serif">which might be sufficientfor most tasks).</font>
<br>
<br><tt><font size=2>&gt; Message: 5<br>
&gt; Date: Mon, 31 Mar 2008 13:42:41 -0700<br>
&gt; From: &quot;John Chodera&quot; &lt;jchodera@gmail.com&gt;<br>
&gt; Subject: Re: [gmx-developers] Shall we ditch gro and g96 files?<br>
&gt; To: &quot;Discussion list for GROMACS development&quot;<br>
&gt; &nbsp; &nbsp;&lt;gmx-developers@gromacs.org&gt;<br>
&gt; Message-ID:<br>
&gt; &nbsp; &nbsp;&lt;14cc10610803311342i7f9ed758r8ed8fe95569573da@mail.gmail.com&gt;<br>
&gt; Content-Type: text/plain; charset=ISO-8859-1<br>
&gt; <br>
&gt; Gentlemen,<br>
&gt; <br>
&gt; I know I don't chime in very often here, but I wanted to take this<br>
&gt; opportunity to say that I very much support the idea of replacing
the<br>
&gt; limited-precision text-based formats like .gro, .pdb, and .g96 with<br>
&gt; more flexible, portable, full-precision file formats.<br>
&gt; <br>
&gt; Berk's suggestions of Espresso sounds very reasonable, but I would<br>
&gt; encourage you to instead look at netCDF and HDF5:<br>
&gt; <br>
&gt; netCDF:<br>
&gt; http://www.unidata.ucar.edu/software/netcdf/<br>
&gt; <br>
&gt; HDF5:<br>
&gt; http://hdf.ncsa.uiuc.edu/HDF5/<br>
&gt; <br>
&gt; Both of these formats provide easy-to-use libraries with APIs that<br>
&gt; support nearly every language you could want to use (including C,<br>
&gt; Fortran, and Python). &nbsp;They provide platform-independent, extensible<br>
&gt; formats for storing numerical information. &nbsp;Both provide attribute<br>
&gt; support, and HDF5 even allows hierarchical organization of objects,<br>
&gt; making it very much like XML but with support for multidimensional<br>
&gt; arrays of the same precision as used internally in gromacs. &nbsp;The<br>
&gt; libraries are robust, efficient, and well-supported.<br>
&gt; <br>
&gt; AMBER, for example, has already moved to netCDF for their trajectory<br>
&gt; format, though (unfortunately) not yet for their coordinate/restart<br>
&gt; files.<br>
&gt; <br>
&gt; http://amber.scripps.edu/netcdf/nctraj.html<br>
&gt; <br>
&gt; Cheers,<br>
&gt; <br>
&gt; John<br>
&gt; <br>
&gt; --<br>
&gt; Dr. John D. Chodera &lt;jchodera@gmail.com&gt; &nbsp; &nbsp; &nbsp;|
Mobile &nbsp; &nbsp;: 415.867.7384<br>
&gt; Postdoctoral researcher, Pande lab &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;
&nbsp;| Lab phone : 650.723.1097<br>
&gt; Department of Chemistry, Stanford University &nbsp;| Lab fax &nbsp;
: 650.724.4021<br>
&gt; http://www.dillgroup.ucsf.edu/~jchodera<br>
&gt; <br>
&gt; On 29/03/2008, David van der Spoel &lt;spoel@xray.bmc.uu.se&gt; wrote:<br>
&gt; &gt; Hi,<br>
&gt; &gt;<br>
&gt; &gt; &nbsp;as you are aware all coordinate files have their drawbacks.<br>
&gt; &gt; &nbsp;- gro &amp; pdb have limited space for coordinates which
is problematic for<br>
&gt; &gt; &nbsp;simulating large systems<br>
&gt; &gt; &nbsp;- pdb has no velocities<br>
&gt; &gt; &nbsp;- gro &amp; g96 can not store information on the element
(i.e. can not<br>
&gt; &gt; &nbsp;distinguish between Calpha and Calcium or Hgamma and Mercury,
pdb can do<br>
&gt; &gt; &nbsp;this)<br>
&gt; &gt; &nbsp;- gro stores non-rectanular boxes in an awkward manner<br>
&gt; &gt;<br>
&gt; &gt; &nbsp;I would therefore propose to make better coordinate file
format that has<br>
&gt; &gt; &nbsp;- coordinates<br>
&gt; &gt; &nbsp;- velocities<br>
&gt; &gt; &nbsp;- box as three edges and three angles (as in pdb file)<br>
&gt; &gt; &nbsp;- atom name (and number)<br>
&gt; &gt; &nbsp;- residue name and number<br>
&gt; &gt; &nbsp;- element type (we could also introduce special elements
for united<br>
&gt; &gt; &nbsp;atoms or course grained particles, but they should not
overlap with real<br>
&gt; &gt; &nbsp;elements)<br>
&gt; &gt; &nbsp;- variable format (no fixed column widths)<br>
&gt; &gt;<br>
&gt; &gt; &nbsp;In order to encourage the use of such a more flexible file
format I<br>
&gt; &gt; &nbsp;would then propose that we remove the facility for writing
gro and g96<br>
&gt; &gt; &nbsp;files.<br>
&gt; &gt;<br>
&gt; &gt; &nbsp;Please let me know what you think.<br>
&gt; &gt;<br>
&gt; &gt; &nbsp;--<br>
&gt; &gt; &nbsp;David van der Spoel, Ph.D.<br>
&gt; &gt; &nbsp;Molec. Biophys. group, Dept. of Cell &amp; Molec. Biol.,
Uppsala University.<br>
&gt; &gt; &nbsp;Box 596, 75124 Uppsala, Sweden. Phone: &nbsp;+46184714205.
Fax: +4618511755.<br>
&gt; &gt; &nbsp;spoel@xray.bmc.uu.se &nbsp; &nbsp;spoel@gromacs.org &nbsp;
http://folding.bmc.uu.se<br>
&gt; &gt; &nbsp;_______________________________________________<br>
&gt; &gt; &nbsp;gmx-developers mailing list<br>
&gt; &gt; &nbsp;gmx-developers@gromacs.org<br>
&gt; &gt; &nbsp;http://www.gromacs.org/mailman/listinfo/gmx-developers<br>
&gt; &gt; &nbsp;Please don't post (un)subscribe requests to the list. Use
the<br>
&gt; &gt; &nbsp;www interface or send it to gmx-developers-request@gromacs.org.<br>
&gt; &gt;<br>
&gt; <br>
&gt; <br>
&gt; ------------------------------<br>
&gt; <br>
&gt; _______________________________________________<br>
&gt; gmx-developers mailing list<br>
&gt; gmx-developers@gromacs.org<br>
&gt; http://www.gromacs.org/mailman/listinfo/gmx-developers<br>
&gt; <br>
&gt; <br>
&gt; End of gmx-developers Digest, Vol 48, Issue 1<br>
&gt; *********************************************<br>
</font></tt>
<br><font size=2 face="sans-serif"><br>
Viele Grüsse / Best regards,<br>
Dr. Mathias Pütz<br>
<br>
IT Specialist for Application Performance<br>
<br>
Deep Computing - Strategic Growth Business<br>
IBM Systems &amp; Technology Group<br>
<br>
e-mail: &nbsp;mpuetz@de.ibm.com<br>
mobile: + 49-(0)160-7120602<br>
fax: &nbsp; &nbsp; &nbsp; &nbsp; + 49-(0)6131-84-6660<br>
<br>
Anschrift:<br>
 &nbsp;IBM Deutschland GmbH<br>
 &nbsp;Department B513<br>
 &nbsp;Hechtsheimer Str. 2 / Building 12<br>
 &nbsp;55131 Mainz<br>
 &nbsp;Germany<br>
<br>
IBM Deutschland GmbH<br>
Vorsitzender des Aufsichtsrats: Hans Ulrich Maerki<br>
Geschäftsführung: Martin Jetter (Vorsitzender), Christian Diedrich, Christoph
Grandpierre, Matthias Hartmann, Thomas Fell, Michael Diemer<br>
Sitz der Gesellschaft: Stuttgart<br>
Registergericht: Amtsgericht Stuttgart, HRB 14562 WEEE-Reg.-Nr. DE 99369940</font>
<br>
<br>