Hi David,<br><br>Yeah, wouldn't we all want to be able to take arbitrary pdb files, run them through a black box, fixing missing atoms, residues, deviations from naming conventions, etc, etc. But, to cope with reality rather than ideality, you can try to run the structure after (4) through pdb2gmx using the option -ignh. If you then still have long bond warnings, this either means that your structure misses stretches of residues or that seperate chains are being connected. The latter you can deal with by assigning chain identifiers, though introducing TER statements should also work. You can find more practical notes on using Gromacs with DNA/RNA in the Gromacs user list archive.
<br><br>Good luck,<br><br>Tsjerk<br><br><div><span class="gmail_quote">On 2/1/06, <b class="gmail_sendername">David Mathog</b> &lt;<a href="mailto:mathog@caltech.edu">mathog@caltech.edu</a>&gt; wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Short version:<br><br>I want to be able to feed an arbitrary pdb file through<br>some program such that pdb2gmx will accept the result.<br>What is &quot;some program&quot;???<br><br>Long version:<br><br>I'm having trouble getting a structure with DNA and protein
<br>through pdb2gmx.&nbsp;&nbsp;Initially this began with warnings about &quot;atom O2* is<br>missing&quot;.&nbsp;&nbsp;Attempts to fix that broke the protein part.&nbsp;&nbsp;The PDB spec<br>says that columns 18-20 are the residue name.&nbsp;&nbsp;The topology file
<br>says to use ADE for the RNA form and DADE for the DNA (etc.)&nbsp;&nbsp;DADE<br>won't fit in 3 characters so presumably pdb2gmx accepts some other<br>broader syntax for a &quot;PDB&quot; file.<br><br>0.&nbsp;&nbsp;pdb2gmx doesn't know what C,G,T,A sre.
<br><br>1.&nbsp;&nbsp;Try the RNA forms (A-&gt;ADE etc) in cols 18-20, see if it<br>autodetects DNA.&nbsp;&nbsp;Nope, O2* messages.<br><br>2.&nbsp;&nbsp;Add a D in col 17.&nbsp;&nbsp;Result same as 1.<br><br>3. Leave a space in column 17 and put DADE in 18-21.&nbsp;&nbsp;This
<br>A: breaks the PDB file format<br>B: eliminated the O2* warnings<br>C: left the H4 and H6 warnings (Xray structure, so of course<br>&nbsp;&nbsp;no hydrogens)<br>D: emitted a ton of &quot;Warning: Long Bond&quot; message for many, many
<br>pairs of atoms in the nucleic acid part of the file.<br><br>4.&nbsp;&nbsp;Ran the pdb file through pdb2pqr web server.&nbsp;&nbsp;Then<br>changed A-&gt;ADE,etc, ran that through pdb2gmx, and this time<br>no warnings or errors (in the nucleic acid part).
<br><br>5.&nbsp;&nbsp;Took the pdb file from 4 and changed ADE-&gt;DADE (breaking PDB<br>format).&nbsp;&nbsp;This worked the same as 4.<br><br>Then I realized pdb2gmx was just blowing up in 4,5 because<br>pdb2pqr was introducing an HA on the first LYS, so it wasn't
<br>even getting to the nucleic acid parts, which pdb2pqr moved to<br>the end of the file (they were at the front before.)<br><br>6. Found &quot;protonate&quot;.&nbsp;&nbsp;Tried running the PDB file from (3) through<br>it with:<br>
<br> protonate -s dpeptide1<br><br>which blew up when 0 (system) was selected with:<br>Fatal error:<br><br>Atom -C not found in residue LYS39 while adding hydrogens<br><br>--------------------------------------------------------
<br><br>At which point I gave up and wrote this note.<br><br>Thanks,<br><br>David Mathog<br><a href="mailto:mathog@caltech.edu">mathog@caltech.edu</a><br>Manager, Sequence Analysis Facility, Biology Division, Caltech<br>_______________________________________________
<br>gmx-users mailing list&nbsp;&nbsp;&nbsp;&nbsp;<a href="mailto:gmx-users@gromacs.org">gmx-users@gromacs.org</a><br><a href="http://www.gromacs.org/mailman/listinfo/gmx-users">http://www.gromacs.org/mailman/listinfo/gmx-users</a><br>Please don't post (un)subscribe requests to the list. Use the
<br>www interface or send it to <a href="mailto:gmx-users-request@gromacs.org">gmx-users-request@gromacs.org</a>.<br>Can't post? Read <a href="http://www.gromacs.org/mailing_lists/users.php">http://www.gromacs.org/mailing_lists/users.php
</a><br></blockquote></div><br><br clear="all"><br>-- <br><br>Tsjerk A. Wassenaar, M.Sc.<br>Groningen Biomolecular Sciences and Biotechnology Institute (GBB)<br>Dept. of Biophysical Chemistry<br>University of Groningen<br>
Nijenborgh 4<br>9747AG Groningen, The Netherlands<br>+31 50 363 4336<br>