Hi ALL,<br><br>I am trying to simulate a membrane protein system using CHARMM36 FF on GROAMCS4.5.5 on a parallel cluster running on MPI. The system consists of arounf 1,17,000 atoms. The job runs fine on 5 nodes (5X12=120 cores) using mpirun and gives proper output. But whenever I try to submit it on more than 5 nodes, the job gets killed with the following error:<br>
<br>-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------<br>
<br>starting mdrun &#39;Protein&#39;<br>50000000 steps, 100000.0 ps.<br><br>NOTE: Turning on dynamic load balancing<br><br>Fatal error in MPI_Sendrecv: Other MPI error<br>Fatal error in MPI_Sendrecv: Other MPI error<br>Fatal error in MPI_Sendrecv: Other MPI error<br>
<br>=====================================================================================<br>=   BAD TERMINATION OF ONE OF YOUR APPLICATION PROCESSES<br>=   EXIT CODE: 256<br>=   CLEANING UP REMAINING PROCESSES<br>=   YOU CAN IGNORE THE BELOW CLEANUP MESSAGES<br>
=====================================================================================<br>[proxy:0:0@cn034] HYD_pmcd_pmip_control_cmd_cb (./pm/pmiserv/pmip_cb.c:906): assert (!closed) failed<br>[proxy:0:0@cn034] HYDT_dmxu_poll_wait_for_event (./tools/demux/demux_poll.c:77): callback returned error status<br>
[proxy:0:0@cn034] main (./pm/pmiserv/pmip.c:214): demux engine error waiting for event<br>.<br>.<br>.<br>------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------<br>
<br>Why is this happening? Is it related to DD and PME? How to solve it? Any suggestion is welcome.<br><br><br>Thanks and regards,<br><br>Anirban<br>