Hi,<br><br>as a follow up to the other tools thread (finding functions):<br><br>Two profiling tools, which may be not so well known, and I think a very useful are:<br><br>mpiP (<a href="http://mpip.sourceforge.net">mpip.sourceforge.net</a>): It measures MPI time per code line (traceback possible). One only needs to compile with -g and link the mpip library. It gives a very quick overview why runtime is different on different clusters.<br>
<br>hpctookit (<a href="http://hpctoolkit.org/">hpctoolkit.org/</a>): It uses sampling to pinpoint the number of spent cycles, caches misses, FLOPs to the code line (also for assembler). By keeping the sampling interval long enough the overhead is neglictable.<br>
<br>In case someone is interested I&#39;m happy to give some more information or examples.&nbsp; <br><br>Can you recommend any other tools besides those and MPE/jumpshot?<br><br>Roland<br clear="all"><br>-- <br>ORNL/UT Center for Molecular Biophysics <a href="http://cmb.ornl.gov">cmb.ornl.gov</a><br>