<head><!-- BaNnErBlUrFlE-HeAdEr-start -->
<style>
  #pfptBanner6a3gt5k { all: revert !important; display: block !important; 
    visibility: visible !important; opacity: 1 !important; 
    background-color: #CFD3D7 !important; 
    max-width: none !important; max-height: none !important }
  .pfptPrimaryButton6a3gt5k:hover, .pfptPrimaryButton6a3gt5k:focus {
    background-color: #adb0b4 !important; }
  .pfptPrimaryButton6a3gt5k:active {
    background-color: #8c8e91 !important; }
</style>

<!-- BaNnErBlUrFlE-HeAdEr-end -->
</head><!-- BaNnErBlUrFlE-BoDy-start -->
<!-- Preheader Text : BEGIN -->
<div style="display:none !important;display:none;visibility:hidden;mso-hide:all;font-size:1px;color:#ffffff;line-height:1px;height:0px;max-height:0px;opacity:0;overflow:hidden;">
Hi, sorry for the late reply, I was busy w/ end of FY purchases. Attached are 2 files: cpu_arch. list - the CPU info for each compute node. err. log - sorted result of a egrep 'setaff|compute' on the job log files, each log file lists</div>
<!-- Preheader Text : END -->

<!-- Email Banner : BEGIN -->
<div style="display:none !important;display:none;visibility:hidden;mso-hide:all;font-size:1px;color:#ffffff;line-height:1px;height:0px;max-height:0px;opacity:0;overflow:hidden;">ZjQcmQRYFpfptBannerStart</div>

<!--[if ((ie)|(mso))]>
  <table border="0" cellspacing="0" cellpadding="0" width="100%" style="padding: 16px 0px 16px 0px; direction: ltr" lang="en"><tr><td>
    <table border="0" cellspacing="0" cellpadding="0" style="padding: 0px 10px 5px 6px; width: 100%; border-radius:4px; border-top:4px solid #8c8e91;background-color:#CFD3D7;"><tr><td valign="top">
      <table align="left" border="0" cellspacing="0" cellpadding="0" style="padding: 4px 8px 4px 8px">
        <tr><td style="color:#000000; font-family: 'Arial', sans-serif; font-weight:bold; font-size:14px; direction: ltr">
          This Message Is From an External Sender
        </td></tr>
        <tr><td style="color:#000000; font-weight:normal; font-family: 'Arial', sans-serif; font-size:12px; direction: ltr">
          This message came from outside your organization.
        </td></tr>

      </table>
      <![if ie]><br clear="all"><![endif]>
      <table align="right" border="0" cellspacing="0" cellpadding="0" style="padding: 4px 0px 4px 0px"><tr>
        <td style="direction: ltr">  <a target="_blank" href="https://us-phishalarm-ewt.proofpoint.com/EWT/v1/KGKeukY!vYQd06kpI8bsxtGdsGXKXwfdE3v8QY6FHEX929KbptWbdIpKVso6J5PaQIKNQwMII89WIq4rL7_n-yYabIPfoDHKD6CovwTkIxD-VHfjTXl-dm2DZO9QS9J1-W6giM5shQ85ag$" style="mso-padding-alt: 7.5px; padding: 7.5px; border-radius: 2px; border: 1.5px solid #666666; "><strong style="font-weight: normal; color: #000000; text-decoration: none; font-family: 'Arial', sans-serif; font-size:14px; line-height: 40px; ">  Report Suspicious  </strong></a>  ‌ </td>
      </tr></table>
    </td></tr></table>
  </td></tr></table>
<![endif]-->

<![if !((ie)|(mso))]>
  <div dir="ltr" lang="en" id="pfptBanner6a3gt5k" style="all: revert !important; display:block !important; text-align: left !important; margin:16px 0px 16px 0px !important; padding:8px 16px 8px 16px !important; border-radius: 4px !important; min-width: 200px !important; background-color: #CFD3D7 !important; background-color: #CFD3D7; border-top: 4px solid #8c8e91 !important; border-top: 4px solid #8c8e91;">
    <div id="pfptBanner6a3gt5k" style="all: unset !important; float:left !important; display:block !important; margin: 0px 0px 1px 0px !important; max-width: 600px !important;">
      <div id="pfptBanner6a3gt5k" style="all: unset !important; display:block !important; visibility: visible !important; background-color: #CFD3D7 !important; color:#000000 !important; color:#000000; font-family: 'Arial', sans-serif !important; font-family: 'Arial', sans-serif; font-weight:bold !important; font-weight:bold; font-size:14px !important; line-height:18px !important; line-height:18px">
        This Message Is From an External Sender
      </div>
      <div id="pfptBanner6a3gt5k" style="all: unset !important; display:block !important; visibility: visible !important; background-color: #CFD3D7 !important; color:#000000 !important; color:#000000; font-weight:normal; font-family: 'Arial', sans-serif !important; font-family: 'Arial', sans-serif; font-size:12px !important; line-height:18px !important; line-height:18px; margin-top:2px !important;">
This message came from outside your organization.
      </div>

    </div>
    <div id="pfptBanner6a3gt5k" style="all: unset !important; float: right !important; display: block !important; display: block; margin: 0px 0px 0px 16px !important; text-align: right !important; width: fit-content !important;">
<a id="pfptBanner6a3gt5k" href="https://us-phishalarm-ewt.proofpoint.com/EWT/v1/KGKeukY!vYQd06kpI8bsxtGdsGXKXwfdE3v8QY6FHEX929KbptWbdIpKVso6J5PaQIKNQwMII89WIq4rL7_n-yYabIPfoDHKD6CovwTkIxD-VHfjTXl-dm2DZO9QS9J1-W6giM5shQ85ag$"
    style="all: unset !important; display: inline-block !important; text-decoration: none">
    <div class="pfptPrimaryButton6a3gt5k" style="display: inline-block !important; display: inline-block; visibility: visible !important; opacity: 1 !important; color: #000000 !important; color: #000000; font-family: 'Arial', sans-serif !important; font-family: 'Arial', sans-serif; font-size: 14px !important; font-weight: normal !important; text-decoration: none !important; border-radius: 2px !important; padding: 7.5px 16px !important; margin: 3px 0 3px 16px !important; white-space: nowrap !important; width: fit-content !important;
        border: 1px solid #666666">
        Report Suspicious
    </div>
</a>
    </div>
    <div style="clear: both !important; display: block !important; visibility: hidden !important; line-height: 0 !important; font-size: 0.01px !important; height: 0px"> </div>
  </div>
<![endif]>

<div style="display:none !important;display:none;visibility:hidden;mso-hide:all;font-size:1px;color:#ffffff;line-height:1px;height:0px;max-height:0px;opacity:0;overflow:hidden;">ZjQcmQRYFpfptBannerEnd</div>
<!-- Email Banner : END -->

<!-- BaNnErBlUrFlE-BoDy-end -->
<div dir="ltr"><div class="gmail_default" style="font-size:small;color:#351c75">Hi,</div><div class="gmail_default" style="font-size:small;color:#351c75"><br></div><div class="gmail_default" style="font-size:small;color:#351c75"> sorry for the late reply, I was busy w/ end of FY purchases. </div><div class="gmail_default" style="font-size:small;color:#351c75">Attached are 2 files:</div><div class="gmail_default" style="font-size:small;color:#351c75">  cpu_arch.list - the CPU info for each compute node.</div><div class="gmail_default" style="font-size:small;color:#351c75">  err.log - sorted result of a egrep 'setaff|compute' on the job log files, each log file lists which nodes are in the MPI machine file. Failed cases are below successful ones.<br></div><div class="gmail_default" style="font-size:small;color:#351c75"><br></div><div class="gmail_default" style="font-size:small;color:#351c75">Our compute nodes naming convention is compute-NN-MM where NN refer to the Dell model number, hence all nodes w/ same NN have the same CPU.</div><div class="gmail_default" style="font-size:small;color:#351c75">The number of processors requested is on purpose more that the number available on a single node to make sure it runs on more than one.</div><div class="gmail_default" style="font-size:small;color:#351c75">I do not see any pattern, maybe you do. Let me know if you need more/different info.</div><div><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div dir="ltr"><div dir="ltr"><font size="2"><span style="color:rgb(53,28,117)"><br></span></font></div><div dir="ltr"><font size="2"><span style="color:rgb(53,28,117)">  </span></font><span style="color:rgb(53,28,117)">  Cheers,</span><font size="2"><span style="color:rgb(53,28,117)"><br>      Sylvain<br>--<br></span><font size="2"><br></font></font></div></div></div></div></div></div></div></div></div></div></div><br></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Tue, Sep 17, 2024 at 10:05 AM Shineman, Nat <<a href="mailto:shineman.5@osu.edu">shineman.5@osu.edu</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div class="msg4927943144107371431">




<div dir="ltr">
<div style="font-family:Aptos,Aptos_EmbeddedFont,Aptos_MSFontService,Calibri,Helvetica,sans-serif;font-size:12pt;color:rgb(0,0,0)">
Hi Sylvain,</div>
<div style="font-family:Aptos,Aptos_EmbeddedFont,Aptos_MSFontService,Calibri,Helvetica,sans-serif;font-size:12pt;color:rgb(0,0,0)">
<br>
</div>
<div style="font-family:Aptos,Aptos_EmbeddedFont,Aptos_MSFontService,Calibri,Helvetica,sans-serif;font-size:12pt;color:rgb(0,0,0)">
Typically, this is caused by a non-standard CPU situation on your node. Are all tests being run on the same node or is there a pattern on the nodes that see failure? Can you send us the info from
<code>lscpu </code><code style="font-family:Aptos,Aptos_EmbeddedFont,Aptos_MSFontService,Calibri,Helvetica,sans-serif">on the failing run?</code></div>
<div style="font-family:Aptos,Aptos_EmbeddedFont,Aptos_MSFontService,Calibri,Helvetica,sans-serif;font-size:12pt;color:rgb(0,0,0)">
<br>
</div>
<div style="font-family:Aptos,Aptos_EmbeddedFont,Aptos_MSFontService,Calibri,Helvetica,sans-serif;font-size:12pt;color:rgb(0,0,0)">
Thanks,</div>
<div style="font-family:Aptos,Aptos_EmbeddedFont,Aptos_MSFontService,Calibri,Helvetica,sans-serif;font-size:12pt;color:rgb(0,0,0)">
Nat</div>
<div id="m_4927943144107371431appendonsend"></div>
<hr style="display:inline-block;width:98%">
<div id="m_4927943144107371431divRplyFwdMsg" dir="ltr"><font face="Calibri, sans-serif" style="font-size:11pt" color="#000000"><b>From:</b> Mvapich-discuss <<a href="mailto:mvapich-discuss-bounces@lists.osu.edu" target="_blank">mvapich-discuss-bounces@lists.osu.edu</a>> on behalf of Korzennik, Sylvain via Mvapich-discuss <<a href="mailto:mvapich-discuss@lists.osu.edu" target="_blank">mvapich-discuss@lists.osu.edu</a>><br>
<b>Sent:</b> Sunday, September 8, 2024 13:17<br>
<b>To:</b> Panda, Dhabaleswar <<a href="mailto:panda@cse.ohio-state.edu" target="_blank">panda@cse.ohio-state.edu</a>><br>
<b>Cc:</b> Announcement about MVAPICH2 (MPI over InfiniBand, RoCE, Omni-Path, iWARP and EFA) Libraries developed at NBCL/OSU <<a href="mailto:mvapich-discuss@lists.osu.edu" target="_blank">mvapich-discuss@lists.osu.edu</a>><br>
<b>Subject:</b> [Mvapich-discuss] Error parsing CPU mapping string/Invalid error code (-1) (error ring index 127 invalid)</font>
<div> </div>
</div>

<div>
<div style="font-size:1px;color:rgb(255,255,255);line-height:1px;height:0px;max-height:0px;opacity:0;overflow:hidden;display:none">
While testing mvapich-3. 0 built with newest compilers (gcc 14. 2. 0, intel 2024. [12] and nvidia 24. [57]) I'm encountering the following error, when running a trivial set of tests (a hello world or a ring passing, in C or F90): Error parsing</div>
<div style="font-size:1px;color:rgb(255,255,255);line-height:1px;height:0px;max-height:0px;opacity:0;overflow:hidden;display:none">
</div>
<div dir="ltr">
<div dir="ltr">
<div style="font-size:small;color:rgb(53,28,117)">While testing mvapich-3.0 built with newest compilers (gcc 14.2.0, intel 2024.[12] and nvidia 24.[57]) I'm encountering the following error, when running a trivial set of tests (a hello
 world or a ring passing, in C or F90):</div>
<div style="font-size:small;color:rgb(53,28,117)"><br>
</div>
<div style="font-size:small"><font face="monospace" color="#0000ff">Error parsing CPU mapping string</font></div>
<font face="monospace" color="#0000ff"><span style="font-size:small;color:rgb(53,28,117)"></span>Invalid error code (-1) (error ring index 127 invalid)<br>
INTERNAL ERROR: invalid error code ffffffff (Ring Index out of range) in smpi_setaffinity:2791<br>
Abort(2141583) on node 0 (rank 0 in comm 0): Fatal error in PMPI_Init: Other MPI error, error stack:<br>
MPIR_Init_thread(175)...........:<br>
MPID_Init(597)..................:<br>
MPIDI_MVP_mpi_init_hook(268)....:<br>
MPIDI_MVP_CH4_set_affinity(3746):<br>
smpi_setaffinity(2791)..........: Error parsing CPU mapping string</font><br>
<div>
<div dir="ltr">
<div dir="ltr">
<div>
<div dir="ltr">
<div>
<div dir="ltr">
<div>
<div dir="ltr">
<div dir="ltr">
<div dir="ltr"><font size="2"><span style="color:rgb(53,28,117)"><br>
</span></font></div>
<div><font size="2"><span style="color:rgb(53,28,117)"><span style="font-size:small;color:rgb(53,28,117)">This error creeps up somewhat randomly, the same job+compiler combo will work most of the time, but not all  the time. </span></span></font></div>
<div><font size="2"><span style="color:rgb(53,28,117)"><span style="font-size:small;color:rgb(53,28,117)">Any suggestions on how to track this down?</span><br>
</span></font></div>
<div><font size="2"><span style="color:rgb(53,28,117)"><span style="font-size:small;color:rgb(53,28,117)"><br>
</span></span></font></div>
<div dir="ltr"><font size="2"><span style="color:rgb(53,28,117)">  </span></font><span style="color:rgb(53,28,117)"> 
<span style="font-size:small;color:rgb(53,28,117)">Thx, c</span>heers,</span><font size="2"><span style="color:rgb(53,28,117)"><br>
      Sylvain<br>
--</span></font></div>
<div dir="ltr"><font size="2"><span style="color:rgb(53,28,117)"><br>
</span></font></div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>

</div></blockquote></div>