<head><!-- BaNnErBlUrFlE-HeAdEr-start -->
<style>
  #pfptBannerb9jsf7y { all: revert !important; display: block !important; 
    visibility: visible !important; opacity: 1 !important; 
    background-color: #CFD3D7 !important; 
    max-width: none !important; max-height: none !important }
  .pfptPrimaryButtonb9jsf7y:hover, .pfptPrimaryButtonb9jsf7y:focus {
    background-color: #adb0b4 !important; }
  .pfptPrimaryButtonb9jsf7y:active {
    background-color: #8c8e91 !important; }
</style>

<!-- BaNnErBlUrFlE-HeAdEr-end -->
</head><!-- BaNnErBlUrFlE-BoDy-start -->
<!-- Preheader Text : BEGIN -->
<div style="display:none !important;display:none;visibility:hidden;mso-hide:all;font-size:1px;color:#ffffff;line-height:1px;height:0px;max-height:0px;opacity:0;overflow:hidden;">
 Hi, I´m having the same problems with MVAPICH2 2. 3. 7. I compiled this version as follows: --prefix=$HOME/gsotodos/bin_noref/mvapich2/ --enable-threads=multiple --enable-romio --with-device=ch3: psm --with-libfabric=/opt/libfabric --with-psm2=/opt/psm2/usrPlease,
</div>
<!-- Preheader Text : END -->

<!-- Email Banner : BEGIN -->
<div style="display:none !important;display:none;visibility:hidden;mso-hide:all;font-size:1px;color:#ffffff;line-height:1px;height:0px;max-height:0px;opacity:0;overflow:hidden;">ZjQcmQRYFpfptBannerStart</div>

<!--[if ((ie)|(mso))]>
  <table border="0" cellspacing="0" cellpadding="0" width="100%" style="padding: 16px 0px 16px 0px; direction: ltr" lang="en"><tr><td>
    <table border="0" cellspacing="0" cellpadding="0" style="padding: 0px 10px 5px 6px; width: 100%; border-radius:4px; border-top:4px solid #8c8e91;background-color:#CFD3D7;"><tr><td valign="top">
      <table align="left" border="0" cellspacing="0" cellpadding="0" style="padding: 4px 8px 4px 8px">
        <tr><td style="color:#000000; font-family: 'Arial', sans-serif; font-weight:bold; font-size:14px; direction: ltr">
          This Message Is From an External Sender
        </td></tr>
        <tr><td style="color:#000000; font-weight:normal; font-family: 'Arial', sans-serif; font-size:12px; direction: ltr">
          This message came from outside your organization.
        </td></tr>

      </table>
      <![if ie]><br clear="all"><![endif]>
      <table align="right" border="0" cellspacing="0" cellpadding="0" style="padding: 4px 0px 4px 0px"><tr>
        <td style="direction: ltr">  <a target="_blank" href="https://us-phishalarm-ewt.proofpoint.com/EWT/v1/KGKeukY!vYQd06pBw4oBRfe5kQVseaQH0r5r7Z3N0cj88R4EuDHAI71Zrh6jiUjlvhrAmJURv8QulX99r7f8uvX-bJW4Xae4HM7Ve5N6t72h19EGgNOKbylBkVMDXVbEeFHpc5J3CWxdfw$" style="mso-padding-alt: 7.5px; padding: 7.5px; border-radius: 2px; border: 1.5px solid #666666; "><strong style="font-weight: normal; color: #000000; text-decoration: none; font-family: 'Arial', sans-serif; font-size:14px; line-height: 40px; ">  Report Suspicious  </strong></a>  ‌ </td>
      </tr></table>
    </td></tr></table>
  </td></tr></table>
<![endif]-->

<![if !((ie)|(mso))]>
  <div dir="ltr" lang="en" id="pfptBannerb9jsf7y" style="all: revert !important; display:block !important; text-align: left !important; margin:16px 0px 16px 0px !important; padding:8px 16px 8px 16px !important; border-radius: 4px !important; min-width: 200px !important; background-color: #CFD3D7 !important; background-color: #CFD3D7; border-top: 4px solid #8c8e91 !important; border-top: 4px solid #8c8e91;">
    <div id="pfptBannerb9jsf7y" style="all: unset !important; float:left !important; display:block !important; margin: 0px 0px 1px 0px !important; max-width: 600px !important;">
      <div id="pfptBannerb9jsf7y" style="all: unset !important; display:block !important; visibility: visible !important; background-color: #CFD3D7 !important; color:#000000 !important; color:#000000; font-family: 'Arial', sans-serif !important; font-family: 'Arial', sans-serif; font-weight:bold !important; font-weight:bold; font-size:14px !important; line-height:18px !important; line-height:18px">
        This Message Is From an External Sender
      </div>
      <div id="pfptBannerb9jsf7y" style="all: unset !important; display:block !important; visibility: visible !important; background-color: #CFD3D7 !important; color:#000000 !important; color:#000000; font-weight:normal; font-family: 'Arial', sans-serif !important; font-family: 'Arial', sans-serif; font-size:12px !important; line-height:18px !important; line-height:18px; margin-top:2px !important;">
This message came from outside your organization.
      </div>

    </div>
    <div id="pfptBannerb9jsf7y" style="all: unset !important; float: right !important; display: block !important; display: block; margin: 0px 0px 0px 16px !important; text-align: right !important; width: fit-content !important;">
<a id="pfptBannerb9jsf7y" href="https://us-phishalarm-ewt.proofpoint.com/EWT/v1/KGKeukY!vYQd06pBw4oBRfe5kQVseaQH0r5r7Z3N0cj88R4EuDHAI71Zrh6jiUjlvhrAmJURv8QulX99r7f8uvX-bJW4Xae4HM7Ve5N6t72h19EGgNOKbylBkVMDXVbEeFHpc5J3CWxdfw$"
    style="all: unset !important; display: inline-block !important; text-decoration: none">
    <div class="pfptPrimaryButtonb9jsf7y" style="display: inline-block !important; display: inline-block; visibility: visible !important; opacity: 1 !important; color: #000000 !important; color: #000000; font-family: 'Arial', sans-serif !important; font-family: 'Arial', sans-serif; font-size: 14px !important; font-weight: normal !important; text-decoration: none !important; border-radius: 2px !important; padding: 7.5px 16px !important; margin: 3px 0 3px 16px !important; white-space: nowrap !important; width: fit-content !important;
        border: 1px solid #666666">
        Report Suspicious
    </div>
</a>
    </div>
    <div style="clear: both !important; display: block !important; visibility: hidden !important; line-height: 0 !important; font-size: 0.01px !important; height: 0px"> </div>
  </div>
<![endif]>

<div style="display:none !important;display:none;visibility:hidden;mso-hide:all;font-size:1px;color:#ffffff;line-height:1px;height:0px;max-height:0px;opacity:0;overflow:hidden;">ZjQcmQRYFpfptBannerEnd</div>
<!-- Email Banner : END -->

<!-- BaNnErBlUrFlE-BoDy-end -->
<div dir="ltr">Hi,<div><br></div><div>I´m having the same problems with MVAPICH2 2.3.7. I compiled this version as follows:</div><div><br></div><div>--prefix=$HOME/gsotodos/bin_noref/mvapich2/ --enable-threads=multiple --enable-romio --with-device=ch3:psm --with-libfabric=/opt/libfabric --with-psm2=/opt/psm2/usr<br></div><div><br></div><div>Please, let me know if I can help you in any way.</div><div><br></div><div>Regards,</div><div>Gabriel.</div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">El jue, 13 jun 2024 a las 19:06, Al Attar, Kinan via Mvapich-discuss (<<a href="mailto:mvapich-discuss@lists.osu.edu">mvapich-discuss@lists.osu.edu</a>>) escribió:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div class="msg-8537157238139265157">





<div lang="EN-US" style="overflow-wrap: break-word;">
<div class="m_-8537157238139265157WordSection1">
<div id="m_-8537157238139265157mail-editor-reference-message-container">
<div>
<div>
<p class="MsoNormal"><span style="font-size:11pt">Hi Gabriel,<br>
<br>
Can you please try running MPI4Spark with MVAPICH2 2.3.7? Please let us know if this version is working for you or not. Thanks.<br>
<br>
Regards,<br>
Kinan</span><span style="color:rgb(29,29,29);background:white"><br>
<br>
</span><u></u><u></u></p>
<div id="m_-8537157238139265157mail-editor-reference-message-container">
<div>
<div style="border-right:none;border-bottom:none;border-left:none;border-top:1pt solid rgb(181,196,223);padding:3pt 0in 0in">
<p class="MsoNormal" style="margin-bottom:12pt"><b><span style="font-size:12pt;color:black">From:
</span></b><span style="font-size:12pt;color:black">Mvapich-discuss <mvapich-discuss-bounces+shafi.16=<a href="mailto:osu.edu@lists.osu.edu" target="_blank">osu.edu@lists.osu.edu</a>> on behalf of GABRIEL SOTODOSOS MORALES via Mvapich-discuss <<a href="mailto:mvapich-discuss@lists.osu.edu" target="_blank">mvapich-discuss@lists.osu.edu</a>><br>
<b>Date: </b>Thursday, June 13, 2024 at 3:54</span><span style="font-size:12pt;font-family:Arial,sans-serif;color:black"> </span><span style="font-size:12pt;color:black">AM<br>
<b>To: </b>Paniraja Guptha, Akshay <<a href="mailto:panirajaguptha.1@osu.edu" target="_blank">panirajaguptha.1@osu.edu</a>><br>
<b>Cc: </b>Announcement about MVAPICH (MPI over InfiniBand, RoCE, Omni-Path, Slingshot, iWARP and EFA) Libraries developed at NBCL/OSU <<a href="mailto:mvapich-discuss@lists.osu.edu" target="_blank">mvapich-discuss@lists.osu.edu</a>><br>
<b>Subject: </b>Re: [Mvapich-discuss] Problems trying to run SparkPi example with MPI4Spark</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:1pt;color:white">Hi Akshay, Thank you so much for your help. I am testing new things with your library. If I can help you in any way, please let me know. I tried to start the spark cluster with the traditional script
 (.</span><span style="font-size:1pt;font-family:Arial,sans-serif;color:white"> </span><span style="font-size:1pt;color:white">/sbin/start-all.</span><span style="font-size:1pt;font-family:Arial,sans-serif;color:white"> </span><span style="font-size:1pt;color:white">sh)
 with the same result, </span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:1pt;color:white"></span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">Hi Akshay,</span><u></u><u></u></p>
<div>
<p class="MsoNormal"><span style="font-size:12pt"> </span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">Thank you so much for your help. I am testing new things with your library. If I can help you in any way, please let me know.</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt"> </span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">I tried to start the spark cluster with the traditional script (./sbin/start-all.sh) with the same result, for any reason no workers seem to be available.</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt"> </span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">On the other hand, I have downloaded the tarball you have available on the website, would you have a public repository where the source code is?</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt"> </span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">Thanks again for your help. Best regards.</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">Gabriel.</span><u></u><u></u></p>
</div>
</div>
<p class="MsoNormal"><span style="font-size:12pt"> </span><u></u><u></u></p>
<div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">El mié, 12 jun 2024 a las 18:42, Paniraja Guptha, Akshay (<</span><a href="mailto:panirajaguptha.1@osu.edu" target="_blank"><span style="font-size:12pt">panirajaguptha.1@osu.edu</span></a><span style="font-size:12pt">>)
 escribió:</span><u></u><u></u></p>
</div>
<blockquote style="border-top:none;border-right:none;border-bottom:none;border-left:1pt solid rgb(204,204,204);padding:0in 0in 0in 6pt;margin:5pt 0in 5pt 4.8pt">
<div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:11pt">­­­Hi Gabriel,</span><u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:11pt">Thanks for contacting us. </span>
<u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:11pt">We are taking a look at this. We will get back to you once we have an update.</span><u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:11pt"> </span><u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:11pt">-Akshay</span><u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:11pt"> </span><u></u><u></u></p>
<div style="border-right:none;border-bottom:none;border-left:none;border-top:1pt solid rgb(225,225,225);padding:3pt 0in 0in">
<p class="MsoNormal"><b><span style="font-size:11pt;font-family:Calibri,sans-serif">From:</span></b><span style="font-size:11pt;font-family:Calibri,sans-serif"> Mvapich-discuss <mvapich-discuss-bounces+panirajaguptha.1=</span><a href="mailto:osu.edu@lists.osu.edu" target="_blank"><span style="font-size:11pt;font-family:Calibri,sans-serif">osu.edu@lists.osu.edu</span></a><span style="font-size:11pt;font-family:Calibri,sans-serif">>
<b>On Behalf Of </b>GABRIEL SOTODOSOS MORALES via Mvapich-discuss<br>
<b>Sent:</b> Tuesday, June 11, 2024 6:57 AM<br>
<b>To:</b> </span><a href="mailto:mvapich-discuss@lists.osu.edu" target="_blank"><span style="font-size:11pt;font-family:Calibri,sans-serif">mvapich-discuss@lists.osu.edu</span></a><span style="font-size:11pt;font-family:Calibri,sans-serif"><br>
<b>Subject:</b> [Mvapich-discuss] Problems trying to run SparkPi example with MPI4Spark</span><u></u><u></u></p>
</div>
<p class="MsoNormal"><span style="font-size:12pt"> </span><u></u><u></u></p>
<div>
<p class="MsoNormal"><span style="font-size:1pt;color:white">Hi Mvapich-discuss, I´m trying to run the SparkPi example in my cluster using the Standalone Cluster Manager. However, my executor gets stuck when deploying the tasks to the executors with the following
 message: "WARN TaskSchedulerImpl:</span><span style="font-size:1pt;font-family:Arial,sans-serif;color:white"> </span><span style="font-size:1pt;color:white">
</span><u></u><u></u></p>
</div>
<p class="MsoNormal"><span style="font-size:12pt">Hi Mvapich-discuss,</span><u></u><u></u></p>
<div>
<p class="MsoNormal"><span style="font-size:12pt"> </span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">I´m trying to run the SparkPi example in my cluster using the Standalone Cluster Manager. However, my executor gets stuck when deploying the tasks to the executors with the following message:</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt"> </span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><i><span style="font-size:12pt">"WARN TaskSchedulerImpl: Initial job has not accepted any resources; check your cluster UI to ensure that workers are registered and have sufficient resources"</span></i><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt"> </span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">I have followed the steps in the user guide, I don´t know if I did something wrong or if I missed something. With the same configuration in Spark, I can run the SparkPi example without problems.</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt"> </span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">I am using MVAPICH-3.0 compiled as follows: </span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">--prefix=/beegfs/home/javier.garciablas/gsotodos/bin_noref/mvapich/ --enable-threads=multiple --enable-romio --with-device=ch4:ofi:psm2 --with-libfabric=/opt/libfabric</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt"> </span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">And here are my configuration files:</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">spark-env.sh:</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">export SPARK_HOME=$HOME/mpi4spark-0.2-x86-bin</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">export SPARK_NO_DAEMONIZE=1</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">export JAVA_LIBRARY_PATH=$JAVA_LIBRARY_PATH:$MV2J_HOME</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$MV2J_HOME/lib</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">export SPARK_LIBRARY_PATH=$MV2J_HOME/lib</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">export JAVA_BINARY=$JAVA_HOME/bin</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">export WORK_DIR=$SPARK_HOME/exec-wdir</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt"> </span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">spark-defaults.conf:</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">spark.executor.extraJavaOptions -Djava.library.path=$HOME/mvapich2-j-2.3.7/lib</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt"> </span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">app.sh:</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">./bin/spark-submit --master spark://$1:7077 --class org.apache.spark.examples.SparkPi examples/jars/spark-examples_2.12-3.3.0-SNAPSHOT.jar 1024</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt"> </span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">sbin/start-mpi4spark.sh:</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt"> </span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">HOSTFILE=hostfile<br>
procs=`wc -l < ${HOSTFILE}`<br>
javac -cp $MV2J_HOME/lib/mvapich2-j.jar SparkMPI.java<br>
host=`tail -2 ${HOSTFILE} | head -1`<br>
<br>
{<br>
 $MPILIB/bin/mpirun_rsh  -export-all -np $procs -hostfile ${HOSTFILE} SLURM_JOB_ID=$SLURM_JOB_ID MV2_RNDV_PROTOCOL=RGET MV2_USE_RDMA_FAST_PATH=0 MV2_USE_COALESCE=0 MV2_SUPPORT_DPM=1 MV2_HOMOGENEOUS_CLUSTER=1 MV2_ENABLE_AFFINITY=0 LD_PRELOAD= $MPILIB/lib/libmpi.so
 java -cp $MV2J_HOME/lib/mvapich2-j.jar:. -Djava.library.path=$MV2J_HOME/lib SparkMPI $host<br>
  } >& exec.log</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt"> </span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">After launching sbin/start-mpi4spark.sh the master and workers nodes keep alive but the execution gets stuck as said before. Am I missing something? Thanks for the help in advance.</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt"> </span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12pt">Best regads.</span><u></u><u></u></p>
</div>
<p class="MsoNormal"><span style="font-size:12pt">Gabriel.</span><u></u><u></u></p>
</div>
</div>
</div>
</blockquote>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>

_______________________________________________<br>
Mvapich-discuss mailing list<br>
<a href="mailto:Mvapich-discuss@lists.osu.edu" target="_blank">Mvapich-discuss@lists.osu.edu</a><br>
<a href="https://lists.osu.edu/mailman/listinfo/mvapich-discuss" rel="noreferrer" target="_blank">https://lists.osu.edu/mailman/listinfo/mvapich-discuss</a><br>
</div></blockquote></div>