退出HPC并行应用调试失败的解决方法

现象描述

退出HPC并行应用调试失败。

图1 环境清理失败
图2 调试环境清理等待时间过长
图3 退出MPI调试失败

可能原因

处理步骤

  1. (可选)请用户手动清理提示路径下的文件,xxx指提示路径。

    1
    rm -f xxx
    

  2. 释放进程资源。

    1. 查看mpirun进程。
      1
      ps -ef | grep mpirun
      
    2. 杀死进程,pid为具体的进程pid。
      1
      kill -15 {pid}
      

  3. 重启服务。

    1
    2
    systemctl restart gunicorn_framework.service
    systemctl restart gunicorn_plugin.service