鲲鹏社区首页
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助

退出HPC并行应用调试失败的解决方法

现象描述

退出HPC并行应用调试失败。

图1 环境清理失败
图2 调试环境清理等待时间过长
图3 退出MPI调试失败

可能原因

  • rank启动数目过多。
  • 网络连通性不佳。

处理步骤

  1. (可选)请用户手动清理提示路径下的文件,xxx指提示路径。
    1
    rm -f xxx
    
  2. 释放进程资源。
    1. 查看mpirun进程。
      1
      ps -ef | grep mpirun
      
    2. 杀死进程,pid为具体的进程pid。
      1
      kill -15 {pid}
      
  3. 重启服务。
    1
    2
    systemctl restart gunicorn_framework.service
    systemctl restart gunicorn_plugin.service