退出HPC并行应用调试失败的解决方法
现象描述
退出HPC并行应用调试失败。
图1 环境清理失败


图2 调试环境清理等待时间过长


图3 退出MPI调试失败


可能原因
- rank启动数目过多。
- 网络连通性不佳。
处理步骤
- (可选)请用户手动清理提示路径下的文件,xxx指提示路径。
1rm -f xxx
- 释放进程资源。
- 查看mpirun进程。
1ps -ef | grep mpirun
- 终止进程,pid为具体的进程PID。
1kill -15 {pid}
- 查看mpirun进程。
- 重启服务。
- root用户安装
1 2
systemctl restart gunicorn_framework.service systemctl restart gunicorn_plugin.service
- 普通用户安装
bash /home/test01/DevKit/tools/service_management.sh start/stop/restart/status gunicorn_framework bash /home/test01/DevKit/tools/service_management.sh start/stop/restart/status gunicorn_plugin
/home/test01:表示DevKit安装目录,请根据实际路径替换。
- root用户安装
父主题: FAQ