退出HPC并行应用调试失败的解决方法
现象描述
退出HPC并行应用调试失败。
图1 环境清理失败

图2 调试环境清理等待时间过长

图3 退出MPI调试失败

可能原因
- rank启动数目过多。
- 网络连通性不佳。
处理步骤
- (可选)请用户手动清理提示路径下的文件,xxx指提示路径。
1
rm -f xxx
- 释放进程资源。
- 查看mpirun进程。
1
ps -ef | grep mpirun
- 杀死进程,pid为具体的进程pid。
1
kill -15 {pid}
- 查看mpirun进程。
- 重启服务。
1 2
systemctl restart gunicorn_framework.service systemctl restart gunicorn_plugin.service
父主题: FAQ