FAQ
故障处理流程
环境变量配置错误
作业进程数过大
指定网卡名称错误
指定网络类型错误
指定主机名错误
多节点运行mpirun时异常
多节点运行mpirun时报某个文件无法找到或打开
执行Hyper MPI二进制文件报错
运行MPI作业提示网络设备内存无法分配
在-x UCX_IB_GID_INDEX命令中指定GID后报错
Allgatherv算法4指定TCP传输,np大规格执行报错
Allreduce算法8精度问题导致多次执行结果不一致
父主题:
1.3.1 用户指南