多节点运行和验证
- 使用PuTTY工具,以root用户登录服务器。
- 执行以下命令解压TEST41算例包。
tar zxf TEST41.tar.gz
- 执行以下命令进入TEST41算例目录。
cd TEST41/NHC
- 执行以下命令创建“hostfile”文件并添加节点信息。
echo -e 'node1\nnode2\n…\nnodex' > /path/to/HOSTFILE
“node1、node2、…、nodex”分别为各节点的主机名,可通过命令hostname查询各主机名,“\n”为换行符。
- 在node2服务器节点窗口,执行以下命令配置环境变量。
vi /root/.bashrc
- 按“i”进入编辑模式,在“.bashrc”文件末尾新增如下内容
export PATH=/path/to/GNU/bin:/path/to/OPENMPI/bin:$PATH export LD_LIBRARY_PATH=/path/to/GNU/lib64:/path/to/OPENMPI/lib:$LD_LIBRARY_PATH export PATH=/path/to/DL_POLY/dl_poly-RELEASE-1-10/execute:$PATH
- 按“Esc”键,输入:wq!,按“Enter”保存并退出编辑。
- 执行以下命令进行算例的多节点运行。
mpirun --allow-run-as-root -np 256 -N 128 -x OMP_NUM_THREADS=1 --hostfile /path/to/HOSTFILE -mca btl ^openib DLPOLY.X
查看“OUTPUT”日志的指标“time elapsed since job start = XX seconds”,时间单位是“s”,数值越少性能越优。
输出的结果样例如图1所示。
父主题: 运行和验证