示例如下:
mpirun -np 16 -x UCX_RNDV_THRESH=32k -x UCX_MAX_RNDV_RAILS=2 osu_bcast
网口的MTU值在一定程度上会影响网口的带宽,MTU的默认值可以通过ibv_devinfo -d <网口名>|grep active_mtu命令查询,示例如下:
ibv_devinfo -d mlx5_0|grep active_mtu
回显示例如下:
active_mtu: 1024 (3)
默认值也可以通过UCX_RC_VERBS_PATH_MTU(板载网卡)或UCX_RC_MLX5_PATH_MTU(Mellanox网卡)进行修改。示例如下:
mpirun -np 16 -x UCX_NET_DEVICES=hns_0:1 -x UCX_RC_VERBS_PATH_MTU=1024 osu_bcast
mpirun -np 16 -x UCX_NET_DEVICES=mlx5_1:1 -x UCX_RC_MLX5_PATH_MTU=1024 osu_bcast
假设1个Socket有2个NUMA node,1个NUMA node有32个CPU,示例如下:
mpirun -np 16 --map-by core -x UCX_NET_DEVICES=hns_0:1 osu_bcast(16个进程绑定在numa0上,并指定numa0上的网卡)