多卡选取优化

当应用只需使用服务器中部分GPU卡时,GPU卡位置的选取对应用性能有较大影响。

一般规则如下,实际以测试为准。

以2卡为例来说明均匀分布选取和集中分布选取,如图1图2所示。

图1 GPU0、GPU2均匀分布
图2 GPU0、GPU1卡集中分布

GPU与CPU的连接关系可通过结合“nvidia-smi topo -m”和“lscpu |grep NUMA”命令查询得到,如下图所示,GPU0挂接在CPU0,GPU1挂接在CPU1。

GPU卡选取方式: