鲲鹏社区首页
中文
注册
开发者
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助

Hyper MPI 25.0.0及以上版本命令参数

本文介绍当前Hyper MPI 25.0.0及以上版本命令参数。

Hyper MPI 25.0.0及以上版本命令参数为在2.4.3及以上版本命令参数基础上新增的命令参数。

使用Hyper MPI命令参数指定算法时,可以参考算法地图了解具体参数值的含义。

表1 Hyper MPI 25.0.0及以上版本命令参数

Hyper MPI 25.0.0及以上版本命令参数

取值

参数说明

-x UCG_PLANC_STARS_TLS=

  • 取值类型:string
  • 取值范围:
    • all
    • rc_acc
    • sdma_acc
  • 默认值:all

可选参数,指定卸载算法所用的传输协议。

示例:

-x UCG_PLANC_STARS_TLS=all

-x UCG_PLANC_STARS_NET_DEVICES=

  • 取值类型:string
  • 取值范围:当前设备上所有网卡。
  • 默认值:all

可选参数,指定卸载算法所用的网卡。

示例:

-x UCG_PLANC_STARS_NET_DEVICES=all

-x UCG_PLANC_STARS_SELF_DEVICES=

  • 取值类型:string
  • 取值范围:memory
  • 默认值:memory

可选参数,指定卸载算法所用的环回设备。

示例:

-x UCG_PLANC_STARS_SELF_DEVICES=memory

-x UCG_PLANC_STARS_MAX_RAILS=

  • 取值类型:int
  • 取值范围:1~9
  • 默认值:1

可选参数,指定卸载算法最多使用的链路数。

示例:

-x UCG_PLANC_STARS_MAX_RAILS=1

-x UCG_PLANC_STARS_BCAST_ATTR=

  • 取值类型:string,格式为I:id[S:scoreR:start-end]。
  • 取值范围:
    • id:必填,1~4。
    • score:选填,任意自然数。
    • start:选填,任意自然数。
    • end:选填,任意自然数。
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,Bcast的算法参数。

示例:

-x UCG_PLANC_STARS_BCAST_ATTR=I:1

-x UCG_PLANC_STARS_IBCAST_ATTR=

  • 取值类型:string,格式为I:id[S:scoreR:start-end]。
  • 取值范围:
    • id:必填,1~4。
    • score:选填,任意自然数。
    • start:选填,任意自然数。
    • end:选填,任意自然数。
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,IBcast的算法参数。

示例:

-x UCG_PLANC_STARS_IBCAST_ATTR=I:1

-x UCG_PLANC_STARS_SCATTERV_ATTR=

  • 取值类型:string,格式为I:id[S:scoreR:start-end]。
  • 取值范围:
    • id:必填,1。
    • score:选填,任意自然数。
    • start:选填,任意自然数。
    • end:选填,任意自然数。
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,Scatterv的算法参数。

示例:

-x UCG_PLANC_STARS_SCATTERV_ATTR=I:1

-x UCG_PLANC_STARS_ISCTTERV_ATTR=

  • 取值类型:string,格式为I:id[S:scoreR:start-end]。
  • 取值范围:
    • id:必填,1。
    • score:选填,任意自然数。
    • start:选填,任意自然数。
    • end:选填,任意自然数。
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,IScatterv的算法参数。

示例:

-x UCG_PLANC_STARS_ISCATTERV_ATTR=I:1

-x UCG_PLANC_STARS_ALLGATHERV_ATTR=

  • 取值类型:string,格式为I:id[S:scoreR:start-end]。
  • 取值范围:
    • id:必填,1。
    • score:选填,任意自然数。
    • start:选填,任意自然数。
    • end:选填,任意自然数。
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,Allgatherv的算法参数。

示例:

-x UCG_PLANC_STARS_ALLGATHERV_ATTR=I:1

-x UCG_PLANC_STARS_IALLGATHERV_ATTR=

  • 取值类型:string,格式为I:id[S:scoreR:start-end]。
  • 取值范围:
    • id:必填,1。
    • score:选填,任意自然数。
    • start:选填,任意自然数。
    • end:选填,任意自然数。
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,IAllgatherv的算法参数。

示例:

-x UCG_PLANC_STARS_IALLGATHERV_ATTR=I:1

-x UCG_PLANC_STARS_ALLTOALLV_ATTR=

  • 取值类型:string,格式为I:id[S:scoreR:start-end]。
  • 取值范围:
    • id:必填,1。
    • score:选填,任意自然数。
    • start:选填,任意自然数。
    • end:选填,任意自然数。
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,Alltoallv的算法参数。

示例:

-x UCG_PLANC_STARS_ALLTOALLV_ATTR=I:1

-x UCG_PLANC_STARS_IALLTOALLV_ATTR=

  • 取值类型:string,格式为I:id[S:scoreR:start-end]。
  • 取值范围:
    • id:必填,1。
    • score:选填,任意自然数。
    • start:选填,任意自然数。
    • end:选填,任意自然数。
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,IAlltoallv的算法参数。

示例:

-x UCG_PLANC_STARS_IALLTOALLV_ATTR=I:1

-x UCG_PLANC_STARS_BARRIER_ATTR=

  • 取值类型:string,格式为I:id[S:scoreR:start-end]。
  • 取值范围:
    • id:必填,1。
    • score:选填,任意自然数。
    • start:选填,任意自然数。
    • end:选填,任意自然数。
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,Barrier的算法参数。

示例:

-x UCG_PLANC_STARS_BARRIER_ATTR=I:1

-x UCG_PLANC_STARS_IBARRIER_ATTR=

  • 取值类型:string,格式为I:id[S:scoreR:start-end]。
  • 取值范围:
    • id:必填,1。
    • score:选填,任意自然数。
    • start:选填,任意自然数。
    • end:选填,任意自然数。
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,IBarrier的算法参数。

示例:

-x UCG_PLANC_STARS_IBARRIER_ATTR=I:1

-x UCG_PLANC_STARS_SCATTERV_KNTREE_DEGREE=

  • 取值类型:int
  • 取值范围:任意正整数
    说明:

    建议配置为2~运行作业节点数量间的正整数,例如2~8。

  • 默认值:2

可选参数,指定Scatterv的算法参数。

示例:

-x UCG_PLANC_STARS_SCATTERV_KNTREE_DEGREE=2

-x UCG_PLANC_STARS_BARRIER_FANIN_DEGREE=

  • 取值类型:int
  • 取值范围:任意正整数
    说明:

    建议配置为2~运行作业节点数量间的正整数,例如2~8。

  • 默认值:4

可选参数,指定Barrier_faninfanout的算法参数。

示例:

-x UCG_PLANC_STARS_BARRIER_FANIN_DEGREE=4

-x UCG_PLANC_STARS_BARRIER_FANOUT_DEGREE=

  • 取值类型:int
  • 取值范围:任意正整数
    说明:

    建议配置为2~运行作业节点数量间的正整数,例如2~8。

  • 默认值:2

可选参数,指定Barrier_faninfanout的算法参数。

示例:

-x UCG_PLANC_STARS_BARRIER_FANOUT_DEGREE=2

-x UCG_PLANC_STARS_SCATTERV_RUN_HPL=

  • 取值类型:string
  • 取值范围:
    • y:使用HPL模式运行。
    • n:使用通用模式运行。
  • 默认值:n

可选参数,指定Scatterv的运行模式。

示例:

-x UCG_PLANC_STARS_SCATTERV_RUN_HPL=y

-x UCG_PLANC_STARS_RC_SEG_SIZE=

  • 取值类型:size_t
  • 取值范围:0~2^64-1
  • 默认值:8256

可选参数,设置弹性缓冲区大小。

示例:

-x UCG_PLANC_STARS_RC_SEG_SIZE=8256

-x UCG_PLANC_STARS_RC_TX_QUEUE_LEN=

  • 取值类型:unsigned
  • 取值范围:0~2^32-1
  • 默认值:1024

可选参数,设置QP中发送队列的长度。

示例:

-x UCG_PLANC_STARS_RC_TX_QUEUE_LEN=1024

-x UCG_PLANC_STARS_RC_TX_MIN_INLINE=

  • 取值类型:unsigned
  • 取值范围:0~2^32-1
  • 默认值:64

可选参数,设置在发送WQE时为内联数据保留的最小字节。

示例:

-x UCG_PLANC_STARS_RC_TX_MIN_INLINE=64

-x UCG_PLANC_STARS_RC_TX_INLINE_RESP=

  • 取值类型:unsigned
  • 取值范围:0~2^32-1
  • 默认值:64

可选参数,设置在发送WQE时为内联响应保留的字节。对于足够小的响应,比如原子操作和small reads,都会被以内联方式接收。

示例:

-x UCG_PLANC_STARS_RC_TX_INLINE_RESP=64

-x UCG_PLANC_STARS_RC_HOP_LIMIT=

  • 取值类型:unsigned
  • 取值范围:0~2^32-1
  • 默认值:255

可选参数,设置IB跳数限制/RoCEv2生存时间。应介于0和255之间。

示例:

-x UCG_PLANC_STARS_RC_HOP_LIMIT=255

-x UCG_PLANC_STARS_RC_PATH_MTU=

  • 取值类型:unsigned
  • 取值范围:
    • default
    • 512
    • 1024
    • 2048
    • 4096
  • 默认值:default

可选参数,设置路径最大传输单元。default表示将为设备选择最佳MTU。

示例:

-x UCG_PLANC_STARS_RC_PATH_MTU=1024

-x UCG_PLANC_STARS_RC_TIMEOUT=

  • 取值类型:string,格式为<number>[s|us|ms|ns]
  • 取值范围:<number>为任意大于0的浮点数。
  • 默认值:1ms

可选参数,设置传输超时时间。

示例:

-x UCG_PLANC_STARS_RC_TIMEOUT=1ms

-x UCG_PLANC_STARS_RC_RETRY_COUNT=

  • 取值类型:unsigned
  • 取值范围:0~2^32-1
  • 默认值:7

可选参数,设置传输重试次数。

示例:

-x UCG_PLANC_STARS_RC_RETRY_COUNT=7

-x UCG_PLANC_STARS_RC_RNR_TIMEOUT=

  • 取值类型:string,格式为<number>[s|us|ms|ns]
  • 取值范围:<number>为任意大于0的浮点数。
  • 默认值:1ms

可选参数,设置RNR超时时间。

示例:

-x UCG_PLANC_STARS_RC_RNR_TIMEOUT=1ms

-x UCG_PLANC_STARS_RC_RNR_RETRY_COUNT=

  • 取值类型:unsigned
  • 取值范围:0~2^32-1
  • 默认值:7

可选参数,设置RNR重试次数。

示例:

-x UCG_PLANC_STARS_RC_RNR_RETRY_COUNT=7

-x UCG_PLANC_STARS_RC_TX_CQ_MODERATION=

  • 取值类型:unsigned
  • 取值范围:0~2^32-1
  • 默认值:64

可选参数,在不请求完成的情况下,允许发送WQE的最大数量。

示例:

-x UCG_PLANC_STARS_RC_TX_CQ_MODERATION=64

-x UCG_PLANC_STARS_RC_TX_CQ_LEN=

  • 取值类型:unsigned
  • 取值范围:0~2^32-1
  • 默认值:4096

可选参数,设置发送完成队列的长度。这限制了未完成的信号发送的总数。

示例:

-x UCG_PLANC_STARS_RC_TX_CQ_LEN=4096

-x UCG_PLANC_STARS_RC_TX_MAX_WR=

  • 取值类型:unsigned
  • 取值范围:0~2^32-1
  • 默认值:-1(即2^32-1)

可选参数,限制未完成的已发布工作请求的数量。实际限制为该值和TX队列长度之间的最小值。-1表示无限制。

示例:

-x UCG_PLANC_STARS_RC_TX_MAX_WR=-1

-x UCG_PLANC_STARS_IB_RCACHE_MEM_PRIO=

  • 取值类型:unsigned
  • 取值范围:0~2^32-1
  • 默认值:1000

可选参数,指定注册缓存内存事件优先级。

示例:

-x UCG_PLANC_STARS_IB_RCACHE_MEM_PRIO=1000

-x UCG_PLANC_STARS_IB_RCACHE_OVERHEAD=

  • 取值类型:string,格式为<number>[s|us|ms|ns]
  • 取值范围:<number>为任意大于0的浮点数。
  • 默认值:180ns

可选参数,指定注册缓存查找开销。

示例:

-x UCG_PLANC_STARS_IB_RCACHE_OVERHEAD=180ns

-x UCG_PLANC_STARS_IB_RCACHE_ADDR_ALIGN=

  • 取值类型:unsigned
  • 取值范围:0~2^32-1
  • 默认值:64

可选参数,指定注册地址对齐缓存。必须为2的幂次方,且介于64和系统页面大小之间。

示例:

-x UCG_PLANC_STARS_IB_RCACHE_ADDR_ALIGN=64

-x UCG_PLANC_STARS_IB_REG_METHODS=

  • 取值类型:string
  • 取值范围:
    • rcache:用户空间注册缓存。
    • odp:隐式按需分页。
    • direct:直接注册。

    可以输入多种取值,以英文逗号分割,例如rcache,odp。

  • 默认值:rcache,odp,direct

可选参数,设置不同优先级的注册MR的方法。

示例:

-x UCG_PLANC_STARS_IB_REG_METHODS=rcache,odp,direct

-x UCG_PLANC_STARS_IB_MEM_REG_OVERHEAD=

  • 取值类型:string,格式为<number>[s|us|ms|ns]
  • 取值范围:<number>为任意大于0的浮点数。
  • 默认值:16us

可选参数,设置内存注册开销。

示例:

-x UCG_PLANC_STARS_IB_MEM_REG_OVERHEAD=16us

-x UCG_PLANC_STARS_IB_MEM_REG_GROWTH=

  • 取值类型:string,格式为<number>[s|us|ms|ns]
  • 取值范围:<number>为任意大于0的浮点数。
  • 默认值:0.06ns

可选参数,设置内存注册增长率。

示例:

-x UCG_PLANC_STARS_IB_MEM_REG_GROWTH=0.1ns

-x UCG_PLANC_STARS_IB_ETH_PAUSE_ON=

  • 取值类型:string
  • 取值范围:
    • y:在以太网上开启Pause帧。
    • n:在以太网上关闭Pause帧。
  • 默认值:y

可选参数,是否在以太网上启用Pause帧。Pause帧是一种在以太网家族计算机网络拥塞时暂时停止数据传输的机制。如果将此参数设置为“n”,则将取消IB传输资格,因为在与RoCE一起使用时,在有损结构上可能表现不佳。

示例:

-x UCG_PLANC_STARS_IB_ETH_PAUSE_ON=y

-x UCG_PLANC_STARS_IB_ODP_NUMA_POLICY=

  • 取值类型:string
  • 取值范围:
    • default:不改变已有的策略。
    • prefered:设置为MPOL_PREFERRED模式。
    • bind:设置为MPOL_BIND模式。
  • 默认值:default

可选参数,设置重写ODP区域的NUMA策略,以避免额外的页迁移。

  • MPOL_PREFERRED模式设置优先分配的节点。内核将首先尝试从此节点分配页面,如果首选节点可用内存不足,则回落到其他节点。
  • MPOL_BIND模式指定一个严格的策略,限制内存分配给nodemask指定的节点。 如果nodemask指定了多个节点,则页面分配将来自具有足够空闲内存的节点,并且优先是离分配节点最近的节点。

示例:

-x UCG_PLANC_STARS_IB_ODP_NUMA_POLICY=bind

-x UCG_PLANC_STARS_IB_ODP_MAX_SIZE=

  • 取值类型:string
  • 取值范围:
    • auto:自动检测是否按需分页。
    • <number>[b|kb|mb|gb]:设置按需分页的最大内存区域大小为某一具体值。<number>取值范围为0~2^64-1。
  • 默认值:auto

可选参数,设置启用按需分页的最大内存区域大小。

示例:

-x UCG_PLANC_STARS_IB_ODP_MAX_SIZE=16kb

-x UCG_PLANC_STARS_RC_ROCE_LOCAL_SUBNET=

  • 取值类型:string
  • 取值范围:
    • y:接口子网内的地址可访问。
    • n:所有远程RoCEv2 IP地址可从任何端口访问。
  • 默认值:n

可选参数,使用每个网络设备的本地IP地址和子网掩码,对RoCEv2报文进行路由,用于筛选端口的IB子网前缀,为空表示不进行筛选。

示例:

-x UCG_PLANC_STARS_RC_ROCE_LOCAL_SUBNET=y

-x UCG_PLANC_STARS_RC_ROCE_LOCAL_SUBNET_PREFIX_LEN=

  • 取值类型:string
  • 取值范围:
    • auto:自动从设备地址检测子网前缀长度。
    • inf:仅允许同一设备内的连接。
    • <num>:为子网前缀指定数字比特位长度值。取值范围为0~32。
  • 默认值:auto

可选参数,使能UCX_IB_ROCE_LOCAL_SUBNET时,用于可达性检查的子网前缀长度,单位为比特。

示例:

-x UCG_PLANC_STARS_RC_ROCE_LOCAL_SUBNET_PREFIX_LEN=8

-x UCG_PLANC_STARS_SDMA_BW=

  • 取值类型:string,格式为<number>[T|G|M|K]B|b[[p|/]s]
  • 取值范围:<number>为任意大于0的浮点数。
  • 默认值:16911MBs

可选参数,配置SDMA的带宽,用于数据发送时控制SDMA链路的分包大小,仅在Multi-Rail场景下生效,单链路下配置无意义。

示例:

-x UCG_PLANC_STARS_SDMA_BW=10000MBs

-x UCX_RC_VERBS_TX_MIN_SGE=

  • 取值类型:unsigned
  • 取值范围:0~2^32-1
  • 默认值:5

可选参数,在RC协议下发送WQE中要保留的SG条目数。

示例:

-x UCX_RC_VERBS_TX_MIN_SGE=2

-x UCX_UD_VERBS_TX_MIN_SGE=

  • 取值类型:unsigned
  • 取值范围:0~2^32-1
  • 默认值:5

可选参数,在UD协议下发送WQE中要保留的SG条目数。

示例:

-x UCX_UD_VERBS_TX_MIN_SGE=1

-x UCX_SDMA_SHARED_CHANNEL_MODE=

  • 取值类型:bool
  • 取值范围:
    • y:开启共享通道模式。
    • n:使用独立通道模式。
  • 默认值:y

可选参数,开启该功能后,支持SDMA使用共享通道。

示例:

-x UCX_SDMA_SHARED_CHANNEL_MODE=y

-x UCG_PLANC_STARS_STREAM_DEPTH=

  • 取值类型:int
  • 取值范围:4096~65535
  • 默认值:4096

可选参数,指定卸载队列深度。

示例:

-x UCG_PLANC_STARS_STREAM_DEPTH=4096

-x UCG_PLANC_UCX_ALLGATHERV_DEFAULT_POLICY=

  • 取值类型:bool
  • 取值范围:
    • y:使用默认算法。
    • n:使用优化算法。
  • 默认值:y

可选参数,指定Allgatherv算子使用优化算法(部分环境下可能不适用)。

示例:

-x UCG_PLANC_UCX_ALLGATHERV_DEFAULT_POLICY=y

-x UCG_PLANC_UCX_ALLTOALLV_DEFAULT_POLICY=

  • 取值类型:bool
  • 取值范围:
    • y:使用默认算法。
    • n:使用优化算法。
  • 默认值:y

可选参数,指定Alltoallv算子使用优化算法(部分环境下可能不适用)。

示例:

-x UCG_PLANC_UCX_ALLTOALLV_DEFAULT_POLICY=y