Hyper MPI 1.3.*版本命令参数

使用Hyper MPI命令参数时,可以参考算法地图了解具体参数值的含义。

表1 Hyper MPI 1.3.*版本命令参数

Hyper MPI 1.3.*版本命令参数

取值

参数说明

-x UCG_PLANC_UCX_ALLREDUCE_FANOUT_INTER_DEGREE=

  • 取值类型:int
  • 取值范围:任意正整数
    说明:

    建议配置为2~运行作业节点数量间的正整数,例如2~8。

  • 默认值:8

可选参数,Allreduce算法的算法序号为5、6、7和8时的参数。

示例:

-x UCG_PLANC_UCX_ALLREDUCE_FANOUT_INTER_DEGREE=8

-x UCG_PLANC_UCX_ALLREDUCE_FANIN_INTER_DEGREE=

  • 取值类型:int
  • 取值范围:任意正整数
    说明:

    建议配置为2~运行作业节点数量间的正整数,例如2~8。

  • 默认值:8

可选参数,Allreduce算法的算法序号为5、6、7和8时的参数。

示例:

-x UCG_PLANC_UCX_ALLREDUCE_FANIN_INTER_DEGREE=8

-x UCG_PLANC_UCX_ALLREDUCE_FANOUT_INTRA_DEGREE=

  • 取值类型:int
  • 取值范围:任意正整数
    说明:

    建议配置为2~参与通信进程数量间的正整数,例如2~8。

  • 默认值:8

可选参数,Allreduce算法的算法序号为7和8时的参数。

示例:

-x UCG_PLANC_UCX_ALLREDUCE_FANOUT_INTRA_DEGREE=2

-x UCG_PLANC_UCX_ALLREDUCE_FANIN_INTRA_DEGREE=

  • 取值类型:int
  • 取值范围:任意正整数
    说明:

    建议配置为2~参与通信进程数量间的正整数,例如2~8。

  • 默认值:4

可选参数,Allreduce算法的算法序号为7和8时的参数。

示例:

-x UCG_PLANC_UCX_ALLREDUCE_FANIN_INTRA_DEGREE=4

-x UCG_PLANC_UCX_BARRIER_FANOUT_INTER_DEGREE=

  • 取值类型:int
  • 取值范围:任意正整数
    说明:

    建议配置为2~运行作业节点数量间的正整数,例如2~8。

  • 默认值:8

可选参数,Barrier算法的算法序号为4、5、6和7时的参数。

示例:

-x UCG_PLANC_UCX_BARRIER_FANOUT_INTER_DEGREE=8

-x UCG_PLANC_UCX_BARRIER_FANIN_INTER_DEGREE=

  • 取值类型:int
  • 取值范围:任意正整数
    说明:

    建议配置为2~运行作业节点数量间的正整数,例如2~8。

  • 默认值:8

可选参数,Barrier算法的算法序号为4、5、6和7时的参数。

示例:

-x UCG_PLANC_UCX_BARRIER_FANIN_INTER_DEGREE=8

-x UCG_PLANC_UCX_BARRIER_FANOUT_INTRA_DEGREE=

  • 取值类型:int
  • 取值范围:任意正整数
    说明:

    建议配置为2~参与通信进程数量间的正整数,例如2~8。

  • 默认值:2

可选参数,Barrier算法的算法序号为6和7时的参数。

示例:

-x UCG_PLANC_UCX_BARRIER_FANOUT_INTRA_DEGREE=2

-x UCG_PLANC_UCX_BARRIER_FANIN_INTRA_DEGREE=

  • 取值类型:int
  • 取值范围:任意正整数
    说明:

    建议配置为2~参与通信进程数量间的正整数,例如2~8。

  • 默认值:4

可选参数,Barrier算法的算法序号为6和7时的参数。

示例:

-x UCG_PLANC_UCX_BARRIER_FANIN_INTRA_DEGREE=8

-x UCG_PLANC_UCX_BCAST_ATTR=

  • 取值类型:string,格式为I:id[S:scoreR:start-end]。
  • 取值范围
    • id:必填,1~10。
    • score:选填,任意自然数。
    • start:选填,任意自然数。
    • end:选填,任意自然数。
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,Bcast的算法参数。

示例:

-x UCG_PLANC_UCX_BCAST_ATTR=I:4

-x UCG_PLANC_UCX_ALLREDUCE_ATTR=

  • 取值类型:string,格式为I:id[S:scoreR:start-end]。
  • 取值范围
    • id:必填,1~14。
    • score:选填,任意自然数。
    • start:选填,任意自然数。
    • end:选填,任意自然数。
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,Allreduce的算法参数。

示例:

-x UCG_PLANC_UCX_ALLREDUCE_ATTR=I:7

-x UCG_PLANC_UCX_BARRIER_ATTR=

  • 取值类型:string,格式为I:id[S:scoreR:start-end]。
  • 取值范围
    • id:必填,1~10。
    • score:选填,任意自然数。
    • start:选填,任意自然数。
    • end:选填,任意自然数。
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,Barrier的算法参数。

示例:

-x UCG_PLANC_UCX_BARRIER_ATTR=I:1

-x UCG_PLANC_UCX_ALLGATHERV_ATTR=

  • 取值类型:string,格式为I:id[S:scoreR:start-end]。
  • 取值范围
    • id:必填,1~5。
    • score:选填,任意自然数。
    • start:选填,任意自然数。
    • end:选填,任意自然数。
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,Allgatherv的算法参数。

示例:

-x UCG_PLANC_UCX_ ALLGATHERV_ATTR=I:3

-x UCG_PLANC_UCX_SCATTERV_ATTR=

  • 取值类型:string,格式为I:id[S:scoreR:start-end]。
  • 取值范围
    • id:必填,1或2。
    • score:选填,任意自然数。
    • start:选填,任意自然数。
    • end:选填,任意自然数。
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,Scatterv的算法参数。

示例:

-x UCG_PLANC_UCX_ SCATTERV_ATTR=I:1

-x UCG_PLANC_UCX_BCAST_NA_KNTREE_INTER_DEGREE=

  • 取值类型:int
  • 取值范围:任意正整数
    说明:

    建议配置为2~运行作业节点数量间的正整数,例如2~8。

  • 默认值:8

可选参数,Bcast算法的算法序号为3和4时的参数。

示例:

-x UCG_PLANC_UCX_BCAST_NA_KNTREE_INTER_DEGREE=8

-x UCG_PLANC_UCX_BCAST_NA_KNTREE_INTRA_DEGREE=

  • 取值类型:int
  • 取值范围:任意正整数
    说明:

    建议配置为2~参与通信进程数量间的正整数,例如2~8。

  • 默认值:2

可选参数,Bcast算法的算法序号为4时的参数。

示例:

-x UCG_PLANC_UCX_BCAST_NA_KNTREE_INTRA_DEGREE=2

-x UCG_PLANC_UCX_REDUCE_KNTREE_DEGREE=

  • 取值类型:int
  • 取值范围:任意正整数
    说明:

    建议配置为2~参与通信进程数量间的正整数,例如2~8。

  • 默认值:2

可选参数,Allreduce算法的算法序号为2、3、5、6、7和8时的参数。

示例:

-x UCG_PLANC_UCX_REDUCE_KNTREE_DEGREE=2

-x UCG_PLANC_UCX_SCATTERV_KNTREE_DEGREE=

  • 取值类型:int
  • 取值范围:任意正整数
    说明:

    建议配置为2~参与通信进程数量间的正整数,例如2~8。

  • 默认值:2

可选参数,Scatterv算法的算法序号为2时的参数。

示例:

-x UCG_PLANC_UCX_SCATTERV_KNTREE_DEGREE=2

-x UCG_PLANC_UCX_SCATTERV_MIN_SEND_BATCH=

  • 取值类型:int
  • 取值范围:任意自然数
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,Scatterv算法的算法序号为1时,发送批处理模式的最小边界值。

示例:

-x UCG_PLANC_UCX_SCATTERV_MIN_SEND_BATCH=1

-x UCG_PLANC_UCX_SCATTERV_MAX_SEND_BATCH=

  • 取值类型:int
  • 取值范围:任意自然数
  • 默认值:无固定值,根据生效规则调节赋值。

可选参数,Scatterv算法的算法序号为1时,发送批处理模式的最大边界值。

示例:

-x UCG_PLANC_UCX_SCATTERV_MIN_SEND_BATCH=1

-x UCG_PLANC_UCX_NPOLLS=

  • 取值类型:int
  • 取值范围:任意正整数
  • 默认值:3

可选参数,P2P请求测试UCP进度轮询周期数。

示例:

-x UCG_PLANC_UCX_NPOLLS=3

-x UCG_PLANC_UCX_USE_OOB=

  • 取值类型:string
  • 取值范围
    • y或yes:强制开启
    • try:尝试开启
    • n或no:关闭
  • 默认值:try

可选参数,复用ompi pml ucx链路。

示例:

-x UCG_PLANC_UCX_USE_OOB=try

-x UCG_USE_MT_MUTEX=

  • 取值类型:string
  • 取值范围
    • y:使用mutex锁
    • n:使用spinlock锁
  • 默认值:n

可选参数,在UCG中支持多线程的锁的实现方式。

示例:

-x UCG_USE_MT_MUTEX=n

-x UCG_LOG_LEVEL=

  • 取值类型:string
  • 取值范围
    • fatal:错误,程序会立即终止。
    • error:错误信息。
    • warn:告警信息。
    • info:提示信息。
    • debug:调试信息。
    • trace:详细调试信息。
    说明:

    日志级别fatal>error>warn>info>debug>trace,级别越低,打印的日志信息越详细,例如设置为warn,则会打印fatal、error和warn级别的日志信息。

  • 默认值:warn

可选参数,指定UCG日志级别。

示例:

-x UCG_LOG_LEVEL=warn

-x UCG_PLANC_UCX_REDUCE_CONSISTENCY=

  • 取值类型:string
  • 取值范围
    • y:保证allreduce结果一致性
    • n:不保证allreduce结果一致性
  • 默认值:n

可选参数,UCG中Allreduce结果是否保证一致性。

示例:

-x UCG_PLANC_UCX_REDUCE_CONSISTENCY=n

--mca coll_ucg_priority

  • 取值类型:int
  • 取值范围:任意自然数
  • 默认值:90

可选参数,Hyper MPI调用UCG模块的优先级,值越大,优先级越高。

示例:

--mca coll_ucg_priority 90

--coll_ucg_verbose

  • 取值类型:int
  • 取值范围:任意自然数
  • 默认值:2

可选参数,UCG组件的日志详细程度。

示例:

--coll_ucg_verbose 2

--mca coll_ucg_max_rcache_size

  • 取值类型:int
  • 取值范围:任意自然数
  • 默认值:10

可选参数,coll ucg组件的请求cache大小。

示例:

--mca coll_ucg_max_rcache_size 10

--mca coll_ucg_disable_coll

  • 取值类型:string
  • 取值范围:集合名称,多个集合名称之间用英文逗号(,)间隔,例如allreduce,bcast。
  • 默认值:无

可选参数,运行Hyper MPI作业时,禁用的Hyper MPI优化后的集合操作。

示例:

--mca coll_ucg_disable_coll barrier,bcast