环境变量配置
以下环境变量会用于应用数学库中。
环境变量名  | 
变量意义  | 
有效值  | 
默认值  | 
|---|---|---|---|
HGEMM_F16F16F32_MAX_KB  | 
设置hgemm最大kb数  | 
整数  | 
1'000'000'000'000L  | 
KML_SCADSS_VARIANT  | 
scadss调度策略  | 
整数(0|1),默认0  | 
0  | 
KSCALAPACK_REDIST_TO_LOCAL_APPLICABLE  | 
scalapack本地内存适配  | 
O\D\F  | 
D  | 
KML_NUM_THREADS  | 
local线程数设置  | 
整数  | 
0  | 
KML_ALLOCATE_POLICY  | 
alloc规则  | 
整数  | 
0  | 
KML_ALLOCATE_HUGEPAGE_SIZE  | 
alloc大页规模  | 
整数  | 
512*1024*1024  | 
KML_PXGETRF_FORCE_CALU  | 
pgetrf函数使用CALU算法  | 
整数  | 
0  | 
KML_FAST_EIGENSOLVER  | 
使用高性能版本特征值求解器  | 
整数  | 
1  | 
KML_TSQR_CHECK  | 
对于高瘦型QR分解进行结果检查  | 
整数  | 
0  | 
KML_MPI_USE_SHARED_MEMORY  | 
MPI使用共享内存  | 
整数  | 
1  | 
OMP_PLACES  | 
OMP内置参数  | 
cores  | 
-  | 
OMP_PROC_BIND  | 
OMP内置参数  | 
TRUE  | 
-  | 
KML_VERBOSE  | 
打印等级  | 
0/1/2/3  | 
0  | 
环境变量名  | 
变量意义  | 
有效值  | 
默认值  | 
|---|---|---|---|
KML_DSS_PPN  | 
开启autotune后每个节点的进程个数  | 
正整数  | 
2  | 
KML_DSS_SCHE_MODE  | 
DSS调度模式  | 
STATIC\DYNAMIC\KUPL\LAST  | 
LAST  | 
KML_DSS_SCALE_ALGO  | 
根据行列最大值进行放缩,当原始矩阵各行各列最大值差异过大时,可以改善精度。若选择ROWCOL_SCAN,则Analyze阶段需要传入有效的矩阵values数值  | 
NONE\ROWCOL_SCAN  | 
NONE  | 
KML_DSS_SGEMM_ISA  | 
求解器内部SGEMM选择合适的算子优化分支  | 
NEON\SVE256  | 
通过机型判断  | 
KML_DSS_DGEMM_ISA  | 
求解器内部DGEMM选择合适的算子优化分支  | 
NEON\SVE256  | 
通过机型判断  | 
KML_DSS_CGEMM_ISA  | 
求解器内部CGEMM选择合适的算子优化分支  | 
NEON\SVE256  | 
通过机型判断  | 
KML_DSS_ZGEMM_ISA  | 
求解器内部ZGEMM选择合适的算子优化分支  | 
NEON\SVE256  | 
通过机型判断  | 
KML_DSS_DSYRK_ISA  | 
求解器内部DSYRK选择合适的算子优化分支  | 
NEON\SVE256  | 
通过机型判断  | 
KML_DSS_ZSYRK_ISA  | 
求解器内部ZSYRK选择合适的算子优化分支  | 
NEON\SVE256  | 
通过机型判断  | 
KML_DSS_DSYRKMM_ISA  | 
求解器内部DSYRKMM选择合适的算子优化分支  | 
NEON\SVE256  | 
通过机型判断  | 
KML_DSS_ZSYRKMM_ISA  | 
求解器内部ZSYRKMM选择合适的算子优化分支  | 
NEON\SVE256  | 
通过机型判断  | 
KML_DSS_SGETRF_ISA  | 
求解器内部SGETRF选择合适的算子优化分支  | 
NEON\SVE256  | 
通过机型判断  | 
KML_DSS_DGETRF_ISA  | 
求解器内部DGETRF选择合适的算子优化分支  | 
NEON\SVE256  | 
通过机型判断  | 
KML_DSS_CGETRF_ISA  | 
求解器内部CGETRF选择合适的算子优化分支  | 
NEON\SVE256  | 
通过机型判断  | 
KML_DSS_ZGETRF_ISA  | 
求解器内部ZGETRF选择合适的算子优化分支  | 
NEON\SVE256  | 
通过机型判断  | 
KML_DSS_DPOTRF_ISA  | 
求解器内部DPOTRF选择合适的算子优化分支  | 
NEON\SVE256  | 
通过机型判断  | 
 通过机型判断指在TaiShan 200 1280、TaiShan 200 2280上默认值为NEON,TaiShan 200 1280 V2;TaiShan 200 2280 V2机器上默认值为SVE256。