环境变量
以下环境变量会被KML_BLAS使用。
环境变量名 |
变量意义 |
有效值 |
默认值 |
|---|---|---|---|
BLAS_VERBOSE |
告警等级,如果该值大于0,则会输出info信息,如果该值大于1,则会输出info和debug信息 |
整数 |
0 |
BLAS_THREAD_TIMEOUT |
循环等待时间,设置用于PTHREAD多线程后端模式下线程间数据同步等待的最大时间 |
4~30 |
0 |
BLAS_NUM_THREADS |
BLAS内置线程数,用于设置BLAS的并执行线程数,优先级高于'OMP_NUM_THREADS' |
整数 |
0 |
OMP_NUM_THREADS |
OMP内置线程数,用于设置BLAS的并执行线程数 |
整数 |
0 |
BLAS_JC_NT |
用于设置多线程场景下矩阵操作时n方向切分块策略,其中'BLAS_JC_NT '与'BLAS_IC_NT'的乘积必须等于设置的线程数,否则将使用默人的分块策略 |
整数 |
0 |
BLAS_IC_NT |
于设置多线程场景下矩阵操作时m方向切分块策略 其中'BLAS_JC_NT '与'BLAS_IC_NT'的乘积必须等于设置的线程数,否则将使用默人的分块策略 |
整数 |
0 |
BLAS_NUMA_THREADS |
单numa的核数设置,用于在PTHREAD多线程后端模式下线程的numa亲和性 |
正整数 |
0 |
KML_BLAS_THREAD_TYPE |
线程管理后端方式 |
PTHREAD\OMP\KUPL |
OMP |
SGEMM_P |
单精度浮点类型gemm的m方向切分块大小,只在鲲鹏920 7270、7280上有效 |
正整数,鲲鹏920 7270、7280上必须为48的整倍数,SGEMM_P*SGEMM_Q*4*2 ≤ 37748736 |
128 |
SGEMM_Q |
单精度浮点类型gemm的k方向切分块大小,只在鲲鹏920 7270、7280上有效 |
正整数,鲲鹏920 7270、7280上必须为48的整倍数,SGEMM_P*SGEMM_Q*8*2 ≤ 37748736 |
512 |
SGEMM_R |
单精度浮点类型gemm的n方向切分块大小,只在鲲鹏920 7270、7280上有效 |
正整数,鲲鹏920 7270、7280上必须为48的整倍数,SGEMM_Q*SGEMM_R*4*2 ≤ 37748736 |
4096 |
DGEMM_P |
双精度浮点类型gemm的m方向切分块大小,只在鲲鹏920 7270、7280上有效 |
正整数,鲲鹏920 7270、7280上必须为24的整倍数,SGEMM_Q*SGEMM_R*8*2 ≤ 37748736 |
128 |
DGEMM_Q |
双精度浮点类型gemm的k方向切分块大小,只在鲲鹏920 7270、7280上有效 |
正整数,鲲鹏920 7270、7280上必须为24的整倍数,SGEMM_Q*SGEMM_R*8*2 ≤ 37748736 |
512 |
DGEMM_R |
双精度浮点类型gemm的n方向切分块大小,只在鲲鹏920 7270、7280上有效 |
正整数,鲲鹏920 7270、7280上必须为24的整倍数,SGEMM_Q*SGEMM_R*8*2 ≤ 37748736 |
4096 |
CGEMM_P |
单精度复数类型gemm的m方向切分块大小,只在鲲鹏920 7270、7280上有效 |
正整数,鲲鹏920 7270、7280上必须为8的整倍数,SGEMM_Q*SGEMM_R*8*2 ≤ 37748736 |
64 |
CGEMM_Q |
单精度复数类型gemm的k方向切分块大小,只在鲲鹏920 7270、7280上有效 |
正整数,鲲鹏920 7270、7280上必须为8的整倍数,SGEMM_Q*SGEMM_R*8*2 ≤ 37748736 |
512 |
CGEMM_R |
单精度复数类型gemm的n方向切分块大小,只在鲲鹏920 7270、7280上有效 |
正整数,鲲鹏920 7270、7280上必须为8的整倍数,SGEMM_Q*SGEMM_R*8*2 ≤ 37748736 |
4096 |
ZGEMM_P |
双精度复数类型gemm的m方向切分块大小,只在鲲鹏920 7270、7280上有效 |
正整数,鲲鹏920 7270、7280上必须为8的整倍数,SGEMM_Q*SGEMM_R*16*2 ≤ 37748736 |
64 |
ZGEMM_Q |
双精度复数类型gemm的k方向切分块大小,只在鲲鹏920 7270、7280上有效 |
正整数,鲲鹏920 7270、7280上必须为8的整倍数,SGEMM_Q*SGEMM_R*16*2 ≤ 37748736 |
320 |
ZGEMM_R |
双精度复数类型gemm的n方向切分块大小,只在鲲鹏920 7270、7280上有效 |
正整数,鲲鹏920 7270、7280上必须为8的整倍数,SGEMM_Q*SGEMM_R*16*2 ≤ 37748736 |
2048 |