测试运行
- 进入到生成的二进制目录。
cd ${BIN_PATH}
- 加载gcc版本环境变量,请参考《Kunpeng HPCKit 26.0.RC1 安装指南》中“安装卸载HPCKit > 设置环境变量 > 设置环境变量(setvars.sh方式) ”。
设置BLAS的并行执行线程数为4。
export OMP_NUM_THREADS=4
export OMP_PROC_BIND=close: 运行时会对创建的线程以及主线程按照整体亲和性依次进行绑核,一个线程固定在一个核上。
export OMP_PROC_BIND=close
- 使用的时候,执行对应的数据类型【s/d/c/z】和对应的level【1/2/3】的二进制文件。在后面跟对应的参数即可得到结果,例如:
taskset -c 1-36 ./xdl3blastst -R gemm -m 4096 -n 9216 -k 4096 -T 0 -F 1000000
此处调用的为数据类型为double【d】的level3接口,接口名为dgemm,计算的规模为m=4096,n=9216,k=4096,只测试接口性能。
- 查看回显,得到的结果如图,图中需要关注的结果为红框的结果,代表库中dgemm的算力。测试结果在 400000MFLOP 左右说明执行成功。

- 使用`./xdl3blastst -h`可以查看各种参数。

父主题: DGEMM测试