鲲鹏社区首页
中文
注册
开发者
我要评分
获取效率
正确性
完整性
易理解
在线提单
论坛求助

测试运行

  1. 进入到生成的二进制目录。

    cd ${BIN_PATH}

  2. 加载gcc版本环境变量,请参考《Kunpeng HPCKit 26.0.RC1 安装指南》中“安装卸载HPCKit > 设置环境变量 > 设置环境变量(setvars.sh方式) ”。

    设置BLAS的并行执行线程数为4。

    export OMP_NUM_THREADS=4

    export OMP_PROC_BIND=close: 运行时会对创建的线程以及主线程按照整体亲和性依次进行绑核,一个线程固定在一个核上。

    export OMP_PROC_BIND=close

  3. 使用的时候,执行对应的数据类型【s/d/c/z】和对应的level【1/2/3】的二进制文件。在后面跟对应的参数即可得到结果,例如:

    taskset -c 1-36 ./xdl3blastst -R gemm -m 4096 -n 9216 -k 4096 -T 0 -F 1000000

    此处调用的为数据类型为double【d】的level3接口,接口名为dgemm,计算的规模为m=4096,n=9216,k=4096,只测试接口性能。

  4. 查看回显,得到的结果如图,图中需要关注的结果为红框的结果,代表库中dgemm的算力。测试结果在 400000MFLOP 左右说明执行成功。

  5. 使用`./xdl3blastst -h`可以查看各种参数。