拓展安装(开启ACL加速)
ACL加速是用来优化Arm架构下深度学习等任务性能的功能,若您需要此加速功能请参照本节内容进行安装。安装过程中请根据实际情况替换安装路径。
- 获取ACL源码。
- 解压ACL源码包。
1
tar -xzvf v23.08.tar.gz
- 进入“/path/to/ComputeLibrary-23.08”目录。
1
cd /path/to/ComputeLibrary-23.08
- scons构建。
scons Werror=1 -j8 debug=0 neon=1 opencl=0 os=linux arch=armv8a build=native
- 设置环境变量。
export ACL_ROOT_DIR=/path/to/ComputeLibrary-23.08
- 验证。
- 进入“build”目录。
1
cd build
- 设置环境变量。
1
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/path/to/ComputeLibrary-23.08/build/
- 执行example用例。
1
./examples/neon_cnn
- 进入“build”目录。
- 安装oneDNN,请参见基本安装的安装流程,将步骤7替换为以下命令,完成oneDNN编译安装。
1
cmake -DCMAKE_INSTALL_PREFIX=/path/to/oneDNN-3.3.3/build/install/ -DONEDNN_AARCH64_USE_ACL=ON ..
- 安装完毕后,可通过以下命令查看libdnnl.so是否链接到了ACL库的so。
1
ldd /path/to/oneDNN-3.3.3/build/install/lib64/libdnnl.so
回显如下图所示表示libdnnl.so已经链接到了ACL库的so。
oneDNN 3.3.3与ACL 23.11及更高版本有冲突,若发生编译报错,请检查软件版本是否为指定版本:oneDNN为3.3.3版本时对应ACL应该为23.08及以下版本。
父主题: 源码编译安装