安装Gluten
OmniOperator算子加速特性支持Spark引擎,需在管理节点和所有计算节点安装Spark引擎,并配置openEuler操作系统的Gluten依赖。
- 安装Spark引擎。请参见操作系统和软件要求。
当前Gluten只支持Spark 3.3.1。可以通过spark-shell --version命令确认当前Spark版本。
- 下载Gluten插件包并解压。
从软件安装包获取获取Boostkit-omniruntime-gluten-1.0.0.zip和Dependency_library_Gluten.zip,并上传至管理节点的“/opt/omni-operator/”目录下。
- 安装openEuler操作系统的Gluten依赖。
- 配置本地Yum源。以openEuler 22.03 LTS SP1为例:
dnf config-manager --add-repo https://repo.oepkgs.net/openeuler/rpm/openEuler-22.03-LTS-SP1/extras/aarch64/
- 安装依赖。
yum install lz4-devel zstd-devel snappy-devel protobuf-c-devel protobuf-lite-devel boost-devel cyrus-sasl-devel jsoncpp-devel openssl-devel libatomic -y
- 配置本地Yum源。以openEuler 22.03 LTS SP1为例:
- 配置Gluten。
- 将Boostkit-omniruntime-gluten-1.0.0.zip和Dependency_library_Gluten.zip解压到“/opt/omni-operator/lib”。
cd /opt/omni-operator unzip BoostKit-omniruntime-gluten-1.0.0.zip unzip Dependency_library_Gluten.zip unzip BoostKit-omniruntime-omnioperator-2.0.0.zip tar -zxvf boostkit-omniop-operator-2.0.0-aarch64-openeuler-sve.tar.gz mkdir lib mv libboundscheck.so libspark_columnar_plugin.so gluten-omni-bundle-spark3.3_2.12-openEuler_22.03_aarch_64-1.3.0.jar lib mv Dependency_library_Gluten/lib* lib/ mv boostkit-omniop-operator-2.0.0-aarch64/libboostkit-omniop-* lib/
- 修改软件安装包中的程序文件权限为550,配置文件目录权限为750,配置文件权限为640。
chmod -R 550 /opt/omni-operator/* chmod 750 /opt/omni-operator/conf chmod 640 /opt/omni-operator/conf/omni.conf
- 将Boostkit-omniruntime-gluten-1.0.0.zip和Dependency_library_Gluten.zip解压到“/opt/omni-operator/lib”。
- 在管理节点的“~/.bashrc”文件中添加如下环境变量。
1 2
echo "export OMNI_HOME=/opt/omni-operator" >> ~/.bashrc source ~/.bashrc
父主题: 在Gluten上使能