鲲鹏社区首页
中文
注册
开发者
我要评分
获取效率
正确性
完整性
易理解
在线提单
论坛求助

安装Gluten

OmniOperator算子加速特性支持Spark引擎,需在管理节点和所有计算节点安装Spark引擎,并配置openEuler操作系统的Gluten依赖。

  1. 安装Spark引擎。请参见操作系统和软件要求

    当前Gluten只支持Spark 3.3.1。可以通过spark-shell --version命令确认当前Spark版本。

  2. 下载Gluten插件包并解压。

    软件安装包获取获取Boostkit-omniruntime-gluten-1.0.0.zip和Dependency_library_Gluten.zip,并上传至管理节点的“/opt/omni-operator/”目录下。

  3. 安装openEuler操作系统的Gluten依赖。
    1. 配置本地Yum源。以openEuler 22.03 LTS SP1为例:
      dnf config-manager --add-repo https://repo.oepkgs.net/openeuler/rpm/openEuler-22.03-LTS-SP1/extras/aarch64/
    2. 安装依赖。
      yum install lz4-devel zstd-devel snappy-devel protobuf-c-devel protobuf-lite-devel boost-devel cyrus-sasl-devel jsoncpp-devel openssl-devel libatomic -y
  4. 配置Gluten。
    1. 将Boostkit-omniruntime-gluten-1.0.0.zip和Dependency_library_Gluten.zip解压到“/opt/omni-operator/lib”
      cd /opt/omni-operator
      unzip BoostKit-omniruntime-gluten-1.0.0.zip
      unzip Dependency_library_Gluten.zip
      unzip BoostKit-omniruntime-omnioperator-2.0.0.zip
      tar -zxvf boostkit-omniop-operator-2.0.0-aarch64-openeuler-sve.tar.gz
      mkdir lib
      mv libboundscheck.so libspark_columnar_plugin.so gluten-omni-bundle-spark3.3_2.12-openEuler_22.03_aarch_64-1.3.0.jar lib
      mv Dependency_library_Gluten/lib* lib/
      mv boostkit-omniop-operator-2.0.0-aarch64/libboostkit-omniop-* lib/
    2. 修改软件安装包中的程序文件权限为550,配置文件目录权限为750,配置文件权限为640。
      chmod -R 550 /opt/omni-operator/*
      chmod 750 /opt/omni-operator/conf
      chmod 640 /opt/omni-operator/conf/omni.conf
  5. 在管理节点的“~/.bashrc”文件中添加如下环境变量。
    1
    2
    echo "export OMNI_HOME=/opt/omni-operator" >> ~/.bashrc
    source ~/.bashrc