OmniOperator算子加速关于UDF的所需文件需用户提供相关JAR包和配置文件,包括udf.zip、conf.zip和udf.properties,其中udf.zip包含所有UDF的class文件,conf.zip包含UDF所依赖的配置文件,udf.properties是OmniOperator算子加速 UDF配置文件,以udfName1和udfName2函数为例,udf.properties内容格式如下。
udfName1 com.huawei.udf.UdfName1 udfName2 com.huawei.udf.UdfName2
下述步骤需在管理节点和所有计算节点操作。
mkdir /opt/omni-operator/hive-udf
unzip udf.zip rm -f udf.zip unzip conf.zip rm -f conf.zip
vim /opt/omni-operator/conf/omni.conf
# <----UDF properties----> #false表示使用表达式行处理,true表示使用表达式批处理 enableBatchExprEvaluate=false #UDF白名单文件路径 hiveUdfPropertyFilePath=/opt/omni-operator/hive-udf/udf.properties #Hive UDF JAR所在目录路径 hiveUdfDir=/opt/omni-operator/hive-udf/udf
vim ~/.bashrc
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:${JAVA_HOME}/jre/lib/aarch64/server
source ~/.bashrc
上述udf.zip、conf.zip等压缩包名称用户根据自己实际情况可进行自定义,本处仅提供示例。
在行处理安装的基础之上,在管理节点和所有计算节点执行以下步骤:
更新omni.conf中的配置内容。
vim /opt/omni-operator/conf/omni.conf
enableBatchExprEvaluate=true