在Spark引擎上的应用
- Spark简介
- 安装Spark引擎
OmniData算子下推特性支持Spark引擎,使用OmniData算子下推特性前应先安装Spark引擎,并在Spark引擎中添加OmniData算子下推参数。
- 执行Spark引擎业务
使用Tpch 1T数据的非分区表作为测试表,测试SQL为tpch-sql6,示例执行Spark 3.1.1引擎业务。
- (可选)安装Spark/Hive UDF插件
如需使用特定的数据处理操作,可使用UDF函数下推到OmniData算子下推服务时,需安装UDF依赖包、配置Hive UDF插件等步骤,请根据实际情况上传UDF的JAR包。