在安全模式下,针对ORC和Parquet数据集,通过调整SparkExtension插件启动参数可优化性能。
1 | --conf spark.sql.codegen.wholeStage=true --conf spark.omni.sql.columnar.nativefilescan=true --conf spark.omni.sql.columnar.orcNativefilescan=false |
1 | --conf spark.sql.codegen.wholeStage=false --conf spark.omni.sql.columnar.nativefilescan=false --conf spark.omni.sql.columnar.orcNativefilescan=false |
3TB数据集的TPCDS 99性能测试结果表明,安全模式下完全关闭Native ORC对比非安全模式下Native ORC的平均性能损耗约为17%。
安全模式下Native Parquet对比非安全模式下Native Parquet的平均性能损耗约为5%。