应用场景

OmniShuffle Shuffle加速组件特性支持Shuffle密集型作业场景和大数据场景,支持Spark 3.1.1、Spark 3.3.1引擎。

Shuffle应用模式选择RSS模式或ESS模式可根据具体业务场景选择:

Shuffle应用模式在业务规模较大且计算节点资源有限,可靠性要求高的场景下使用RSS模式。

  • 建议使用RDMA网络,且网络带宽越高效能越好。
  • Spark本身具有一套插件机制,开发者可以通过实现Spark的插件接口替换Spark原有功能。