环境介绍
物理环境组网
集群规划的环境由五台服务器组成,分别是客户端(1台)、控制节点(1台)、计算节点(3台),组网图如图1所示。其中控制节点作为大数据集群的server端,计算节点分别是大数据集群的agent1、agent2和agent3。在POC测试场景下,客户端可部署在控制节点上。
硬件要求
硬件要求如表1所示。
操作系统和软件要求
操作系统和软件要求如表2所示。
项目 |
说明 |
---|---|
OS |
openEuler 22.03 LTS SP1 |
JDK |
BiSheng JDK 1.8.0_342 |
ZooKeeper |
3.6.2 |
Hadoop |
3.2.0 |
Spark |
Spark 3.3.1 |

机器学习算法加速库 适配Spark 3.1.1,支持SVM、DBSCAN、DTB、Word2Vec这4个算法。- 其他2.X、3.X版本技术上兼容,根据需求适配。
父主题: 调优概述