准备开发环境
客户端开发环境要求
客户端开发环境要求如表1所示。
软件获取
机器学习算法加速库软件包的获取方式如表2所示。
适配Spark版本 |
软件包及获取链接 |
说明 |
---|---|---|
Spark 2.3.2/2.4.5/2.4.6/3.1.1 |
NA |
|
Spark 2.3.2 |
boostkit-ml-acc_2.11-2.2.0-spark2.3.2.jar boostkit-ml-core_2.11-2.2.0-spark2.3.2.jar boostkit-ml-kernel-client_2.11-2.2.0-spark2.3.2.jar |
|
boostkit-xgboost4j_2.11-2.2.0.jar boostkit-xgboost4j-spark2.3.2_2.11-2.2.0.jar |
||
Spark 2.4.5/2.4.6 |
boostkit-ml-acc_2.11-2.2.0-spark2.4.6.jar boostkit-ml-core_2.11-2.2.0-spark2.4.6.jar boostkit-ml-kernel-client_2.11-2.2.0-spark2.4.6.jar |
|
boostkit-xgboost4j_2.11-2.2.0.jar boostkit-xgboost4j-spark2.4.6_2.11-2.2.0.jar |
||
Spark 3.1.1 |
boostkit-ml-acc_2.12-2.2.0-spark3.1.1.jar boostkit-ml-core_2.12-2.2.0-spark3.1.1.jar boostkit-ml-kernel-client_2.12-2.2.0-spark3.1.1.jar |
集群环境要求
项目 |
要求 |
---|---|
OS |
openEuler-20.03-LTS-SP1 |
JDK |
BiSheng JDK 1.8.0_262 |
ZooKeeper |
3.4.9 |
Hadoop |
3.1.1 |
Spark |
Apache Spark 2.3.2、2.4.5、2.4.6或3.1.1 |

当前鲲鹏算法库兼容Spark 2.3.2、Spark 2.4.5、Spark 2.4.6、Spark 3.1.1版本,其他平台暂未验证,基于安全诉求,建议使用高版本。