鲲鹏社区首页
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助

概述

基于大数据算法加速库运行机器学习算法不仅需要从support上下载发布的二进制压缩包,并从中解压得到的机器学习分析算法加速库包如表1中BoostKit-ML-Kernel对应JAR包所示,还需要由机器学习算法加速库开源适配代码编译而来的开源包,如表1中ML-API-Patch对应JAR包所示。

编译的输出件清单如表1所示。

表1 输出件清单

输出件

说明

获取方式

boostkit-xgboost4j_2.11-2.2.0.jar

XGBoost算法所需算法适配包,可由开源适配代码编译而来。

编译获得,详情请参见编译代码

boostkit-xgboost4j-spark2.3.2_2.11-2.2.0.jar

boostkit-ml-acc_2.11-2.2.0-spark2.3.2.jar

  • 除XGBoost之外的机器学习算法所需算法适配包。
  • boostkit-ml-kernel-client_2.11-2.2.0-spark2.3.2.jar是应用开发时的依赖库,不需要部署在Spark集群,仅在开发阶段为编译提供依赖。

boostkit-ml-core_2.11-2.2.0-spark2.3.2.jar

boostkit-ml-kernel-client_2.11-2.2.0-spark2.3.2.jar

本指南中均以基于Spark 2.3.2版本的BoostKit算法包为例,其他版本的算法包的使用与之相同,可参考本指南。