鲲鹏社区首页
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助

软件架构

机器学习算法加速库提供了与原生Spark MLlib相同的接口,算法库由BoostKit-ML-Kernel核心算法实现包,以及对接原生Spark接口的机器学习的ML-API-Patch代码组成。

如上图所示,机器学习算法加速库开源Patch包和闭源Kernel包对应JAR包如表1所示。

表1 机器学习算法加速库对应JAR包

机器学习算法加速库

对应JAR包

ML-API-Patch(开源)

  • boostkit-ml-core_2.11-2.2.0-spark2.3.2.jar
  • boostkit-ml-acc_2.11-2.2.0-spark2.3.2.jar
  • boostkit-xgboost4j_2.11-2.2.0.jar
  • boostkit-xgboost4j-spark2.3.2_2.11-2.2.0.jar

BoostKit-ML-Kernel(闭源)

  • boostkit-ml-kernel_2.11-2.2.0-spark2.3.2-aarch64.jar
  • boostkit-xgboost4j-kernel-2.11-2.2.0-spark2.3.2-aarch64.jar
  • libboostkit_xgboost_kernel.so

本指南中均以基于Spark 2.3.2版本的BoostKit算法包为例,其他版本的算法包的使用与之相同,可参考本指南。