概述
算法API主要介绍了Boostkit机器学习算法库所有算法的接口的功能、输入输出和使用样例。
原生算法接口参数意义参考官网链接,不同版本的缺省值可能有区别。

- 机器学习算法的接口参数和非新增算法参数取值范围皆遵循Spark惯例,使用时请注意参数取值范围,不适当的参数取值可能会导致该Spark任务异常退出。
- 接口适用性说明:
- 本算法接口适用于基于鲲鹏服务器的HDP大数据平台,其中Java开发环境要求1.8及以上版本,Spark开发环境包含2.3.2、2.4.5/2.4.6、3.1.1版本,最低的HDP版本是3.1.0。
- 本算法运行在HDP大数据平台需部署的组件需要包括:HDFS、Spark、Yarn、ZooKeeper。
- 鲲鹏BoostKit机器学习算法加速库Spark 2.4.6采用了与Spark 2.3.2相同的核心代码,因此算法的结果与原生Spark 2.3.2结果保持一致,可能与原生Spark 2.4.6不一致(例如DTB),具体取决于开源Spark 2.3.2与Spark 2.4.6之前是否有功能性变化。
父主题: 算法API