EN
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助

开发流程

开发流程机器学习算法加速库开发流程中各个阶段的说明如表1所示。

表1 机器学习算法加速库开发流程说明

阶段

说明

了解基本概念

在开始开发应用前,需要了解机器学习算法的基本概念,根据实际场景选择需要了解的概念,分为Spark Core、机器学习算法和Spark算法库的基本概念。

准备开发环境

机器学习算法支持使用Scala、Java、Python和R四种语言进行开发。本文以Scala为例,使用IDEA工具,完成开发环境的配置。

新建工程

用户可以根据指导,新建一个Spark机器学习算法工程。

根据场景开发程序

用户可以根据自己的业务场景选择合适的机器学习或图算法进行开发,本文以GBDT算法为例完成机器学习算法的开发。

提交任务并运行

指导用户将开发好的程序提交至集群运行。

查看程序运行结果

程序运行结果打印输出,用户还可以通过UI查看应用运行情况。