EN
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助

简介

  • 您同意在使用机器学习算法加速库时,遵守国家法律法规、社会公共道德。您不得利用机器学习算法加速库从事任何违法、侵犯他人权益等扰乱社会秩序、破坏社会稳定的行为,亦不得利用机器学习算法加速库从事任何危害或试图危害计算机系统及网络安全的活动。
  • 您知悉并确认,对于依赖机器学习算法加速库处理结果所作出的判断需您自行承担相关风险。机器学习算法加速库按现状提供,在适用法律允许的范围内,华为对机器学习算法加速库不作任何类型的担保,不论是明示的或暗示的,包括但不限于其真实性、适用性、非侵权性和安全性。
  • 您同意华为不应对间接、附带、特殊或任何形式的惩罚性赔偿承担任何责任,也不应对任何利润、收入、数据、数据使用的损失承担任何责任。

Apache Spark是用于大规模数据处理的统一分析引擎,具有可伸缩、基于内存计算等特点,已经成为轻量级大数据快速处理的统一平台,各种不同的应用,如实时流处理、机器学习、交互式查询等,都可以通过Spark建立在不同的存储和运行系统上。更多关于Spark信息请参见官网Spark

机器学习算法加速库是经过优化的算法库,兼容Spark原生API,对机器学习算法进行了性能优化,大幅提升了大数据算法场景的计算性能,该库支持鲲鹏处理器的体系架构,目前新版本为1.2.0,提供的机器学习算法如下:

  • GBDT(Gradient Boosting Decision Tree,梯度提升决策树)
  • RF(Random Forest,随机森林)
  • SVM(Support Vector Machines,支持向量机)
  • Kmeans(K-means Clustering,K-平均算法)
  • DecisionTree(决策树算法)
  • LinearRegression(线性回归)
  • Logistic Regression(逻辑回归)
  • PCA(Principle Component Analysis,主成分分析)
  • SVD(Singular Value Decomposition,奇异值分解)
  • LDA(Latent Dirichlet Allocation,潜在狄利克雷分布)
  • PrefixSpan(Prefix-Projected Pattern Growth,前缀投影的模式挖掘)
  • ALS(Alternating Least Squares,交替最小二乘法)
  • KNN(K-Nearest Neighbors,K近邻算法)