更新说明
大数据算法加速库兼容Spark开源版本API,对机器学习算法进行了性能优化,大幅提升了大数据算法场景的计算性能,该库支持鲲鹏处理器的体系架构,1.2.0版本提供的算法有:
- 机器学习算法
- GBDT(Gradient Boosting Decision Tree,梯度提升决策树)
- RF(Random Forest,随机森林)
- SVM(Support Vector Machines,支持向量机)
- Kmeans(K-means Clustering,K-平均算法)
- DecisionTree(决策树算法)
- LinearRegression(线性回归)
- Logistic Regression(逻辑回归)
- PCA(Principle Component Analysis,主成分分析)
- SVD(Singular Value Decomposition,奇异值分解)
- LDA(Latent Dirichlet Allocation,潜在狄利克雷分布)
- ALS(Alternating Least Squares,交替最小二乘法)
- PrefixSpan(Prefix-Projected Pattern Growth,前缀投影的模式挖掘)
- KNN(K-Nearest Neighbors,K最近邻算法)
父主题: V1.2.0