更新说明
大数据算法加速库兼容Spark原生API,对机器学习和图分析算法进行了性能优化,大幅提升了大数据算法场景的计算性能,该库支持鲲鹏处理器的体系架构,1.2.0版本提供的算法有:
- 机器学习算法
- GBDT(Gradient Boosting Decision Tree,梯度提升决策树)
- RF(Random Forest,随机森林)
- SVM(Support Vector Machines,支持向量机)
- Kmeans(K-means Clustering,K-平均算法)
- DecisionTree(决策树算法)
- LinearRegression(线性回归)
- Logistic Regression(逻辑回归)
- PCA(Principle Component Analysis,主成分分析)
- SVD(Singular Value Decomposition,奇异值分解)
- LDA(Latent Dirichlet Allocation,潜在狄利克雷分布)
- ALS(Alternating Least Squares,交替最小二乘法)
- PrefixSpan(Prefix-Projected Pattern Growth,前缀投影的模式挖掘)
- KNN(K-Nearest Neighbors,K最近邻算法)
- Covariance(协方差算法)
- DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)
- Pearson(皮尔逊相关系数)
- Spearman(斯皮尔曼等级相关系数)
- XGBoost(极端梯度提升算法)
- 图分析算法
- MCE(Maximal Clique Enumeration,极大团)
- WCE(Weak Clique Enumeration,弱团)
- Modularity(模块度)
- TC(Triangle Count,三角形计数)
- MSSP(Multiple Sources Shortest Path,多源最短路径)
- PageRank(网页排名)
- SCC(Strongly Connected Components,强联通分量)
- Louvain(基于模块度的社区发现算法)
- LPA(Label Propagation Algorithm,标签传播)
- Closeness(紧密中心性)
- CD(Cycle Detection,环路检测)
- CC(Connected Components,连通分量)
- KCore(K-Core Decomposition)
- Degree(Degree Centrality,度中心性)
- BFS(Breadth-First-Search,广度优先搜索)
- ClusteringCoefficient(聚集系数)
- TrustRank(信任指数排名)
- PPR(PersonalizedPageRank,个性化网页排名)
- Betweenness(介数中心性)
- Node2Vec
- SubgraphMatching(子图匹配)
父主题: V1.3.0