鲲鹏社区首页
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助

聚类

场景介绍

聚类的用途是很广泛的。在商业上,聚类可以帮助市场分析人员从消费者数据库中区分出不同的消费群体来,并且概括出每一类消费者的消费模式或者说习惯。例如,当K-means等算法对样本中的两个向量做距离度量时,过高的维度将导致参与计算的数据量过于庞大,从而引发计算资源消耗严重的问题。基于鲲鹏架构的硬件优势,在访存时延优化方面,鲲鹏BoostKit充分利用鲲鹏Cache(高速缓存)块特点,通过保持访存和计算的连续性,有效提升Cache命中率,降低时延。

DBSCAN算法原理

DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类算法)是一种基于密度的空间聚类算法,该算法要求聚类空间中一定区域内所包含对象的数目不小于某一给定阈值,该算法能够有效处理噪声点,并发现任意形状的空间聚类。