算法技术介绍
图分析是指对图数据进行高效的关联发现与分析的一种技术。图数据由节点(即个体)与边(即个体之间的联系)构成,图的形式虽然简洁,但是对信息的表达能力却非常强。随着万物互联时代到来,围绕人与人、人与物、物与物之间关联关系的数据呈爆炸式增长,数据表达形式从表格化向图网络演进,而以研究人、事、物之间关联关系的图分析技术已成为主流。
图1 由点(个体)和边(关系)组成的图

图算法在金融、运营商、政府、交通、能源等多个行业有广泛的应用,例如朋友圈发现、人群流量预测、理财产品推荐等。
什么情况下需要使用图分析技术?
- 需要在亿级、甚至百亿量级进行关系洞察和关联分析。
- 需要关联客户、产品、工商、资金流水等多维度数据综合分析。
- 偏探索、预测类的场景更需要图数据支持。
图分析技术在各行各业中广泛被使用,例如抖音、快手等短视频APP中,我们总能收到一、二或三度联系人的好友推荐,Facebook、腾讯和Twitter都使用图分析了解用户之间的相互关系等等。
在客户端到端数据分析中,由ISV针对采集的数据进行数据预处理,例如针对原始航班信息输出图结构数据的结果信息;鲲鹏BoostKit图分析算法加速库实现图数据建模,执行算法逻辑,例如根据同航班图结构数据的输入,算法做亲密度建模,实现亲密圈的挖掘,输出的亲密圈结果存储到客户指定的检索数据库中,由客户对结果数据进行检索,实现结果可视化。
图分析算法加速库提供以下算法优化,后续版本会持续更新增加算法。
- 中心性分析:PageRank、Betweenness
- 路径分析:MSSP
- 社团挖掘:MCE
父主题: 算法库介绍