Milvus KScaNN算法优化
应用场景:追求高精度下的高性能。
技术原理:ScaNN(Scalable Nearest Neighbors)是由Google发布的高效向量相似性检索开源算法库,基于IVFPQ原理,通过x86上的4bit SIMD深度优化和各向异性量化损失函数优化,实现了极高的检索性能。KScaNN(Kunpeng Scalable Nearest Neighbors)是ScaNN算法移植到ARM平台后的产物,并基于倒排索引,结合鲲鹏架构深度优化索引布局、算法流程和计算流程,充分挖掘出了芯片潜力。它采用鲲鹏硬件的向量化指令、量化等技术,提供对标开源ScaNN的完整检索能力。
性能指标:在16U64G规格上,Milvus-KScaNN算法在ann-benchmarks Gist数据集且recall值在0.99以上的场景,QPS(Query Per Second,每秒查询数)性能相较于Milvus-ScaNN算法可获得30%的提升。
图1 优化特性使能前后性能对比


如何使用:通过patch文件形式提供,该patch文件基于开源Milvus 2.4.5、Knowhere 2.3.5编译安装部署。
父主题: 方案特性