鲲鹏社区首页
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助

特性清单

算法类型

算法名称

算法描述

约束

召回算法

KScaNN

基于倒排索引,结合鲲鹏架构深度优化索引布局、算法流程和计算流程,充分挖掘芯片潜力形成的向量检索算法。

  • 处理器:鲲鹏920 7282C处理器
  • 操作系统支持:openEuler 22.03 LTS SP3
  • 编译器支持:GCC 12.3
  • 性能指标:整机性能对比开源ScaNN算法提升130%。

KBest

通过量化、NUMA访存调度等方法优化了最近邻搜索的性能和精度,用于多维向量近似最近邻搜索。

  • 处理器:鲲鹏920 7282C处理器
  • 操作系统支持:openEuler 22.03 LTS SP3
  • 编译器支持:GCC 10.3
  • 性能指标:整机性能对比开源HNSW提升60%。

KVecturbo

通过将高维向量量化压缩,快速获取query的近邻,同时使用SIMD指令集加速距离计算,用于多维向量最近邻搜索。

  • 处理器:鲲鹏920 7282C处理器
  • 操作系统支持:openEuler 22.03 LTS SP3
  • 编译器支持:GCC 10.3
  • 性能指标:整机性能对比开源提升30%。

排序AI推理算子库

KAIL_DNN

用于AI框架的加速算子库。

  • 处理器:鲲鹏920 7282C处理器
  • 操作系统支持:openEuler 22.03 LTS SP3
  • 编译器支持:GCC 10.3
  • 支持算子:Convolution类、Eltwise类、Inner Product类、Reduction类、Layer Normalization类、PReLU类、Matmul类、Softmax类、Sum类、Reorder、Resampling、Concat类、Shuffle
  • 支撑单线程和多线程模式。
  • 性能指标:平均性能(单核、单NUMA、单P、整机)达成0.6x。

KAIL_DNN_EXT

使用Cython框架,向用户提供Python接口,更容易嵌入用户场景。

  • 处理器:鲲鹏920 7282C处理器
  • 操作系统支持:openEuler 22.03 LTS SP3
  • 编译器支持:GCC 10.3
  • 支持算子:random_choice算子、softmax算子
  • 性能指标:对比开源提升10%以上。

KTFOP

用于TensorFlow的核心算子库。

  • 处理器:鲲鹏920 7282C处理器
  • 操作系统支持:openEuler 22.03 LTS SP3
  • 编译器支持:GCC 10.3
  • 支持算子:Select算子、Less算子、Greater算子、FloorMod算子、Matmul算子、LookupTableFind算子
  • 性能指标:对比开源提升20%。

以上算法特性及性能指标的测试结果均基于上表中所约束操作系统和编译器版本,未在其他系统或编译器环境下进行验证。