鲲鹏社区首页
中文
注册
鲲鹏BoostKit搜推广使能套件

鲲鹏BoostKit搜推广使能套件

鲲鹏BoostKit搜推广使能套件旨在为互联网的搜索、推荐、广告业务场景提供基于鲲鹏平台的全栈解决方案的加速能力,组件涵盖召回场景核心检索算法、排序场景模型推理TensorFlow框架软件全栈及其AI核心算子库等。

适配层:

  • 召回场景:基于鲲鹏920系列处理器完成开源ScaNN检索算法兼容适配,提供迁移指南
  • 排序推理场景:基于鲲鹏920系列处理器完成开源TensorFlow、Pytorch和oneDNN等软件兼容适配,提供迁移指南


场景化使能套件:

  • 召回图检索算法KBest:通过查询感知、图重排等算法优化,结合向量化指令、汇编、预取等硬件优化,实现整机性能持平
  • 召回向量检索算法KScaNN:通过动态库内联、低比特量化、检索算子、向量化指令等优化,实现整机性能持平
  • 召回向量检索算法库加速组件KVecturbo:通过高维向量量化压缩、 SIMD指令集加速距离计算等优化,实现整机性持平
  • TensorFlow算子加速KTFOP:提供基于鲲鹏920系列处理器的推理模型部署指导文档


基础加速库:

  • 鲲鹏推理AI算子库:通过鲲鹏向量化指令、预取等手段实现Matmul、Conv等核心算子优化,对接开源oneDNN提供完整能力,实现性能提升10%
  • 鲲鹏数学库KML:提供GEMM、GEMV等数学接口,涵盖BLAS、Libm、FFT等基础数学库


基础软件:

  • OS:适配openEuler操作系统
  • 编译器:GCC动态库内联、自动矢量化等


应用场景
搜索
注重用户主动输入的关键词,以相关性为核心,帮助用户找到明确的信息
推荐
依赖于用户的历史行为和兴趣画像,提供个性化的内容或商品推荐
广告
一种商业信息传播手段,通过多种渠道和形式向目标受众传递信息,其中搜索和推荐广告分别利用搜索和推荐技术来实现精准投放,将用户流量变现

搜推广加速特性

鲲鹏召回算法库
鲲鹏召回算法库SRA_Recall是华为提供的基于鲲鹏平台优化的召回算法库。
暂无评分
我要评分
KBest(Kunpeng Blazing-fast embedding similarity search thruster)鲲鹏图检索算法,是鲲鹏自研的高效的图检索算法。通过量化、向量指令等方法优化了最近邻搜索的性能和精度,用于多维向量近似最近邻搜索。
查看文档
功能特性
提供对标开源Faiss HNSW算法的检索能力。
关键技术
采用鲲鹏硬件的向量化指令、量化等技术。
使用场景
网络搜索、多模态搜索、推荐系统和RAG等场景。

开源使能

分类
组件版本号操作系统源码包获取移植指南
oneDNN
3.3.3
openEuler 22.03 LTS SP3v3.3.3.tar.gzoneDNN 移植指南
PyTorch
2.1.2
openEuler 22.03 LTS SP3v2.1.2.tar.gzPyTorch 移植指南
TensorFlow
1.15.5
2.13.0
openEuler 22.03 LTS SP3v2.13.0.zipv1.15.5.zipTensorFlow 移植指南
TensorFlow Serving
2.15.0
openEuler 22.03 LTS SP32.15.0-rc0.tar.gzTensorFlow Serving推理部署框架 移植指南
TVM
0.9.0
openEuler 22.03 LTS SP3apache-tvm-src-v0.9.0.tar.gzTVM 移植指南

性能评估

分类
组件版本号操作系统源码包获取测试指导
搜推模型推理性能Benchmark
1.0.0
openEuler 22.03 LTS SP3
-
测试指导