鲲鹏BoostKit搜推广使能套件
鲲鹏BoostKit搜推广使能套件旨在为互联网的搜索、推荐、广告业务场景提供基于鲲鹏平台的全栈解决方案的加速能力,组件涵盖召回场景核心检索算法、排序场景模型推理TensorFlow框架软件全栈及其AI核心算子库等。

适配层:
- 召回场景:基于鲲鹏920系列处理器完成开源ScaNN检索算法兼容适配,提供迁移指南
- 排序推理场景:基于鲲鹏920系列处理器完成开源TensorFlow、Pytorch和oneDNN等软件兼容适配,提供迁移指南
场景化使能套件:
- 召回图检索算法KBest:通过查询感知、图重排等算法优化,结合向量化指令、汇编、预取等硬件优化,实现整机性能持平
- 召回向量检索算法KScaNN:通过动态库内联、低比特量化、检索算子、向量化指令等优化,实现整机性能持平
- 召回向量检索算法库加速组件KVecturbo:通过高维向量量化压缩、 SIMD指令集加速距离计算等优化,实现整机性持平
- TensorFlow算子加速KTFOP:提供基于鲲鹏920系列处理器的推理模型部署指导文档
基础加速库:
- 鲲鹏推理AI算子库:通过鲲鹏向量化指令、预取等手段实现Matmul、Conv等核心算子优化,对接开源oneDNN提供完整能力,实现性能提升10%
- 鲲鹏数学库KML:提供GEMM、GEMV等数学接口,涵盖BLAS、Libm、FFT等基础数学库
基础软件:
- OS:适配openEuler操作系统
- 编译器:GCC动态库内联、自动矢量化等
应用场景
搜索
注重用户主动输入的关键词,以相关性为核心,帮助用户找到明确的信息
推荐
依赖于用户的历史行为和兴趣画像,提供个性化的内容或商品推荐
广告
一种商业信息传播手段,通过多种渠道和形式向目标受众传递信息,其中搜索和推荐广告分别利用搜索和推荐技术来实现精准投放,将用户流量变现
搜推广加速特性
鲲鹏召回算法库
鲲鹏召回算法库SRA_Recall是华为提供的基于鲲鹏平台优化的召回算法库。
KBest(Kunpeng Blazing-fast embedding similarity search thruster)鲲鹏图检索算法,是鲲鹏自研的高效的图检索算法。通过量化、向量指令等方法优化了最近邻搜索的性能和精度,用于多维向量近似最近邻搜索。
功能特性
提供对标开源Faiss HNSW算法的检索能力。
关键技术
采用鲲鹏硬件的向量化指令、量化等技术。
使用场景
网络搜索、多模态搜索、推荐系统和RAG等场景。
开源使能
分类
组件 | 版本号 | 操作系统 | 源码包获取 | 移植指南 |
---|---|---|---|---|
oneDNN | 3.3.3 | openEuler 22.03 LTS SP3 | v3.3.3.tar.gz | oneDNN 移植指南 |
PyTorch | 2.1.2 | openEuler 22.03 LTS SP3 | v2.1.2.tar.gz | PyTorch 移植指南 |
TensorFlow | 1.15.5 2.13.0 | openEuler 22.03 LTS SP3 | v2.13.0.zipv1.15.5.zip | TensorFlow 移植指南 |
TensorFlow Serving | 2.15.0 | openEuler 22.03 LTS SP3 | 2.15.0-rc0.tar.gz | TensorFlow Serving推理部署框架 移植指南 |
TVM | 0.9.0 | openEuler 22.03 LTS SP3 | apache-tvm-src-v0.9.0.tar.gz | TVM 移植指南 |