鲲鹏社区首页
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助

鲲鹏BoostKit搜推广使能套件

鲲鹏BoostKit搜推广使能套件旨在为互联网的搜索、推荐、广告业务场景提供基于鲲鹏平台的全栈解决方案的加速能力,组件涵盖召回场景核心检索算法、排序场景模型推理TensorFlow框架软件全栈及其AI核心算子库等。

成长地图

由浅入深,带您玩转鲲鹏BoostKit搜推广使能套件

了解

鲲鹏BoostKit搜推广使能套件旨在为互联网的搜索、推荐、广告场景提供基于鲲鹏平台的全栈解决方案的加速能力。

加速特性

鲲鹏AI库

鲲鹏AI库KAIL(Kunpeng Artificial Intelligence Library)是华为提供的基于鲲鹏平台优化的高性能AI算子库,主要完成深度神经网络算子库(KAIL_DNN)和拓展算子库(KAIL_DNN_EXT)的优化。

鲲鹏召回算法库

鲲鹏召回算法库,简称:SRA_Recall,是华为提供的基于鲲鹏平台优化的召回算法库。由鲲鹏图检索算法KBest、基于鲲鹏架构深度优化的向量检索算法KScaNN和鲲鹏自研的向量检索加速组件KVecturbo组成。

鲲鹏推理加速套件

鲲鹏推理加速套件,简称:SRA_Inference,是华为提供的基于鲲鹏平台优化的推理加速套件。该套件实现了TensorFlow、ONNX Runtime等主流框架在鲲鹏处理器的高效适配与推理加速。

TensorFlow Serving线程调度优化

为提升TensorFlow Serving推理性能,鲲鹏BoostKit提出了TensorFlow Serving线程调度优化方案。传统TensorFlow使用算子间的线程池并行计算不同的算子,虽可实现没有数据依赖的算子的并发执行,但在高并发场景下,多Session共享算子间线程池会导致任务抢占,严重降低整图计算效率。针对这一痛点,鲲鹏BoostKit改进了算子调度算法,并加入了其他线程管理优化,有效提升了高并发场景下的模型推理吞吐量。

性能评估

基于鲲鹏处理器,提供在openEuler操作系统上部署ModelZoo搜推模型推理阶段测试的全流程,包括服务端与客户端的测试环境搭建以及进行推理阶段性能测试的操作步骤。