最新动态
本文介绍了鲲鹏BoostKit搜推广场景文档最新上线新增、变更动态,新特性都经过上机验证后发布,欢迎体验。
2025年9月
序号 |
更新点 |
更新说明 |
相关文档 |
---|---|---|---|
1 |
鲲鹏BoostKit搜推广场景 技术白皮书 |
新增鲲鹏检索算子库、KNewPfordelta和TensorFlow Serving ANNC特性。 |
|
2 |
鲲鹏召回算法库文档更新 |
|
|
3 |
新增鲲鹏检索算子库 |
基于鲲鹏平台优化的用于加速向量检索的算子库,针对鲲鹏处理器的指令集架构与内存访问机制进行底层优化,使用低精度量化+高精度重排等方法有效提升召回算法的计算效率与吞吐量,同时保证算法精度,适用于高并发召回场景的性能需求。 |
|
4 |
新增TensorFlow Serving ANNC特性 |
基于开源OpenXLA的扩展加速套件,发布在openEuler组织的ANNC开源仓,具有鲲鹏亲和的优化特性,包括TensorFlow图融合、XLA(Accelerated Linear Algebra)图融合、算子优化。 |
|
5 |
变更解决方案名称 |
“鲲鹏BoostKit搜推广使能套件”修改为“鲲鹏BoostKit搜推广场景”。 |
覆盖鲲鹏BoostKit搜推广场景全部文档。 |
2025年6月
序号 |
更新点 |
更新说明 |
相关文档 |
---|---|---|---|
1 |
鲲鹏BoostKit搜推广使能套件 技术白皮书 |
刷新KScaNN、KBest等指标和对接向量数据库特性,增加TensorFlow Serving线程调度优化特性。 |
|
2 |
鲲鹏召回算法库文档更新 |
|
|
3 |
鲲鹏推理加速套件文档更新 |
新增鲲鹏自研的高效的ONNX Runtime算子库KONNX(Kunpeng ONNX Runtime,鲲鹏ONNX Runtime算子库)。 |
|
4 |
鲲鹏推理AI算子库文档更新 |
|
|
5 |
新增TensorFlow Serving线程调度优化特性 |
为提升TensorFlow Serving(以下简称TF Serving)推理性能,鲲鹏BoostKit提出了TensorFlow Serving线程调度优化方案。 |
|
6 |
新增ONNX Runtime移植指南 |
基于鲲鹏920系列处理器,介绍了在openEuler 22.03 LTS SP3操作系统中安装、编译和验证ONNX Runtime 1.19.2的操作步骤。 |
2025年3月
序号 |
更新点 |
更新说明 |
相关文档 |
---|---|---|---|
1 |
鲲鹏召回算法库文档更新 |
|
|
2 |
新增TVM移植指南 |
基于鲲鹏处理器,介绍了在openEuler 22.03 LTS SP3操作系统中编译安装TVM 0.9.0并优化性能的操作步骤。 |
|
3 |
新增搜推排序模型推理Benchmark测试指导 |
基于鲲鹏处理器,介绍了在openEuler 22.03 LTS SP3操作系统上部署ModelZoo搜推排序模型推理阶段测试的全流程,包括服务端与客户端的测试环境搭建以及进行推理阶段性能测试的操作步骤。 |
|
4 |
新增鲲鹏BoostKit搜推广使能套件 技术白皮书 |
介绍鲲鹏BoostKit搜推广使能套件方案,方案架构以及相关技术特性的规格,应用场景和典型配置。 |
2024年12月
序号 |
更新点 |
更新说明 |
相关文档 |
---|---|---|---|
1 |
新增鲲鹏召回算法库 |
|
|
2 |
新增鲲鹏推理加速套件 |
新增鲲鹏推理加速库套件(SRA_Inference)版本说明书和开发指南文档,提供了SRA_Inference版本配套说明、安装指南、接口说明与示例代码,旨在帮助用户快速熟悉SRA_Inference的使用。 |
|
3 |
新增鲲鹏推理AI算子库 |
|
|
4 |
新增TensorFlow Serving推理部署 测试指导 |
基于鲲鹏处理器,介绍了在openEuler 22.03 LTS SP3操作系统中迁移推理部署框架TensorFlow Serving,并部署测试模型进行压力测试。 |