鲲鹏RAG解决方案-鲲鹏社区

RAG解决方案概述

知识库构建流程（离线）

问答流程（在线）

向量检索加速

价值优势

openGauss向量数据库在支持主流向量索引IVF-Flat/HNSW的基础上，通过与鲲鹏的深度软硬协同，基于BoostKit鲲鹏加速库、向量化指令加速，全面提升检索性能，领先业内主流向量数据库30%。

关键技术

支持基于鲲鹏BoostKit量化压缩算法，高效压缩高维向量，减少近似检索计算量，提升检索效率。
通过鲲鹏NEON和SVE指令集对热点距离计算函数进行SIMD加速，充分利用鲲鹏多核算力，同时减少指令数量，降低访存次数，速度提升20%。

高性能，响应/吐字效率高

BoostKit加速向量检索，openGauss向量数据库检索时延优于业内主流向量数据库30% RAG独立部署，减少对推理资源占用，高并发下减少40%-80%推理时延影响，提升吐字效率

易部署，上线周期短

openGauss数据库“一库四用” 降低部署/运维难度原生集成openEuler Intelligence AI流框架，部署效率是友商2倍

高安全，保护敏感数据

RAG安全网关，防护恶意数据库连接、SQL注入等行为基于VirtCCA的机密安全虚机，防敏感数据窃取和篡改

易升级，扩容升级灵活

大模型和RAG模块分离部署，后期大模型随意组合升级，灵活性好数据库独立部署，可随知识库增加而扩容，平滑扩展

鲲鹏RAG实践教程

介绍鲲鹏RAG解决方案，包括方案部署指南，实践案例指导等