概述

本章节为基于openEuler Intelligence/Dify/RAGFlow框架构建检索增强生成（RAG）服务的实施指南，系统阐述在鲲鹏平台上如何结合高性能向量数据库openGauss实现端到端部署方案。该指南聚焦基于Docker的容器化技术栈，涵盖RAG服务核心配置流程、AI应用平台部署、向量数据库集成、推理服务构建、向量化服务及重排序服务对接等关键技术环节。

DeepSeek V3/R1满血版+鲲鹏的部署方案如图1所示。

图1 DeepSeek V3/R1满血版+鲲鹏的部署方案

下面的部署指导中LLM部署以DeepSeek-R1-Distill-Qwen-7B模型和DeepSeek V3/R1满血版模型为例。

鲲鹏模组RAG一体机部署方案如图2所示。

图2 鲲鹏模组RAG一体机部署方案

RAG一体机的LLM部署以DeepSeek-R1-Distill-Qwen-7B为例，RAG平台搭建以单节点部署为例。

父主题： 方案部署指南