Witty-Assistant-rag：一款高效检索增强引擎详解-技术干货-鲲鹏社区

Witty-Assistant-rag：一款高效检索增强引擎详解

openEulerAI场景

发表于 2026/04/29

Witty-Assistant-rag：一款高效检索增强引擎详解
1. 引言
当前大语言模型技术发展成熟，检索增强生成RAG技术快速迭代，为大模型搭建外部专家知识库，有效提升专业领域知识理解与落地应用能力。Witty-Assistant-rag是openEuler社区官方RAG项目，具备多样化场景化文档解析能力和灵活的混合检索能力，可适配各类业务场景。项目核心优势为内置完善的RBAC基于角色的访问控制机制，支持企业实现知识库分级管理、权限管控与协同办公，显著降低企业级知识库运维成本。

2. 架构设计

Witty-Assistant-rag采用四层分层架构，从上至下依次为Web层、Nginx层、Backend层、openEuler&openGauss基础层。
Web层提供可视化交互界面，集成团队管理、知识库操作、检索增强问答、准确率测试四大功能，用户可通过图形化界面简易操作。
Nginx层承担反向代理作用，保障前后端通信安全稳定，隔离前后端服务，规避后端服务直接暴露的风险。
Backend层是引擎核心，负责提供API接口、核心算法运行与数据库交互，实现团队管理、文档解析、检索增强、效果测试等全部核心功能。
openEuler&openGauss基础层提供底层支撑，由openEuler操作系统保障服务稳定运行，依托openGauss数据库完成各类数据安全存储。

2.1 团队管理功能
基于RBAC权限模型，对团队人员、角色、操作日志、文档及知识库等资产进行精细化划分与全生命周期管理，严格管控操作权限，满足企业多部门多角色协同办公需求。

2.2 资产管理-文档解析功能
支持结构化、半结构化、非结构化三类文档解析，通过标准化处理生成文本块与向量数据，统一存储至openGauss数据库。兼容doc、docx、pdf、html、json、yaml、md、pptx、txt、xlsx、csv以及主流图片等多种文件格式。
内置六种差异化解析方法，general轻量高效适用于常规文字表格提取，ocr依托模型实现图片文字提取，enhanced可对图片内容生成摘要，qa适配问答类文档解析，deep针对复杂格式PDF优化，fine为高精度PDF结构化解析。不同解析方式在准确率和处理速度上各有差异，可按需选用。

2.3 检索增强功能
以关键字检索和向量检索为基础，结合混合检索、分层检索、过滤检索等方式，搭配重排序、上下文填充、token压缩等优化手段，兼顾检索召回率、内容完整性与运行成本。
共提供八种检索方法，包含向量语义检索、BM25关键字精准检索、关键字与向量融合检索、动态权重混合检索、文档摘要筛选检索、结构化文档分层检索、大模型辅助过滤检索、查询语句扩写检索，覆盖通用场景、专业名词检索、长文档检索、复杂问题检索等多种需求，各方式在算力消耗和检索耗时上形成差异化适配。

3. 核心功能详解
项目围绕团队协同、知识库构建、检索问答、效果评估打造完整业务闭环，包含三大核心模块。

3.1 团队管理企业级协同管控核心
用户可自主创建团队，支持公开和私密两种模式，公开团队可被所有用户申请加入，私密团队仅能通过邀请加入。
团队内部可进行成员管理、自定义角色与权限配置、全流程操作日志记录，同时支持修改团队信息、移交或解散团队。团队加入分为申请加入和邀请加入两种模式，全方位保障企业团队资产安全与权限合规。

3.2 知识库管理全流程资产构建与优化
在团队资产库中可创建专属知识库，自定义知识库名称、解析规则、检索参数等配置。支持多格式文档批量上传与自动解析，用户可手动编辑、启停解析内容，优化文本质量。
系统可基于文档自动生成问答对数据集，支持人工修改校准，用于后续效果测评。依托数据集可创建准确率测试任务，结合ragas与多种关键字评估算法，测试不同检索模型组合的实际效果，为知识库优化和算法选型提供数据依据。

3.3 问答与文档溯源检索增强核心应用
用户选定知识库即可发起智能问答，系统通过对应检索算法匹配资料，结合大模型生成回答。具备文档溯源能力，可查看回答对应的原始文档来源，提升内容可信度。支持调节大模型温度参数，灵活调整回答的严谨性与多样性，适配不同使用场景。

4. 资源获取
Witty-Assistant-rag具备高效灵活、权限可管控的特点，文档解析与检索能力完善，企业落地优势突出。
项目官方介绍页 https://www.openeuler.org/zh/projects/intelligence/
后端源码仓库 https://atomgit.com/openeuler/euler-copilot-rag
前端源码仓库 https://atomgit.com/openeuler/euler-copilot-witchaind-web

关于鲲鹏

新闻与活动

交流与资讯

支持与服务

开源社区