企业知识库管理

创建知识库

知识库实际上是一组数据集的集合,通过将文件上传到RAGFlow的知识库中,并将他们解析可以得到数据集。RAGFlow目前支持的文件格式包括文件(PDF、DOC、DOCX、TXT、MD),表格(CSV、XLSX、XLS),图片(JPEG、JPG、PNG、TIF、GIF)以及幻灯片(PPT、PPTX)。创建知识库主要包括以下步骤:

  1. 单击页面右上角“创建知识库”,并输入知识库名称后单击“确定”

  2. 进入知识库配置界面,选择知识库的PDF解析器、嵌入模型、切片方法等。配置完毕后单击最下方的“保存”来保存知识库的配置信息。

    一旦为知识库选择一个嵌入模型并且使用它进行了文件解析, 后续就不能改变选择的嵌入模型了。因为要确保一个知识库中所有的文件都使用相同的嵌入模型来解析,从而确保他们能够在同一个嵌入空间进行比较。

  3. 上传文件到知识库。单击“新增文件”“本地上传”,选择本地文件后单击“确定”开始上传。

    目前RAGFlow支持单次上传文件大小有限,文件过大可能会导致解析失败。

  4. 解析上传后的文件。单击开始解析:

    解析完成后,解析状态将变为“成功”字样。

  5. 进行检索测试。单击检索测试,输入测试文本,查看是否能够返回可信的引用片段。