知识库 Schema

最近更新时间:2025-09-22 17:17:01

我的收藏
知识库 Schema 是描述知识库内数据结构的信息,向智能体应用提供知识库构成的依据。主要体现在应用的知识检索与调用效果上,因此需在应用内的知识管理处进行配置。知识库数据分为两类:结构化数据和非结构化数据。
结构化数据包含数据库。当知识库中引入数据库时,无需生成知识库 Schema。
非结构化数据包括知识库文档的常规链路,主要由文档和问答组成。文档类知识指以文档形式存储的知识,包括 Word、PPT、表格、图片等数据格式。Schema包含文档的文件名、摘要以及标签。当文档数量较多时,知识库 Schema 生成过程会自动对知识库进行聚类。聚类完成后,将生成文件夹名称和文件夹摘要信息。在此情况下,无需传入文档标签。
定义
说明
文件名
用户上传的文件名称,可能具备含义,也可能无明确语义。
文件夹名
自动聚类概括生成的文件夹名称。
摘要
文件内容的50字左右摘要,由大模型生成。
文件夹摘要
文件夹内容说明,由大模型生成的描述文件夹内的内容摘要。
标签
用户定义的文档标签。如果未定义则缺省。
问答类知识以“问题-答案”的形式成对存在。Schema 包括 Question、Answer 和标签。
定义
说明
Question
用户设定的问题内容。
Answer
对应问题的匹配答案。
标签
用户定义的问答对标签。如果未定义则缺省。

创建方式

知识库检索 Agent 的运行依赖于知识库 Schema。单击应用 > 知识管理,手动点击知识库 Schema。生成 Schema 后,可分别查看各知识库的 Schema 信息。



单击知识库设置,可调整知识库 Schema 生成模型。



注意:
生成知识库 Schema 将消耗 tokens 并产生费用,具体用量取决于知识库的文档规模,计费模型将根据知识库设置中选择的知识库 Schema 生成模型计费。
如需了解如何在应用内引用知识检索 Agent,请参见 知识库检索 Agent - 使用说明