知识库 Schema 是描述知识库内数据结构的信息,向智能体应用提供知识库构成的依据。主要体现在应用的知识检索与调用效果上,因此需在应用内的知识管理处进行配置。知识库数据分为两类:结构化数据和非结构化数据。
结构化数据包含数据库。当知识库中引入数据库时,无需生成知识库 Schema。
非结构化数据包括知识库文档的常规链路,主要由文档和问答组成。文档类知识指以文档形式存储的知识,包括 Word、PPT、表格、图片等数据格式。Schema包含文档的文件名、摘要以及标签。当文档数量较多时,知识库 Schema 生成过程会自动对知识库进行聚类。聚类完成后,将生成文件夹名称和文件夹摘要信息。在此情况下,无需传入文档标签。
定义  | 说明  | 
文件名  | 用户上传的文件名称,可能具备含义,也可能无明确语义。  | 
文件夹名  | 自动聚类概括生成的文件夹名称。  | 
摘要  | 文件内容的50字左右摘要,由大模型生成。  | 
文件夹摘要  | 文件夹内容说明,由大模型生成的描述文件夹内的内容摘要。  | 
标签  | 用户定义的文档标签。如果未定义则缺省。  | 
问答类知识以“问题-答案”的形式成对存在。Schema 包括 Question、Answer 和标签。
定义  | 说明  | 
Question  | 用户设定的问题内容。  | 
Answer  | 对应问题的匹配答案。  | 
标签  | 用户定义的问答对标签。如果未定义则缺省。  | 
创建方式
知识库检索 Agent 的运行依赖于知识库 Schema。单击应用 > 知识管理,手动点击知识库 Schema。生成 Schema 后,可分别查看各知识库的 Schema 信息。

 

单击知识库设置,可调整知识库 Schema 生成模型。

 

注意:
生成知识库 Schema 将消耗 tokens 并产生费用,具体用量取决于知识库的文档规模,计费模型将根据知识库设置中选择的知识库 Schema 生成模型计费。