ChatBI 知识库

最近更新时间:2025-04-08 14:40:32

我的收藏
大模型了解的是通用领域知识,但在特定行业或企业的应用中,需要对特定的行业知识进行学习和理解。这就需要构建和维护业务知识库,录入所在行业的专属知识、业务习惯。这些知识可以帮助模型更好地理解行业的特性和需求,从而提高 ChatBI 数据分析的准确性和效率。随着业务数据的更新、行业知识的发展,知识库需要持续的构建和维护,定期更新知识库去确保模型获取到的是最新的知识内容。
例如某企业经常需要询问“大订单数量是多少”,且认为大于5000箱的订单才叫大订单,此时可以通过知识库录入对应知识,提升 ChatBI 的输出效果。仅有行业独有的知识需要录入时才需使用知识库,非必填。

一、知识库创建




进入 ChatBI 界面,选择配置 > 知识库,打开知识库界面。

单击新建知识库,选择创建的知识库类型:
业务名词知识库:录入业务常用的专有名词和解释。
业务习惯知识库:录入默认时间等业务习惯知识。
注意:
业务名词知识库:仅支持同时启用5个此类型的知识库。
业务习惯知识库:知识内容过多会影响模型效果,仅支持启用1个业务习惯知识库,每个知识库仅支持录入5条知识。
单击业务名词知识库/业务习惯知识库,知识库创建成功。



二、业务名词知识库

业务名词知识库概述

大模型较难理解不同行业的业务名词或行业黑话。因此,当用户在 ChatBI 中提出包含这些术语的问题时,业务名词知识库的创建和录入将帮助 ChatBI 理解业务名词的含义,从而更准确地回应用户的查询。除此之外,如果是对表里不存在的字段进行提问,也可以通过在名词知识库里录入该字段的含义,让模型能理解。

典型场景

1. 业务专有名词:如果您所在的行业存在大量的业务专有名词,并且这些名词没有以数据表中的字段/值的形式存在,那么在知识库中录入专有名词的解释将有助于模型理解您的问题,并提供准确的答案。下面以某张零售行业的数据表进行举例:
字段(字段名)
字段名中文名
consumption_amount
消费金额
sales
销售收入
cost
销售成本
例如知识名词“KA 客户”,KA 客户是零售行业的专有名词,但是在某零售企业的数据表中没有对客户做类型区分,消费金额超过200000以上的客户即 KA 客户,此时推荐将 KA 客户录入知识库。
知识库名称
解释
对话提示参考
KA 客户
属于消费金额(#consumption_amount#)字段,字段取值大于等于'200000'
2024年 KA 客户的消费金额是多少?
例如知识名词“损益情况”,损益情况是零售经营场景的专有名词,而在数据表中没有一列叫做损益情况,是销售收入、销售成本的总和,此时推荐将损益情况录入知识库。
知识库名称
解释
对话提示参考
损益情况
对应字段为销售收入(#sales#),销售成本(#cost#)
2024年整体的损益情况?


2. 
计算字段
:如果对已有维度和指标之外的字段进行提问,需要在知识库录入计算字段,否则大模型会理解失败。“利润率”、“毛利率”等大模型公域知识就可以理解的字段无需添加,如果公域知识不能理解的,企业独有的计算逻辑,则需要新增。(如果是语言难以表达的复杂计算逻辑,可以在通过写SQL的方式在数据表新增计算字段里录入)

例如某个企业的数据表里没有毛利率,但有“毛利”、“含税收入”、“不含税收入”等字段,该企业对毛利率的定义是毛利除不含税收入,则建议录入“临时计算字段:毛利除以不含税收入”的逻辑后,再询问毛利率相关问题。



业务名词知识库录入


知识库支持两种录入方式:(1)单条录入;(2)批量导入。

(1)单条录入


知识库名字,默认为新建知识库,可对知识库进行重命名。
知识库启用状态,创建后默认为启用状态,对项目内所有的数据表生效。关闭后,此知识库不生效。
注意:
过多的业务名词知识可能会影响 ChatBI 的问数效果,目前业务名词知识库仅支持启用5个。
知识库类型:分为业务名词知识库和业务习惯知识库,创建后知识库类型不支持更改。
新增知识,单击后,可对知识库内知识进行录入。

(2)批量导入


单击批量导入的按钮,右侧出现上传抽屉。

上传文件格式:xlsx、csv格式文件,文件最大为20M。
支持下载模板统一上传。

业务名词录入内容


知识名称(必填):本条知识的名称,最多支持200字。
解释(必填):对知识名称进行解释,模型将按照解释的内容进行取数操作,最多支持1500字。
对话提示参考(选填):知识名称的一般使用方式,可以帮助模型理解知识名称的用法,提升使用的正确率,最多支持200字。
操作:可以删除单条知识。
保存&取消:对编辑的知识库进行保存或者取消保存。

业务名词录入规范

知识的生效方式:录入的知识名称需要与问题中的关键词精确匹配,此条知识才能生效。
以下为知识库录入的推荐模板,按照推荐的模板录入知识库效果较好:
知识名称(必填)
解释(必填)
对话提示参考(选填)
此条知识的名称,录入的知识名称需要在问题中出现,且能精确匹配
属于字段中文名(#字段名#)字段,字段取值等于''
2024年「知识名称」的收入是多少?
属于字段中文名(#字段名#)字段,字段取值为('值1','值2',...)
字段中文名的别名,对应字段为(#字段名#)
说明:
1. 字段名用井号(##)括起来,取值用英文单引号''括起来 。
2. 字段名(即数据表中的原始字段名)和字段中文名(即在 BI 中配置的字段名),需要同时录入。
3. 根据行业知识对解释部分的模板做字段名、字段中文名、值的替换。
字段名和字段中文名为:



字段中文名和值为:



知识库录入示意




三、业务习惯知识库

业务习惯知识库概述

不同行业和业务有独特的业务习惯。因此,当用户在 ChatBI 中进行提问时,业务习惯知识库的创建和录入将帮助 ChatBI 获取业务的习惯,从而简化用户问题,准确地回应用户的查询。
生效方式:补充生效

典型场景

(1)时间类
解释(必填)
对话提示参考(选填)
提问如果没有将时间作为维度,提问如果没有涉及具体时间,则设置条件:定账月(#ftime#)字段取值为'2023年6月'
大数据的收入是多少?
(2)非时间类
解释(必填)
对话提示参考(选填)
提问如果没有将中心作为维度,提问如果没有涉及具体中心,则设置条件中心(#center#)字段取值为'二部'
2024年大数据的收入是多少?

业务习惯知识库录入


知识库支持两种录入方式:(1)单条录入;(2)批量导入。

(1)单条录入


知识库名字,默认为新建知识库,可对知识库进行重命名。
知识库启用状态,创建后默认为启用状态,对项目内所有的数据表生效。关闭后,此知识库不生效。
注意:
过多的业务习惯知识可能会影响 ChatBI 的问数效果,目前业务习惯知识库仅支持启用1个,每个业务习惯支持库仅支持录入5条。
知识库类型:分为业务名词知识库和业务习惯知识库,创建后知识库类型不支持更改。
新增知识,单击后,可对知识库内知识进行录入。

(2)批量导入

与业务名词知识库的批量导入流程一致。
警告:
业务习惯支持库最多支持录入5条,批量导入文件的条数超过5条,将导入失败。

业务习惯录入内容


解释(必填):对知识名称进行解释,模型将按照解释的内容进行取数操作,最多支持1500字。
对话提示参考(选填):知识名称的一般使用方式,可以帮助模型理解知识名称的用法,提升使用的正确率,最多支持200字。
操作:可以删除单条知识。
保存&取消:对编辑的知识库进行保存或者取消保存。

业务习惯录入规范

习惯知识的生效方式:对问题进行判断,将知识内容作为补充条件从而生效。
习惯知识库知识分类:
时间类
录入并启用此知识库后,生效需要在配置 > 数据表 > 关闭时间追问,此时此条时间类知识才可以在对应的数据表生效。

非时间类
录入后,启用此知识库可直接生效。
以下为知识库录入的推荐模板,按照推荐的模板录入知识库效果较好:
解释(必填)
对话提示参考(选填)
提问如果没有将XX作为维度,提问如果没有涉及具体XX,则设置条件字段中文名(#字段名#)字段取值为'值'
-
说明:
1. 字段名用井号(##)括起来,取值用英文单引号' '括起来 。
2. 字段名(即数据表中的原始字段名)和字段中文名(即在 BI 中配置的字段名),需要同时录入。
3. 根据行业知识对解释部分的模板做字段名、字段中文名、值的替换。