文档概述

最近更新时间:2025-11-19 14:11:11

我的收藏
文档类知识是指以文档形式存储和承载的信息内容,常见的包括 PDF、DOCX、TXT 等文件以及网页。借助腾讯云智能体开发平台的能力,用户可以将这些文档文件导入系统,由平台对其进行解析与管理,进一步构建成业务知识库。智能体应用接入该知识库后,能够直接基于其中的内容为用户提供问答与信息检索服务,从而实现知识的结构化利用与业务场景的高效支持。
注意:
应用评测 进行时,无法对知识库内容进行更改,包括新增导入、删除和修改知识设置。
知识库容量有限,需 购买 知识库扩容包使用,知识库扩容包到期后,超字符容量的部分文档/问答,变更为【超量失效】状态。扩容后需手动恢复。超量失效的知识无法再对话端检索到,失效1个月后自动删除。建议到期前及时续费/增购。
单击左侧的知识库,进入知识库 > 文档,可以对文档类知识进行管理。支持导入文档、下载文档、删除文档及文档分类。




导入文档

您可以通过本地文档、网页文件和腾讯文档三种方式导入文档。

本地文档导入步骤

1. 进入知识库文档页后,选择知识库管理 > 文档,进入文档管理界面。
2. 单击导入,显示导入文档下拉框,选择本地文档



3. 上传文件后完成高级设置,单击下一步
4. 设置文档切分规则,通过 设置文档切分 了解如何配置,完成后单击导入文档
注意:

导入本地文档条件:

支持 pdf、doc、docx、ppt、pptx格式,大小限制:200 MB。
支持 xlsx、xls、md、txt、csv格式,大小限制:20 MB。
支持导入带文字的图片,包括 png、jpg、jpeg 格式,大小限制:50MB,长宽比不超过1:7。
表格文件( xlsx、xls、csv 格式)最大支持1万行、100列数据,建议一个 sheet 只存放一张表格,表格中出现全空行数据将影响问答效果。
支持批量导入文档。

网页文件导入步骤

1. 进入知识库详情页,选择知识库 > 文档,进入文档管理界面。
2. 单击导入,选择网页文件



3. 输入网址以及完成高级设置,单击下一步。
说明:
1. 逐条上传支持最多上传20个网址;
2. 批量上传仅支持.xlsx格式,单次可上传1个文件,最多可导入500条网址,文件大小不超过15MB。
注意:
网站链接限制:
确保所爬取的网页无登录授权验证,即无需验证当前用户身份和授予用户系统访问权限就可访问网页。
暂不支持异步加载类型的网站内容爬取。
请您确保在法律法规允许的范围内使用本网页解析工具,遵守目标平台管理规范、保障权利人合法权益,您应对此独立承担责任。腾讯云智能体开发平台作为工具提供方不对您的解析或下载行为承担任何责任。
4. 设置文档切分规则,通过 设置文档切分 了解如何切分文档,完成后单击导入网页



5. 腾讯云智能体开发平台需要一段时间自动爬取网页中的图片、文本等信息,爬取完成后支持预览和编辑,完成后单击保存为文档。



6. 导入到列表的文档,支持设置更新频率。




腾讯文档导入步骤

1. 进入知识库详情页,选择知识库 > 文档,进入文档管理界面。
2. 单击导入,选择腾讯文档



3. 根据页面提示,完成扫码登录后选择需要导入的文档。
4. 按照需求配置文档高级设置,添加文档标签、设置到期时间、参考来源和文档分类、文档更新频率。
5. 设置文档切分规则。请参考 设置文档切分 了解如何切分文档。配置完成后单击导入文档
注意:
此功能为白名单功能,如有需要,请 提交工单 申请开通。

腾讯云对象存储(COS)导入步骤

1. 进入知识库详情页,选择知识库 > 文档,进入文档管理界面。
2. 单击导入,选择腾讯云对象存储(COS)



3. 根据页面提示,完成 COS 授权后选择需要导入的文档。
4. 按照需求配置文档高级设置,添加文档标签、设置到期时间、参考来源和文档分类。
5. 设置文档切分规则。请参考 设置文档切分 了解如何切分文档。配置完成后单击导入文档

文档导入设置

文档标签:用于给文档打标签,可在 知识库检索范围设置 配置 API 参数与标签的匹配关系,通过应用对话端接口的 custom_variables 字段传入 API 参数,限制传入不同 API 参数值的用户提问时,检索匹配标签值的文档内容。详情请参见 知识库检索范围设置

到期时间
:文档知识的生效时间设置,可设置永久有效或自定义到期时间。若设定了自定义到期时间,在到期时间后,该文档知识将会自动失效。
展示参考来源:打开后,会在回答的末尾增加来源展示,并支持在线查看;可选择展示大模型所参考的文档链接或自定义参考链接(例如官网主页等)。

文档分类
:在知识库中建立文档分类有助于便捷管理不同分类的知识问答;最多支持10层分类。支持重命名、删除、搜索分类。鼠标悬浮在任一分类上,右侧将显示...,单击...显示下拉框,点击添加子类,输入名称后按回车键,将在当前分类下新建子类。
产品上提供设置文档切分的能力,在导入文档时,用户可基于文档设置不同的切分规则,系统会根据用户设置的切分规则将文档切分成切片。

文档操作


查看文档
:进入知识库问答应用详情页后,选择知识管理 > 文档 Tab 页签,单击文件名称即可查看文档内容。
文档状态:指文档上传后,系统对文档的处理状态和自定义生效的状态。
状态说明:
解析中:正在执行文档解析工作,不支持对该状态下的文档进行设置调整。
解析失败:文档解析失败,将会弹窗进行提示,可查看详情。
审核中:正在执行文档审核工作,不支持对该状态下的文档进行设置调整。
审核失败:文档审核失败,原因可能是文档的内容不符合规定的标准或要求。
学习中:正在执行文档学习工作,不支持对该状态下的文档进行设置调整。
学习失败:知识库问答应用学习文档内容失败,无法基于文档在对话测试和正式环境中问答。
待发布:文档已部署,支持在对话测试中进行测试,待发布到正式环境中生效。该状态下的文档可 生成问答
发布中:文档正在从测试环境发布到正式环境,不支持对该状态下的文档进行设置调整。
已发布:文档已发布到正式环境,应用可基于文档回答用户问题。
已过期:文档已过期失效,无法基于文档在对话测试和正式环境中问答。
人工申诉中:文档审核失败提交给人工审核,人工审核过程中的状态为人工申诉中。
人工申诉失败:人工审核不通过,文档状态为人工申诉失败,需要线下对文档进行修改后重新导入。
超量失效:知识库容量到期,已使用的知识库容量超过可用知识库容量时,超过容量限制的文档被处理为超量失效状态。
超量失效恢复:超量失效状态的知识恢复为失效前状态的过程,超量失效的文档需要手动恢复。
文档搜索:支持通过文件名/标签名称对文档进行搜索。
文档下载:从腾讯云智能体开发平台中下载已导入文档到本地。
文档删除:删除知识库中的文档。
重命名:支持更新文档名称,更新审核通过后需要发布生效。
是否启用:支持按文档启用、停用状态,停用后不再检索该文档。
解析切分干预:支持修改文档切片结果,详情请参见 解析切分干预
注意:
1. 删除文档后由该文档生成的问答库问答不会被删除。
2. 应用默认知识库中变更启用状态需要发布生效;知识库中启用状态修改后直接生效,无需发布。