Agentic RAG(智能体检索增强生成)是腾讯云智能体开发平台提供的下一代知识库问答能力。相比传统 RAG 的单次检索-生成流程,Agentic RAG 基于 Agent Loop 框架,实现智能体自主反思、智能切换检索策略、多轮迭代检索,在知识场景中提供更广的回答范围和更高的回答准确度。
传统 RAG vs Agentic RAG
对比维度 | 传统 RAG | Agentic RAG |
检索方式 | 单次检索 | 自主规划检索策略,多轮迭代检索 |
回答质量 | 受限于首次检索结果,检索不准确则回答不准 | 自我反思检索结果,不准确时自动调整策略重新检索 |
适用场景 | 简单的单一文档问答 | 多文档整合、复杂条件筛选、需要交叉验证的知识问答 |
检索策略 | 固定策略,无法动态调整 | 智能切换检索策略(混合、关键词等),按需适配 |
工具 | 知识库问答/ KnowledgeRetrievalAnswer | 知识库问答/ AgenticRAGSearch |
适用场景
多文档整合问答:需要综合多个文档信息才能回答的问题,如"对比 A 产品和 B 产品的功能差异"。
复杂条件筛选:需要按时间、地区、类别等条件筛选后生成答案,如"2025年华东区销售政策有哪些变化"。
交叉验证型问答:答案需要从多个知识源交叉验证,如"公司的差旅报销标准是否有最新更新"。
深度推理型问答:需要理解问题意图并多步推理,如"根据公司制度,跨部门协作的审批流程是什么"。
注意:
Agentic RAG 相比传统 RAG 会消耗更多 Token,建议根据实际场景合理设置反思轮数。
对于简单的知识库问答场景,建议使用传统 RAG,响应更快、成本更低。
使用前提
已创建 Claw 模式或 Multi-Agent 模式应用。
已完成知识库创建并导入文档。请参见文档概述。
操作步骤
步骤一:添加 AgenticRAGSearch 工具
1. 进入应用编辑页面,在工具区域点击添加工具。
2. 在工具列表中选择知识库问答分类下的 AgenticRAGSearch 工具,点击添加。
3. 添加完成后,工具将显示在应用工具列表中。


步骤二:配置反思模型
Agentic RAG 的核心能力来自智能体的自我反思机制。反思模型负责评估检索结果的相关性和完整性,决定是否需要调整检索策略进行下一轮检索。
1. 在 Agentic RAG 工具设置中,找到反思模型配置项。


2. 从下拉列表中选择反思模型。


步骤三:配置重排序模型
重排序模型对初次检索结果进行二次排序,将最相关的文档排在前面,提升检索精度。
1. 在 Agentic RAG 工具设置中,找到重排序模型配置项。


2. 从下拉列表中选择重排序模型:
模型 | 说明 |
youtu-rerank-llm | 默认。基于 LLM 的重排序模型,排序精度高 |
youtu-rerank | 轻量级重排序模型,响应速度快 |
步骤四:配置知识检索范围
指定 Agentic RAG 检索的知识库范围,支持选择整个知识库或知识库中的指定知识。
1. 在 AgenticRAGSearch 工具设置中,找到知识检索设置配置项。
2. 点击选择知识库,在弹窗中选择需要检索的知识库。
3. 如需进一步限定检索范围,可选择知识库中的指定知识范围。
检索范围越精准,检索效率和回答准确度越高。建议按业务场景划分知识库,避免将无关知识纳入检索范围。
步骤五:配置检索设置
反思轮数控制智能体最多进行多少轮"反思-检索"的迭代循环。
1. 在检索设置中,找到反思轮数限制配置项。
2. 设置反思轮数,取值范围为 0 - 10,默认为 3 轮。
反思轮数 | 效果 | 适用场景 |
0 轮 | 等同于标准检索,仅执行一次检索 | 简单问答、对响应速度要求高 |
1 - 3 轮 | 推荐。在准确度和响应速度间取得平衡 | 大多数知识问答场景 |
4 - 6 轮 | 准确度更高,响应较慢 | 复杂多文档推理、高准确度要求 |
7 - 10 轮 | 最高准确度,响应慢、Token 消耗大 | 极高准确度要求的关键场景 |
说明:
1. 反思轮数越大,检索越充分,但响应速度越慢、Token 消耗越高。
2. 设置为 0 轮时,Agentic RAG 退化为标准检索模式,不进行自我反思。
3. 建议从默认 3 轮开始,根据实际效果和成本情况调整。
步骤六:体验与发布
1. 配置完成后,在应用设置中进行对话测试。
2. 测试效果满意后,将应用发布至正式环境。请参见 应用发布。