腾讯云智能体开发平台 Agentic RAG-操作指南-Help & Documentation-Tencent Cloud

Agentic RAG（智能体检索增强生成）是腾讯云智能体开发平台提供的下一代知识库问答能力。相比传统 RAG 的单次检索-生成流程，Agentic RAG 基于 Agent Loop 框架，实现智能体自主反思、智能切换检索策略、多轮迭代检索，在知识场景中提供更广的回答范围和更高的回答准确度。
传统 RAG vs Agentic RAG
对比维度
传统 RAG
Agentic RAG
检索方式
单次检索
自主规划检索策略，多轮迭代检索
回答质量
受限于首次检索结果，检索不准确则回答不准
自我反思检索结果，不准确时自动调整策略重新检索
适用场景
简单的单一文档问答
多文档整合、复杂条件筛选、需要交叉验证的知识问答
检索策略
固定策略，无法动态调整
智能切换检索策略（混合、关键词等），按需适配
工具
知识库问答/ KnowledgeRetrievalAnswer
知识库问答/ AgenticRAGSearch
适用场景
多文档整合问答：需要综合多个文档信息才能回答的问题，如"对比 A 产品和 B 产品的功能差异"。
复杂条件筛选：需要按时间、地区、类别等条件筛选后生成答案，如"2025年华东区销售政策有哪些变化"。
交叉验证型问答：答案需要从多个知识源交叉验证，如"公司的差旅报销标准是否有最新更新"。
深度推理型问答：需要理解问题意图并多步推理，如"根据公司制度，跨部门协作的审批流程是什么"。
注意：
Agentic RAG 相比传统 RAG 会消耗更多 Token，建议根据实际场景合理设置反思轮数。
对于简单的知识库问答场景，建议使用传统 RAG，响应更快、成本更低。
使用前提
已创建 Claw 模式或 Multi-Agent 模式应用。
已完成知识库创建并导入文档。请参见文档概述。
操作步骤
步骤一：添加 AgenticRAGSearch 工具
1. 进入应用编辑页面，在工具区域点击添加工具。
2. 在工具列表中选择知识库问答分类下的 AgenticRAGSearch 工具，点击添加。
3. 添加完成后，工具将显示在应用工具列表中。
﻿
﻿
﻿
步骤二：配置反思模型
Agentic RAG 的核心能力来自智能体的自我反思机制。反思模型负责评估检索结果的相关性和完整性，决定是否需要调整检索策略进行下一轮检索。
1. 在 Agentic RAG 工具设置中，找到反思模型配置项。
﻿
﻿
﻿
2. 从下拉列表中选择反思模型。
﻿
﻿
﻿
步骤三：配置重排序模型
重排序模型对初次检索结果进行二次排序，将最相关的文档排在前面，提升检索精度。
1. 在 Agentic RAG 工具设置中，找到重排序模型配置项。
﻿
﻿
﻿
2. 从下拉列表中选择重排序模型：
模型
说明
youtu-rerank-llm
默认。基于 LLM 的重排序模型，排序精度高
youtu-rerank
轻量级重排序模型，响应速度快
步骤四：配置知识检索范围
指定 Agentic RAG 检索的知识库范围，支持选择整个知识库或知识库中的指定知识。
1. 在 AgenticRAGSearch 工具设置中，找到知识检索设置配置项。
2. 点击选择知识库，在弹窗中选择需要检索的知识库。
3. 如需进一步限定检索范围，可选择知识库中的指定知识范围。
检索范围越精准，检索效率和回答准确度越高。建议按业务场景划分知识库，避免将无关知识纳入检索范围。
步骤五：配置检索设置
反思轮数控制智能体最多进行多少轮"反思-检索"的迭代循环。
1. 在检索设置中，找到反思轮数限制配置项。
2. 设置反思轮数，取值范围为 0 - 10，默认为 3 轮。
反思轮数
效果
适用场景
0 轮
等同于标准检索，仅执行一次检索
简单问答、对响应速度要求高
1 - 3 轮
推荐。在准确度和响应速度间取得平衡
大多数知识问答场景
4 - 6 轮
准确度更高，响应较慢
复杂多文档推理、高准确度要求
7 - 10 轮
最高准确度，响应慢、Token 消耗大
极高准确度要求的关键场景
说明：
1. 反思轮数越大，检索越充分，但响应速度越慢、Token 消耗越高。
2. 设置为 0 轮时，Agentic RAG 退化为标准检索模式，不进行自我反思。
3. 建议从默认 3 轮开始，根据实际效果和成本情况调整。
步骤六：体验与发布
1. 配置完成后，在应用设置中进行对话测试。
2. 测试效果满意后，将应用发布至正式环境。请参见 应用发布。

对比维度	传统 RAG	Agentic RAG
检索方式	单次检索	自主规划检索策略，多轮迭代检索
回答质量	受限于首次检索结果，检索不准确则回答不准	自我反思检索结果，不准确时自动调整策略重新检索
适用场景	简单的单一文档问答	多文档整合、复杂条件筛选、需要交叉验证的知识问答
检索策略	固定策略，无法动态调整	智能切换检索策略（混合、关键词等），按需适配
工具	知识库问答/ KnowledgeRetrievalAnswer	知识库问答/ AgenticRAGSearch

模型	说明
youtu-rerank-llm	默认。基于 LLM 的重排序模型，排序精度高
youtu-rerank	轻量级重排序模型，响应速度快

反思轮数	效果	适用场景
0 轮	等同于标准检索，仅执行一次检索	简单问答、对响应速度要求高
1 - 3 轮	推荐。在准确度和响应速度间取得平衡	大多数知识问答场景
4 - 6 轮	准确度更高，响应较慢	复杂多文档推理、高准确度要求
7 - 10 轮	最高准确度，响应慢、Token 消耗大	极高准确度要求的关键场景

Agentic RAG

On this page:

传统 RAG vs Agentic RAG

适用场景

使用前提

操作步骤

步骤一：添加 AgenticRAGSearch 工具

步骤二：配置反思模型

步骤三：配置重排序模型

步骤四：配置知识检索范围

步骤五：配置检索设置

步骤六：体验与发布