Agentic RAG

最近更新时间:2026-05-28 10:21:01

我的收藏
Agentic RAG(智能体检索增强生成)是腾讯云智能体开发平台提供的下一代知识库问答能力。相比传统 RAG 的单次检索-生成流程,Agentic RAG 基于 Agent Loop 框架,实现智能体自主反思、智能切换检索策略、多轮迭代检索,在知识场景中提供更广的回答范围和更高的回答准确度。

传统 RAG vs Agentic RAG

对比维度
传统 RAG
Agentic RAG
检索方式
单次检索
自主规划检索策略,多轮迭代检索
回答质量
受限于首次检索结果,检索不准确则回答不准
自我反思检索结果,不准确时自动调整策略重新检索
适用场景
简单的单一文档问答
多文档整合、复杂条件筛选、需要交叉验证的知识问答
检索策略
固定策略,无法动态调整
智能切换检索策略(混合、关键词等),按需适配
工具
知识库问答/ KnowledgeRetrievalAnswer
知识库问答/ AgenticRAGSearch

适用场景

多文档整合问答:需要综合多个文档信息才能回答的问题,如"对比 A 产品和 B 产品的功能差异"。
复杂条件筛选:需要按时间、地区、类别等条件筛选后生成答案,如"2025年华东区销售政策有哪些变化"。
交叉验证型问答:答案需要从多个知识源交叉验证,如"公司的差旅报销标准是否有最新更新"。
深度推理型问答:需要理解问题意图并多步推理,如"根据公司制度,跨部门协作的审批流程是什么"。
注意:
Agentic RAG 相比传统 RAG 会消耗更多 Token,建议根据实际场景合理设置反思轮数。
对于简单的知识库问答场景,建议使用传统 RAG,响应更快、成本更低。

使用前提

已创建 Claw 模式Multi-Agent 模式应用。
已完成知识库创建并导入文档。请参见文档概述

操作步骤

步骤一:添加 AgenticRAGSearch 工具

1. 进入应用编辑页面,在工具区域点击添加工具
2. 在工具列表中选择知识库问答分类下的 AgenticRAGSearch 工具,点击添加。
3. 添加完成后,工具将显示在应用工具列表中。




步骤二:配置反思模型

Agentic RAG 的核心能力来自智能体的自我反思机制。反思模型负责评估检索结果的相关性和完整性,决定是否需要调整检索策略进行下一轮检索。
1. 在 Agentic RAG 工具设置中,找到反思模型配置项。



2. 从下拉列表中选择反思模型。




步骤三:配置重排序模型

重排序模型对初次检索结果进行二次排序,将最相关的文档排在前面,提升检索精度。
1. 在 Agentic RAG 工具设置中,找到重排序模型配置项。



2. 从下拉列表中选择重排序模型:
模型
说明
youtu-rerank-llm
默认。基于 LLM 的重排序模型,排序精度高
youtu-rerank
轻量级重排序模型,响应速度快

步骤四:配置知识检索范围

指定 Agentic RAG 检索的知识库范围,支持选择整个知识库或知识库中的指定知识。
1. 在 AgenticRAGSearch 工具设置中,找到知识检索设置配置项。
2. 点击选择知识库,在弹窗中选择需要检索的知识库。
3. 如需进一步限定检索范围,可选择知识库中的指定知识范围。
检索范围越精准,检索效率和回答准确度越高。建议按业务场景划分知识库,避免将无关知识纳入检索范围。

步骤五:配置检索设置

反思轮数控制智能体最多进行多少轮"反思-检索"的迭代循环。
1. 在检索设置中,找到反思轮数限制配置项。
2. 设置反思轮数,取值范围为 0 - 10,默认为 3 轮。
反思轮数
效果
适用场景
0 轮
等同于标准检索,仅执行一次检索
简单问答、对响应速度要求高
1 - 3 轮
推荐。在准确度和响应速度间取得平衡
大多数知识问答场景
4 - 6 轮
准确度更高,响应较慢
复杂多文档推理、高准确度要求
7 - 10 轮
最高准确度,响应慢、Token 消耗大
极高准确度要求的关键场景
说明:
1. 反思轮数越大,检索越充分,但响应速度越慢、Token 消耗越高。
2. 设置为 0 轮时,Agentic RAG 退化为标准检索模式,不进行自我反思。
3. 建议从默认 3 轮开始,根据实际效果和成本情况调整。

步骤六:体验与发布

1. 配置完成后,在应用设置中进行对话测试。
2. 测试效果满意后,将应用发布至正式环境。请参见 应用发布