前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Anthropic的DeepResearch完整Prompt开源:Lead、Search和Citation三大Prompt全解析

Anthropic的DeepResearch完整Prompt开源:Lead、Search和Citation三大Prompt全解析

作者头像
AgenticAI
发布2025-06-19 12:07:35
发布2025-06-19 12:07:35
2270
举报
文章被收录于专栏:AgenticAIAgenticAI

继我们上篇分享了《Anthropic》在使用多智能体实现 Deep Research 的经验,它还开源了如何用多智能体精细调度、协同研究的完整思维方式。本篇我们将拆解其核心 Prompt 设计思路,看看一个严肃的 Agent 系统该长什么样。本篇我们分享它在博客中所设计的 3 个 Agent 的 Prompt:Lead AgentSearch SubAgentCitations SubAgent

Image
Image

1. Lead Agent

Lead Agent主要负责解析用户意图、制定研究方案、分配任务,完整的 Prompt 非常长,可以通过以下地址查看:

https://github.com/anthropics/anthropic-cookbook/blob/main/patterns/agents/prompts/research_lead_agent.md

虽然很长,也可以将其分解为以下 6 个部分:

1. 角色定义与核心目标

  • 角色:专家研究负责人(Research Lead)
  • 核心职责
    • 制定研究策略与规划
    • 高效委派子代理(subagents)
    • 综合撰写最终报告
  • 目标:通过系统化研究流程生成高质量答案

2. 研究流程框架

2.1 评估与分解阶段
  1. 问题拆解
    • 识别核心概念、实体、关系
    • 列出所需具体事实/数据
  2. 上下文分析
    • 时间/空间约束
    • 用户潜在需求优先级
  3. 输出形式判断
    • 报告/列表/多视角分析等
2.2 查询类型分类

类型

特征

示例

策略

深度优先

单一问题多角度深挖

"2008 金融危机根本原因"

3-5 个方法论视角并行研究

广度优先

可拆解为独立子问题

"比较北欧三国经济体系"

按子主题分配独立子代理

简单查询

明确单一答案

"东京当前人口"

1 个子代理直接获取

3. 子代理管理规范

3.1 数量指南
  • 简单查询:1 个
  • 中等复杂度:2-3 个
  • 高复杂度:5-10 个(上限 20 个)
  • 禁止:无意义拆分或超限委派
3.2 任务分配原则
  • 深度优先:按方法论维度分配(如经济/政策/技术视角)
  • 广度优先:按自然子问题划分(如国家/公司/时间阶段)
  • 关键要求
    • 任务边界清晰化
    • 避免重复覆盖
    • 指令需包含:目标/输出格式/可靠数据源定义
3.3 子代理指令模板
  1. 核心研究目标(单焦点)
  2. 预期输出形式(列表/报告等)
  3. 推荐数据源与工具
  4. 质量评估标准
  5. 明确范围限制

4. 工具使用策略

4.1 工具类型
  • 基础工具Web 搜索/抓取
  • 内部工具(如可用):Slack/Asana/GitHub 只读查询
  • 禁用操作:任何写入/修改类操作
4.2 效率优化
  • 并行调用:默认同时启动 3 个子代理
  • 依赖管理:关键路径任务优先执行
  • 工具探索:对新工具快速试用以熟悉功能

5. 报告生成规范

  • 合成责任:主 AI 全权负责(禁止委派)
  • 内容要求
    • 基于事实清单验证
    • 冲突信息需标注优先级
  • 格式规范
    • Markdown 输出
    • 禁止包含引用/来源(由其他模块处理)
  • 终止条件:收益递减时立即停止研究

6. 安全与效率控制

  • 伦理限制:禁止有害内容研究子代理
  • 动态调整
    • 根据子代理反馈更新研究计划
    • 贝叶斯思维修正结论
  • 资源控制
    • 超时/低收益时提前终止
    • 子代理数量硬上限(20 个)

模块关联逻辑

image-20250618230558711
image-20250618230558711

2. Search SubAgent

Search SubAgent主要负责并行执行子任务,使用工具(如 Web 搜索),返回关键发现。完整的 Prompt 也很长,可通过以下地址查看:

https://github.com/anthropics/anthropic-cookbook/blob/main/patterns/agents/prompts/research_subagent.md

虽然也很长,但依然可以将其分为以下 5 个核心要点:

1. 角色与基础设定

  • 身份:研究子代理(Research Subagent)
  • 协作关系:受主研究代理(Lead Agent)指派执行具体任务
  • 时间基准:当前日期为{{.CurrentDate}}
  • 核心原则:严格遵循指令,高效使用工具完成任务

2. 研究流程规范

2.1 规划阶段
  1. 任务分析
    • 彻底理解任务需求
    • 制定分步研究计划
  2. 资源预算任务复杂度工具调用上限简单≤5 次中等5 次复杂10 次极复杂≤15 次
  3. 工具选择
    • 优先内部工具(Google Drive/Gmail 等)
    • Web 搜索 → 网页抓取(web_search → web_fetch)标准流程
    • 限制 REPL 工具仅用于纯 JavaScript 计算
2.2 执行阶段(OODA 循环)
  • Observe:评估已有信息与缺口
  • Orient:确定最佳工具/查询组合
  • Decide:选择具体执行策略
  • Act:执行工具调用
  • 迭代要求
    • 禁止重复相同查询
    • 根据结果动态调整方法
    • 复杂任务至少 5 次工具调用

3. 操作指南

3.1 搜索策略
  • 查询优化
image-20250618230941103
image-20250618230941103
  • 保持简短(≤5 词)
  • 动态调整范围:
  • 结果处理
    • 聚合内容而非原始来源
    • 模糊引用(被动语态+匿名信源)
    • 营销话术/选择性数据
    • 标记预测性内容(含"可能"/"或将"等措辞)
    • 警惕低质量来源特征:
3.2 数据优先级
  • 高价值信息标准
    1. 显著性(对结论影响大)
    2. 直接相关性
    3. 精确性(具体数字/日期)
    4. 来源可靠性
  • 冲突处理
    • 按时效性/一致性/来源质量排序
    • 无法解决时保留矛盾信息供主代理判断

4. 工具使用规范

4.1 强制规则
  • 内部工具优先:必须用于涉及非公开数据的任务
  • 网页抓取:以下情况必须使用web_fetch
    • 需要详细信息时
    • 跟进 web_search 结果
    • 用户提供 URL 时
  • 并行调用:默认同时发起 2 个独立工具调用
4.2 限制条款
  • 绝对上限
    • 工具调用 ≤20 次
    • 来源 ≤100 条
  • 终止条件
    • 达到 15 次调用或 80%来源上限
    • 信息收益明显递减时
  • 禁止行为
    • 使用已禁用的evaluate_source_quality工具
    • 无意义重复查询

5. 输出要求

  • 内容标准
    • 内部思考详细 vs 报告简洁高密度
    • 明确标注存疑信息
  • 完成动作
    • 使用complete_task工具提交最终报告
    • 禁止自行延长研究

模块关联流程图

image-20250618231052209
image-20250618231052209

该设计通过严格的流程控制、动态资源分配和分层质量把关,确保子代理在有限资源内高效完成研究任务,同时为主代理提供可集成的可靠结果。

3. Citation SubAgent

Citation SubAgent为最终报告生成标准化来源引用标注 。完整 Prompt 依然很长,大家可以访问官方 Repo 获取:

https://github.com/anthropics/anthropic-cookbook/blob/main/patterns/agents/prompts/citations_agent.md

虽然也很长,但依然可以将其分为以下 5 个核心要点:

1. 角色与任务定义

  • 身份:文献引用代理(Citation Agent)
  • 核心职责
    • 在保持原文绝对不变的前提下添加引用标记
    • 仅对<synthsized_text>内的文本操作
  • 质量目标
    • 增强用户信任度
    • 确保引用精准匹配源文档

2. 操作规则

2.1 内容完整性约束
  • 禁止修改
    • 文本内容(包括标点、大小写)
    • 空白字符(空格/换行符等)
  • 验证机制
    • 系统将对比引用后文本与原始文本
    • 非完全一致则拒绝输出
2.2 引用范围准则

应引用场景

不应引用场景

关键事实/数据

常识性陈述

具体研究结论

过渡性语句

需要验证的主张

同一句子中同源的多个主张(句末单引用)

3. 引用技术规范

3.1 位置要求
  1. 语义单元
    • 引用完整句子或独立语义块
    • 禁止在短语片段中间插入
  2. 句子结构
    • 优先句尾引用(例:"地球是圆的。[1]")
    • 单句同源时禁止多引用标记
  3. 视觉兼容
    • 考虑交互式标签的显示效果
    • 避免破坏文本可读性
3.2 输出格式
  • 容器标签<exact_text_with_citation>   [原文本+新增引用标记] </exact_text_with_citation>
  • 预处理内容
    • 所有分析/注释必须放在输出标签外

4. 执行流程

图片
图片

5. 异常处理

  • 冲突情况
    • 多个源文档支持同一主张 → 选择最匹配的源
    • 部分匹配源文档 → 放弃引用
  • 质量检查
    • 最终输出前人工复核示例片段
    • 特别检查数字/专有名词的引用

该设计通过严格的不可变性约束和语义级引用策略,在保证学术规范性的同时维持原文的完整性,适用于需要高精度文献引用的自动化处理场景。

总结

你发现了吗?每个 Prompt 都很长,可以说明这个 DeepResearch 系统有多复杂,也同时说明 Anthropic 的上下文应该很强。如果你正构建自己的 Agent 系统,可以从 Anthropic 的结构中学习这些通用设计原则:

  • 分工明确,角色职责硬编码在 Prompt 中
  • 任务分解 → 工具使用 → 结果合成一条龙闭环
  • 上下文管理足够强,允许复杂系统协作而不混乱
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-06-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AgenticAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. Lead Agent
    • 1. 角色定义与核心目标
    • 2. 研究流程框架
      • 2.1 评估与分解阶段
      • 2.2 查询类型分类
    • 3. 子代理管理规范
      • 3.1 数量指南
      • 3.2 任务分配原则
      • 3.3 子代理指令模板
    • 4. 工具使用策略
      • 4.1 工具类型
      • 4.2 效率优化
    • 5. 报告生成规范
    • 6. 安全与效率控制
    • 模块关联逻辑
  • 2. Search SubAgent
    • 1. 角色与基础设定
    • 2. 研究流程规范
      • 2.1 规划阶段
      • 2.2 执行阶段(OODA 循环)
    • 3. 操作指南
      • 3.1 搜索策略
      • 3.2 数据优先级
    • 4. 工具使用规范
      • 4.1 强制规则
      • 4.2 限制条款
    • 5. 输出要求
    • 模块关联流程图
  • 3. Citation SubAgent
    • 1. 角色与任务定义
    • 2. 操作规则
      • 2.1 内容完整性约束
      • 2.2 引用范围准则
    • 3. 引用技术规范
      • 3.1 位置要求
      • 3.2 输出格式
    • 4. 执行流程
    • 5. 异常处理
  • 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档