首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Loop Engineering入门系列03:AI Agent自动化的5种Loop模式和决策表

Loop Engineering入门系列03:AI Agent自动化的5种Loop模式和决策表

作者头像
AI 生命克劳德
发布2026-06-23 20:02:12
发布2026-06-23 20:02:12
1990
举报
文章被收录于专栏:HUMAN3.0HUMAN3.0

上一篇拆了 Loop 的六块积木:Automations、Worktrees、Skills、MCP、Maker/Checker、Memory。 这一篇只解决一个更实际的问题:不同任务,到底该用哪种 Loop 模式?


选错模式,比不用 Loop 更浪费时间

很多人一开始做 AI Agent 自动化,最容易犯的错,是把所有任务都塞进同一种 Loop。

修一个 静态代码lint 错误,用一套复杂的长期工作流,太重。

排查一个线上偶发故障,只让 Agent 原地重试,太窄。

涉及支付、权限、生产发布,还想全自动跑到底,风险太高。

这篇文章给你一个直接可用的判断框架:

  • 短任务怎么用最轻的 Retry Loop
  • 多步骤任务什么时候要先规划再执行
  • 原因未知的问题怎么探索和收窄
  • 哪些节点必须让人介入
  • 什么项目才值得升级成 Lifecycle Loop

你读完至少应该拿走两样东西:5 种 Loop 模式的适用边界,以及一张能直接对照使用的决策表。

上一篇我们拆了 Loop 的六块积木。这一篇解决下一个问题:积木齐了,具体任务到底怎么搭。

五种 Loop 模式总览图

这张图把 AI Agent 自动化常见的 5 种 Loop 模式放在一起:目标明确用 Retry,多步骤任务用 Plan-Execute-Verify,方案未知用 Explore-Narrow,高风险决策用 Human-in-the-Loop,长期项目再上 Lifecycle Loop。


5 种模式,对应 5 类任务

1. 目标明确:用 Retry Loop

最简单的 Loop。逻辑直白:

让 Agent 执行 → 检查 pass/fail → 失败则重试 → 通过则停止。

适用场景:

  • 短、原子任务,有清晰的 pass/fail 标准
  • 写一个通过指定测试的函数
  • 修复 lint 错误
  • 跑通一个已知的接口调用

示例提示词:

代码语言:javascript
复制
请写一个用于校验邮箱地址的函数。
写完后运行测试。
如果测试失败,请修复问题并重新运行,最多重试 3 次。

风险:

Retry Loop 最大的风险是——无限重试不改变策略

如果 Agent 每次用同样的思路重试,结果大概率是一样的。你需要在提示词里加入"变化逻辑"的指令:

代码语言:javascript
复制
如果同一个测试连续失败 2 次,请换一种实现思路。
不要重复提交同一种修复方案。

一句话总结:

目标明确 + 验证标准清晰 → Retry Loop。


2. 步骤复杂:用 Plan-Execute-Verify

比 Retry Loop 多了一个前置步骤:先规划,再动手。

逻辑链路:

规划方案 → 执行 → 验证结果 → 如果验证失败,修订计划,重新执行。

适用场景:

  • 多步骤任务,步骤之间有顺序依赖
  • 重构一个模块(先理解结构 → 制定迁移方案 → 逐步替换 → 跑测试验证)
  • 搭建新服务(先确定架构 → 逐层实现 → 集成测试)
  • 数据库迁移(先分析影响面 → 写迁移脚本 → 验证数据一致性)

示例提示词:

代码语言:javascript
复制
请把认证模块从 session cookie 改成 JWT。
先阅读相关代码,列出需要修改的文件和修改顺序。
确认计划后,再按步骤执行。
每完成一步,都运行相关测试。
如果测试失败,先修订计划,再继续下一步。

风险:

对错误的计划过度承诺。

如果 Agent 一开始规划的方向就错了,后面的执行和验证只会在这个错误方向上越走越远。

解法:给计划阶段加约束。比如"先读这个文件,确认我的理解是对的,再出计划"。

一句话总结:

步骤多 + 顺序重要 + 早期错误会级联 → Plan-Execute-Verify。


3. 原因未知:用 Explore-Narrow

当你不知道正确答案是什么的时候用的模式。

逻辑链路:

并行探索多条路径 → 根据反馈剪掉失败路径 → 收窄到最有希望的路线 → 深入执行。

适用场景:

  • 调试一个原因不明的错误(可能是数据库、可能是网络、可能是权限——先并行排查)
  • 探索一个不熟悉的 API,不确定哪种调用方式最有效
  • 性能优化,不确定瓶颈在哪里
  • 技术选型,需要在几个方案之间做对比

示例提示词:

代码语言:javascript
复制
这个 API 偶尔返回 500 错误。
请并行排查 3 个可能原因:
1. 数据库连接池是否耗尽
2. 上游服务是否触发限流
3. 请求处理逻辑是否存在内存泄漏
每条路径都要查看对应日志和指标,并汇总发现。
最后根据证据判断最可能的原因,再集中深入排查。

风险:

上下文爆炸。

并行探索意味着同时维护多条线索,每条线索都要消耗上下文窗口。如果不及时剪枝,很快就会接近上限。

解法:尽早设置"停止规则"——某条路径如果前两步没发现线索,就放弃,转向下一条。

一句话总结:

方案未知 + 需要探索 → Explore-Narrow。


4. 影响很大:用 Human-in-the-Loop

它保留人工确认。Agent 在关键决策点停下来,等人确认,再继续。

逻辑链路:

Agent 执行 → 遇到高代价决策 → 停下来等人 → 人确认后 → Agent 继续。

适用场景:

  • 需求无法完全提前指定(比如"你觉得这个 UI 怎么样?")
  • 生产环境变更,需要人工 review 再发布
  • 涉及用户数据、计费、权限的修改
  • 方向性选择(方案 A 激进、方案 B 保守,让 Agent 列出利弊,人来拍板)

示例提示词:

代码语言:javascript
复制
请重构支付处理模块。
凡是涉及扣款链路的修改,先展示拟修改的 diff,等待我确认后再执行。
日志、注释、测试这类低风险修改,可以自动处理。

风险:

打断过频。

如果 Agent 每走一步都问一次,你省下的时间可能还没有花在"审批"上的时间多。

解法:明确"哪些需要审批,哪些不需要"。把审批粒度控制在"影响面"层面,而不是"每个文件变更"层面。

一句话总结:

高代价决策 + 需求无法完全指定 → Human-in-the-Loop。


5. 长期项目:用 Lifecycle Loop

这是最完整、也最重的一套模式。你可以把它拆成三个阶段:

这里的 P/I/V 只是为了方便记忆:先规划,再迭代,最后验证和沉淀。

P — Planning(规划)

架构师角色。把产品需求分解为可执行的 sprint contract。

I — Iteration(迭代循环)

工程师角色。自主编程、测试、修复的循环。可以用 Retry、Plan-Execute-Verify 等作为子模式。

V — Verification & Evolution(验证与进化)

质量保障 + 系统进化。对照规格独立验证产出,并把经验沉淀回 Skill。

适用场景:

  • 长期项目,需要持续迭代
  • 从 0 到 1 构建一个功能或服务
  • 需要积累项目知识的场景(Skill 会越用越厚)

结构示意:

代码语言:javascript
复制
Planning → Sprint Contract
    ↓
Iteration Loop (Retry / Plan-Execute-Verify / Explore-Narrow)
    ↓
Verification (Checker / Evaluator)
    ↓
Evolution (更新 Skill, 沉淀经验)
    ↓
回到 Planning,开始下一个 Sprint

风险:

太重。

小任务不要上 Lifecycle Loop。修一个 typo 用全生命周期循环,就像用起重机拧螺丝。

解法:把 Lifecycle Loop 留给"值得"的项目。小任务用 Retry 或 Plan-Execute-Verify 就够了。

一句话总结:

长期项目 + 持续改进 + 知识沉淀 → Lifecycle Loop。


一张表,快速选对模式

别凭感觉选。对照这张表:

任务特征

推荐模式

核心原因

目标明确 + 有 pass/fail 标准

Retry Loop

最简单的闭环,不需要规划

多步骤 + 顺序依赖

Plan-Execute-Verify

早期错误会级联,先规划减少返工

方案未知 + 需要排查

Explore-Narrow

并行探索比单路径盲猜快

高代价决策 + 需人工确认

Human-in-the-Loop

审批成本 < 误操作成本

长期项目 + 需要知识沉淀

Lifecycle Loop

完整生命周期,Skill 越用越厚

Loop 模式决策流程图

这张图把 Loop 模式选择逻辑串起来:先判断任务目标是否明确,再看能否验证、是否多步骤、是否需要探索,最后再决定要不要升级到长期项目用的 Lifecycle Loop。

额外记住一条就够了:如果只是一次性任务,用轻量模式;如果是长期项目,才值得上 Lifecycle Loop,把规划、迭代、验证和沉淀连起来。


复杂项目,要把模式组合起来

实际工作中,你不会只用一种模式。更多时候是嵌套使用

Loop 模式组合与嵌套图

这张图说明了复杂项目里的组合关系:Lifecycle Loop 管整体节奏,Iteration 阶段内部可以按任务特点嵌套 Retry、Plan-Execute-Verify 或 Explore-Narrow。

比如一个典型的 Lifecycle 工作流:

代码语言:javascript
复制
Planning 阶段 → 产出 Sprint Contract
    ↓
Iteration 阶段 → 子任务 A 用 Retry Loop
              → 子任务 B 用 Plan-Execute-Verify
              → 子任务 C 用 Explore-Narrow
    ↓
Verification 阶段 → Checker 对照测试验证(可以按 Retry Loop 执行)
    ↓
Evolution 阶段 → 把经验写入 Skill

再比如 Plan-Execute-Verify 内部:

代码语言:javascript
复制
Plan → 需要探索多个方案 → 内嵌 Explore-Narrow
Execute → 每步需要验证 → 内嵌 Retry Loop
Verify → 发现方向错了 → 回到 Plan 修订

Loop Engineering 的关键能力,是知道什么时候组合、什么时候升级。


第一次搭 Loop,从最小闭环开始

如果你是第一次搭 Loop,从 Retry Loop 开始。

找一个有测试的项目,让 Agent 修一个已知 bug,跑测试,失败了重试。

跑通一次之后,你会自然理解:

  • 什么叫"好的 pass/fail 标准"
  • 为什么"无限重试不改变策略"是坑
  • 什么时候该升级到 Plan-Execute-Verify

别一上来就搞 Lifecycle Loop。那就像还没学会骑自行车就去考飞行执照。

先把最简单的 Loop 跑通。然后一步步往上加复杂度。

Loop Engineering 要靠跑通一个真实闭环来理解。


📌 下一篇预告

《Agent 不能自己评判自己:Planner / Generator / Evaluator 三角色架构》

这篇讲了 5 种模式怎么选。但有一个核心问题还没解决:

Agent 写出来的东西,谁来审?

把生成和评估放在同一个角色里,最容易出现的问题是:写代码的人顺手给自己打高分。

下一篇拆解一套更稳的三角色架构:

  • Planner(规划器)→ 把目标拆成可执行任务
  • Generator(生成器)→ 按任务生成方案、代码或内容
  • Evaluator(评估器)→ 独立验证 Generator 的产出

为什么 Evaluator 必须和 Generator 分离?怎么写一个"够狠"的评估标准?这套架构如何从前端设计迁移到全栈开发?

有了这套分工,Loop 才有可验证、可纠错、可交付的闭环。


系列预告 第 4 篇:《Agent 不能自己评判自己:三角色架构让 Loop 真正闭环》 拆解 Planner、Generator、Evaluator,解决谁来规划、谁来生成、谁来验收的问题。 第 5 篇:《从零搭建你的第一个 Loop:CI 自动修复实战》 把前面的积木、模式和三角色架构合起来,搭一个可复制的 CI 自动修复 Loop。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-06-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 深空矩阵 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 选错模式,比不用 Loop 更浪费时间
  • 5 种模式,对应 5 类任务
    • 1. 目标明确:用 Retry Loop
    • 2. 步骤复杂:用 Plan-Execute-Verify
    • 3. 原因未知:用 Explore-Narrow
    • 4. 影响很大:用 Human-in-the-Loop
    • 5. 长期项目:用 Lifecycle Loop
  • 一张表,快速选对模式
  • 复杂项目,要把模式组合起来
  • 第一次搭 Loop,从最小闭环开始
  • 📌 下一篇预告
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档