
前两天跟一位在大厂做技术管理的哥们吃饭,他跟我吐槽了一个面试经历。
他们团队最近在做一个内部效率工具,需要接入 AI 能力。面试来了个挺资深的候选人,简历上写着“精通 Agent 架构,有多款落地产品”。
哥们问他:“如果让你来设计这个工具的 AI 部分,你会用 Workflow 还是 Agent?”
候选人眼睛一亮,仿佛终于等到了送分题,滔滔不绝地讲了二十分钟。核心思想就一个:“这都什么年代了,当然要上 Agent!Agent 能自主规划、能调用工具、能自我反思,Workflow 那种死板的链路早就过时了。”
哥们听完,只回了一句:“如果我们的用户要求响应时间在 1 秒以内,而且并发量很大,你的 Agent 方案怎么保证稳定性?”
候选人愣住了。
这道题,其实不是在考技术栈的熟练度,而是在考工程判断力。
在 AI 落地的浪潮里,我见过太多团队为了“先进”,把本来一个简单的 if-else 或者几行代码就能搞定的 Workflow,硬生生包装成了复杂的 Agent。结果呢?成本翻倍,延迟爆炸,调试起来痛不欲生。
今天,我们就来把这层窗户纸捅破:到底什么时候 Workflow 就够了,什么时候才真正需要上 Agent?
误区:步骤多不等于需要 Agent
很多人对 Agent 有一种迷之自信,觉得只要任务稍微复杂一点,涉及多个步骤,就必须上 Agent。
“你看,这个任务要先分类,再查数据库,最后生成回复,这步骤多复杂啊,肯定要让模型自己决定怎么走。”
大错特错。
步骤多,不代表路径未知。
举个最通俗的例子。你在组装宜家(IKEA)的家具。 说明书上写着:第一步,拧螺丝 A;第二步,装板子 B;第三步,拧紧螺丝 A。 这虽然步骤多,但每一步都是预定义的。你不需要在拧完螺丝后,停下来思考宇宙的尽头,然后决定下一步去煮咖啡。这就是 Workflow。
而 Agent 是什么呢? Agent 就像你雇了一个非常有经验但偶尔会犯迷糊的老师傅。你告诉他:“帮我把这个柜子装好。” 他可能先去喝了口水,然后发现少了个螺丝,自己跑去楼下五金店买了一个,回来接着装,中间还顺便帮你把地拖了。
这就是本质区别:
如果你能在一个白板上,把整个业务的流程图画得清清楚楚,没有分叉,或者分叉是确定的,那么请相信我:用 Workflow,别用 Agent。
硬上 Agent 的后果,就是让模型去“重新发明”你已经知道的逻辑。这不仅是算力的浪费,更是引入了巨大的不确定性。
Anthropic 的五种武器
在判断是否上 Agent 之前,我们得先看看 Workflow 到底有多强。很多时候,你以为 Workflow 做不到的,其实只是你没用对模式。
Anthropic 出过一篇经典的文章《Building Effective Agents》,里面提到了五种 Workflow 模式。这五种模式能覆盖 80% 以上的业务场景。
我们结合一个“企业智能报销系统”的案例来拆解一下。
这是最基础的。一步做完,校验通过,再做下一步。
★场景:员工上传了一张发票图片。流程:
这里每一步都是固定的,不需要模型思考,这就是典型的 Prompt Chaining。
根据输入的特征,分发给不同的处理链。
★场景:员工提交报销申请。流程:
很多人以为这种“判断”需要 Agent,其实一个简单的 Routing 就够了。
同时跑多个任务,互不干扰。
★场景:处理一张包含机票、酒店、餐饮的混合报销单。流程:
这种能显著降低延迟,Agent 串行处理可没这么快。
一个中心大脑负责拆解任务,分发给小弟去干,最后汇总。
★场景:月度报销汇总。流程:
注意:这依然是 Workflow!因为拆解的逻辑是预定义的(按类别拆),而不是模型自己突发奇想拆成了“周一花的钱”和“周二花的钱”。
生成 -> 评审 -> 修改 -> 再评审,直到达标。
★场景:生成给老板的报销说明邮件。流程:
这适合对质量要求极高的内容生成环节。
看完这五种,你会发现,绝大多数企业内部系统,其实用这几种组合起来就完全够用了。
四个维度,判断是否该上 Agent
既然 Workflow 这么强,那 Agent 是不是就该失业了?当然不是。
Agent 有它的不可替代性,但它的入场门槛非常高。我们可以用四个维度来做一个严格的“体检”。
这是最核心的判断标准。
实战拆解:报销系统的双轨制
为了让大家更直观地理解,我们还是回到刚才的“企业智能报销系统”。
假设你是这个系统的架构师,你会怎么设计?
最务实的方案是:混合双打。
大部分员工的报销是非常规范的:上传发票 -> 系统识别 -> 填写金额 -> 提交。 这部分完全用 Routing + Chaining。
总有那么一些“难搞”的报销。比如员工贴了一张手写的便签,上面写着:“打车去客户公司,因司机绕路多付了 20 元,申请额外补贴。”
这种非结构化的描述,Workflow 根本处理不了。这时候,Agent 出场了。
对比结论:
这就是高级工程师的价值:在合适的场景,用合适的工具。
面试官的追问链
如果你在面试中回答到了这一步,面试官通常会继续追问,考察你的实战踩坑经验。
满分回答思路: 一定要诚实地说“有”。 “我之前做过一个内部文档问答系统。一开始觉得 Agent 很酷,让它自己去检索、判断、总结。结果上线后发现,对于‘怎么报销’这种固定问题,Agent 有时候会瞎编,有时候检索不到。 后来我们把 Top 20 的高频问题提取出来,做成了固定的 Workflow(直接返回预设答案)。不仅准确率到了 100%,延迟从 3 秒降到了 0.1 秒。这让我明白,能确定的逻辑,绝对不要交给模型。”
满分回答思路: 这题考的是概念的本质。 “Orchestrator-Workers 本质上还是 Workflow。虽然它有拆解和分配的过程,但拆解的规则是代码写死的(比如按章节拆)。 而 Agent 的拆解是动态的。比如你让它写一本书,它可能先写大纲,再写第一章,发现不满意又重写,这个路径是不可预知的。只要决策逻辑可以用 if-else 穷举,那就是 Workflow;只有当逻辑依赖模型对内容的‘理解’时,才是 Agent。”
满分回答思路: “毫无疑问,优先 Workflow。Agent 的最大成本不仅仅是 Token,还有调试和维护的时间成本。Workflow 的调试是看日志,Agent 的调试是像破案一样去猜模型在想什么。在商业落地中,稳定性和可维护性往往比‘智能’更重要。”
上线后的三个大坑
最后,给大家提个醒,如果你真的决定上 Agent,这三个坑千万别踩。
坑 1:没有 Fallback(降级方案)Agent 是不可控的。如果它突然“发疯”或者 API 挂了,你的系统是不是就崩了? 必须要设计好:如果 Agent 超时或报错,自动降级成一个简单的 Workflow,或者直接转人工。永远不要把系统的命脉交给模型。
坑 2:把规则逻辑写进 Prompt比如:“如果金额大于 5000,需要审批。” 千万别让模型去判断“5000”这个数字。这是代码的事! 你应该在代码里判断 if amount > 5000,然后把 need_approval=true 传给模型。 让模型做它擅长的事(语义理解),让代码做代码擅长的事(逻辑判断)。
坑 3:为了炫技而过度拆解不要一上来就搞 Multi-Agent。什么 Planner、Executor、Critic、Evaluator 一大堆。 先搞一个单点的 Agent,跑通了,发现瓶颈了,再考虑拆分。过早优化是万恶之源,这在架构设计里同样适用。
总结
AI 落地不是比谁的技术栈更新,而是比谁更务实。
记住一句话:好的工程师,不是用最复杂的技术解决简单的问题,而是用最简单的技术解决复杂的问题。
希望这篇文章能帮你在下一次面试或者技术评审中,给出那个最“性感”又最靠谱的答案。
📢 互动时间
你在实际工作中遇到过强行上 Agent 导致的“翻车”现场吗? 或者你对 Workflow 和 Agent 的边界有什么不同的看法? 欢迎在评论区聊聊你的经历或想法。