前面一篇我们讲了AI时代工程师价值在哪里?参看Simon发布《代理工程模式》:当代码成本归零,工程师价值在哪里?实际上,天生作为需求方的PM并不能豁免,一样面临挑战。
从2024年10月开始,Anthropic Claude Code的产品负责人Cat Wu就用同一个任务测试每个新模型:让Claude Code给Excalidraw添加表格工具。
每个版本都往前走一点,但都失败了。直到Opus 4.6,终于可以在数千名开发者面前现场演示。
这个细节揭示的不是模型进步,而是一个更根本的问题:传统产品管理的假设已经死了。
传统PM假设项目开始时能做什么,项目结束时大体还是能做什么。你定好PRD,找工程师开发,几个月后交付。但在AI指数级增长的时代,你为之设计的技术约束,可能在项目进行到一半时直接消失。
Cat Wu在Anthropic的博客文章中写道:"你是在一块不断上升的地基上建造。"
METR测量显示,Sonnet 3.5能处理人类21分钟的任务。Opus 4.6能处理人类近12小时的任务。
16个月,提升了41倍。
这意味着模型每发布一个新版本,之前做的技术决策就得重新审视一遍。

Claude Code和Cowork等工具正在模糊产品开发生命周期中不同角色之间的界限。
Cat Wu的工作流程自然分为三个产品:聊天协作者(Claude.ai)、代码工具(Claude Code)和知识工作工具(Cowork)。每个工具有其特定用途,从思考伙伴到建立原型再到处理日常工作。

_METR. (2026, March). Task-Completion Time Horizons of Frontier AI Models._
METR发现,Opus 4.6可以完成需要人类近12小时的软件任务。而当初开始建设Claude Code时,Sonnet 3.5只能处理21分钟的任务。
16个月内,提升了41倍。
传统PM把探索当作路线图锁定前的事情。你做完研究,写好PRD,然后交给工程团队开发。
Claude Code团队的做法是鼓励每个人(工程师、PM、设计师)承担"支线任务"——在官方路线图之外进行的短期自导实验。
Anthropic最受欢迎的几个功能——Claude Code桌面版、AskUserQuestion工具、Todo列表——都是通过这种方式产生的。
团队用原型优先思维取代了文档优先思维。站会变成了新想法演示会。内部用户试用后,有真实参与度的功能才被打磨并广泛分享。
因为一个下午就能搭建原型,押错注的成本极低。
现在你发布一个功能,然后更好的模型来了,你的功能可能大幅提升。每个模型发布都是重新审视已有功能的隐含提示。
Claude Code与Chrome的集成就是这样发现的:团队注意到用户在用Claude Code构建Web应用后,手动切换到Chrome测试。用户在不同工具间手动提示和复制粘贴指令。这个动作本身就说明它应该被原生支持。
如果你的产品巧妙地绕过了模型限制,当下一个模型发布时,这个绕行方案就变成了不必要的复杂性。
Claude Code最初在系统提示中添加定期提醒,让agent更新自己的Todo列表。下一个模型直接原生支持了这个行为,提醒就被删掉了。系统提示随着每次模型升级持续缩减,Opus 4.6又减少了20%。
习惯于掌控完整产品体验的PM,必须放弃完美主义才能跟上技术速度。新的工作是:识别真正不可妥协的少数几件事,然后放开其余的。
Cat Wu总结道:"当产品经理能在一个下午从想法到工作原型时,'如果我们尝试...'和'这里,试试这个'之间的差距几乎消失了。"
在AI时代,执行力可以被无限供给,判断力才是真正稀缺的。这或许在任何一个未来职业里都一样重要。