当 AI 编程使得代码变得便宜......

勇哥AI笔记

发布于 2026-05-07 15:19:30

320

文章被收录于专栏：技术人生黄勇技术人生黄勇

AI 编程正在逐渐变为事实，而从成本上来说，它比初、中级工程师要便宜得多：顶级模型一个月只要一千多。

一、Anthropic《2026 Agentic Coding 趋势报告》

核心主题

写代码这件事正在从"人写"变成"人指挥 AI Agent 写"。工程师角色从编码者转型为编排者（Orchestrator），人类专家专注于定义"什么问题值得解决"，AI 负责"如何实现"的战术工作。

八大趋势

报告将八大趋势按性质分为三类：

• 基础趋势：趋势 1 — 软件开发生命周期发生巨变
• 能力趋势：趋势 2 — 从单个 Agent 进化为协同战队；趋势 3 — 长时间运行的 Agent 构建完整系统；趋势 4 — 人类监督通过智能协作实现规模化；趋势 5 — Agent 编程扩展到新领域和新用户
• 影响趋势：趋势 6 — 生产力收益重塑软件开发经济学；趋势 7 — 非技术用例在组织内扩展；趋势 8 — 安全的双刃剑

趋势 1：软件开发生命周期发生巨变

定位：自 GUI 以来人机交互最大的一次变革。

核心变化：

• 传统 SDLC（需求 → 设计 → 编码 → 测试 → 部署 → 审查）周期从"周/月"压缩到"小时/天"
• Agent 负责代码实现、自动化测试、文档生成，监控反馈驱动快速迭代

三个预测：

1. 写代码、调试、维护等"苦活累活"主要交 AI，工程师聚焦架构设计与系统设计
2. 工程师角色从"写代码的人"变成"编排 Agent 写代码的人"，负责评估产出、给方向
3. 新员工上手陌生代码库的时间从几周缩短到几小时

关键观察：

• 工程师并没有被取代，反而变得更像"全栈工程师"——AI 填补了知识空白，可跨前端、后端、数据库、基础设施工作
• 工程师倾向于把容易验证、定义清晰、重复性的任务交给 AI，把高层设计和需要"品味"的决策留给自己

案例：

Augment Code：某企业 CTO 原本估计 4-8 个月才能完成的项目，用了 Augment Code 后两周搞定。

趋势 2：从单个 Agent 进化为协同战队

架构模式：

• 指挥官 Agent：负责拆解任务、分配工作、合成结果、把控质量
• 专家 Agent：分别负责架构设计、代码实现、测试验证、审查文档

案例（Fountain 劳动力管理平台）：

• 筛选速度提升 50%
• 入职速度提升 40%
• 候选人转化率翻倍
• 某物流客户招聘新运营中心从一周多 → 不到 72 小时

趋势 3：长时间运行的 Agent 构建完整系统

演进轨迹：

• 早期：分钟级（修 bug、写函数）
• 2025 年底：小时级（生成完整功能集）
• 2026 年预测：天级甚至周级，极少人工干预下构建整个应用和系统

案例（乐天 Rakuten）：

工程师让 Claude Code 在 vLLM（1250 万行代码）中实现特定向量提取方法。Claude Code 自主工作 7 小时，一次运行完成，数值准确率达到参考方法的 99.9%。

趋势 4：人类监督通过智能协作实现规模化

核心突破：Agent 学会了什么时候该求助——不是把人类踢出局，而是让人的注意力花在刀刃上。

"协作悖论"：

• 开发者在 60% 的工作中用到 AI，但真正能"完全放权"的任务只有 0-20%
• 越到概念复杂或依赖设计的任务，工程师越倾向于紧密协作而非完全甩手

一位 Anthropic 工程师："我主要在我知道答案应该是什么样子的情况下使用 AI。这种判断力是我通过'笨办法'做软件工程积累出来的。"
核心洞察：你越有经验，越能从 AI 协作中获益。AI 放大的是你已有的能力，而不是凭空创造能力。

趋势 5：Agent 编程扩展到新领域和新用户

2026 年，编程不再是专业软件工程师的专利。

案例（Legora 法律科技平台）：

利用 Claude 的指令遵循能力，让不懂编程的律师也能创建复杂自动化工作流，不需要工程团队介入。

趋势 6：生产力收益重塑软件开发经济学

关键数据：

指标	数据
开发周期变化	从周变天，以前"不划算"的项目现在变得可行
AI 辅助工作中"新增工作"占比	27%（没 AI 根本不会做的事）
生产力体现方式	产出量增幅 > 时间节省幅度

案例（TELUS 通信巨头）：

• 创建超过 13,000 个定制 AI 解决方案
• 工程代码发布速度提升 30%
• 累计节省超过 50 万小时

趋势 7：非技术用例在组织内扩展

案例（Zapier）：

• 89% 的员工都在用 AI
• 内部部署了 800 多个 AI Agent
• 设计团队用 Claude 在客户访谈中实时生成设计原型（以前需要几周）

报告核心结论

软件开发正从"写代码"转变为"编排写代码的 Agent"，同时保持人类的判断力和监督。

四大优先行动项：

1. 掌握多 Agent 协同
2. 扩展人机监督（建立 AI 自动审查系统，人类注意力集中在关键处）
3. Agent 编程能力跨部门扩展
4. 安全左移（从设计最早期就把安全架构嵌入 Agent 系统）

对个人的启示：

以前 80% 时间花在实现上，20% 花在思考上；现在反过来了。

最值得投资的能力（Agent 时代反而更值钱）：

系统设计能力、任务拆解能力、评估代码质量的眼光。

二、Claude Code 创始人 Boris Cherny ：编程已被解决

来源：https://www.163.com/dy/article/KS8MTQ6B05566UKH\_pdya11y.html

原视频链接：https://www.youtube.com/watch?v=SlGRN8jh2RI

关于"编程已被解决"

Claude Code 的代码库其实很简单——TypeScript 加 React，没什么秘密。大概去年十月、十一月，我们达到了'模型写 100% 代码'的状态。现在我每天发几十个 PR，上周有一天我发了 150 个，就是想试试极限在哪。

现场调查：100% 手写代码（少数），100% 用智能体写（极少），介于两者之间（大多数）

开发者角色的根本变化

从"人写代码，AI 辅助" → "AI 写代码，人做决策"
真正分高下的，不再是敲代码的速度，而是对问题的理解、对 agent 的编排、以及对流程的重新设计。

Boris 的个人工作流

现在大部分工作在手机上完成。Claude 应用中 Code 标签下有 5-10 个活跃会话，每个会话下挂着几百个智能体在跑。每晚有几千个智能体做深度后台工作。他本人几乎不再手写代码。

Loop（循环）和 Routines（例程）

我的 Claude 智能体在 Loop 里跑代码时，会通过 Slack 跟其他同事的 Claude 智能体互相发消息——你的 Claude 和我的 Claude 在 Slack 上协调工作，搞清楚彼此不知道的事情。这不是科幻，是日常。

对未来趋势的核心预测

未来十年颠覆各行业的创业公司数量会比过去十年多十倍。

原因：小团队能做出跟大公司一样有价值的产品；

大公司转型 AI 面临巨大内部阻力；

创业者从零开始天然 AI 原生；

这是有史以来最好的创业时机。

关于软件普及度：

最好的会计软件作者，也许今天就已经不是工程师了，而是一个优秀的会计师。因为懂业务领域才是最难的部分，写代码反而是最简单的。这显然就是未来。

核心观点

• "编程这件事的形态正在从'人写代码，AI 辅助'，转向'AI 写代码，人做决策'。"
• "Organizational process（组织流程）才是真正的领先，不是技术。"
• "懂业务领域才是最难的部分，写代码反而是最简单的。"
• "规划视野只向前看一周——不是不想规划，是变化太快了，规划了也没用。"

三、Opsera《AI Coding Impact 2026 Benchmark Report》

来源：https://opsera.ai/resources/report/ai-coding-impact-2026-benchmark-report/

样本规模：250,000+ 开发者，60+ 家企业

覆盖工具：GitHub Copilot、Cursor、Claude Code

三大核心发现

1. 生产力加速 vs. 质量隐患并存

• Time-to-PR 缩短：最多 58%
• PR 审查等待时间：延长 4.6 倍
• 安全漏洞：AI 生成代码引入多出 15-18%

AI 加快了代码产出速度，但造成了严重的交付瓶颈。代码审查阶段严重积压，同时安全隐患上升。

2. 资深与初级工程师的差距急剧扩大

• 资深工程师生产力捕获：约为初级工程师的近 5 倍
• 核心问题："执行差距"在 AI 赋能团队中持续扩大

AI 工具并未平等赋能所有开发者。资深工程师能更有效地利用 AI 提升产出，而初级工程师相对滞后。

3. AI 许可证利用率不足

• 未充分利用的 AI 编程许可证：21%

其他发现

• 90% 的团队每天使用 AI 工具，但结果好坏参半
• 在受监管行业中有效的方法，在其他环境中可能不是最优选择

四、规模化 Vibe 编程：技术债务实证研究

来源：https://tianpan.co/zh/blog/2026-04-20-vibe-code-at-scale-technical-debt

事故案例：630 万个订单损失

2026 年 3 月，一家大型电商平台在一天之内损失了 630 万个订单——占美国订单量的 99%。直接原因不是鲁莽的部署，也不是数据库故障。一个 AI 编程工具基于过时的内部文档自主生成并部署代码，导致所有市场的配送时间估算全部出错。深层原因：公司要求 80% 的工程师每周使用该工具，"采用率指标一片绿灯，工程纪律却不然。"
这不是四天就能上线的快速演示，而是第 365 天消失的 630 万个订单。

1.53 亿行代码对比研究

指标	AI 生成代码	人工代码	变化
每个 PR 产生的问题数	10.83 个	6.45 个	高出 1.7 倍
逻辑/正确性错误	—	—	高出 75%
代码流失率（14 天内被回滚/重写）	~40%	—	—
重构占变更比例	从 25% 降至不足 10%	—	下降 60%
代码重复率	—	—	增加 48%

安全维度数据

• Veracode 2025 报告：45% 的 AI 生成代码引入安全漏洞，横跨 43 个 CWE 类别
• 财富 50 强企业月度安全发现：从 ~1000 个飙升至超过 10000 个（10 倍）
• 4800 个团队 / 810 万个 PR 的实证研究：AI 采用后技术债务增加 30-41%
• 无治理机制的团队：第二年维护成本达到传统水平的 4 倍

"局部连贯、全局不一致"的核心失效模式

每段 AI 生成的代码在孤立状态下看起来都正确，逻辑流畅、模式可识别、测试通过。没有任何单个 PR 明显错误。但 AI 在孤立提示上下文中生成代码，没有对早期决策、现有模式或系统级约束的持久记忆。后果包括：同一个抽象以三种不同方式实现；错误处理不一致；服务边界被绕过（AI 为让测试通过找更快的路径，不理解边界存在的原因）。
组合性缺陷：不是单段代码的问题，而是碎片积累到一定数量后才暴露的系统性问题。

12-18 个月的演变弧线

前 3 个月：每个功能快速交付，代码库看起来没问题。第 4-8 个月：重复开始带来影响，简单更改需要跨多个实现并行更新，复杂度指标爬升，但无灾难性事件。第 12-18 个月：添加一个功能需要理解同一模式的五种变体，修复一处 bug 破坏另一处假设，工程师导航时间超过构建时间，事故率飙升。
重复逻辑、丢弃的重构投资和不一致的模式，需要这么长时间才能以团队可感知的协调成本形式显现出来。

为什么代码审查失效

• AI 生成 PR 等待审查时间：人工贡献的 4.6 倍
• 采用 AI 后团队审查时间增加 91%
• 审查积压导致审查员"浏览了事"
• AI 代码句法整洁、格式一致，"看起来正确"被误认为"确实正确"
• 当同一 AI 工具既生成又审查代码时，语言模型表现出确认偏误

75% 开发者声称手动审查了 AI 代码，但事故率同期飙升 23.5%，变更失败率跳升 30%。工程师努力在审查，但没有起作用。

应对建议

把 AI 视为精确执行规格但没有架构判断力的初级开发者。

人类的角色不是编写代码，而是提供 AI 无法提供的判断力。

如同这篇文章89.2%攻击成功率！腾讯、字节研究发现 OpenClaw Agent 存在可利用结构性漏洞，如果利用得不好，AI Agent 会给使用者带来更多安全的问题。

5 项具体实践：

1. 先写规格，再写代码 — 在任何 AI 代码生成前要求人工审查的规格文档，定义接口契约、类型约束、依赖边界和验收标准
2. 可执行的架构不变量 — 不靠 wiki 文档，靠 CI 中运行的架构约束（如 ArchUnit）。
AI 生成违反规则时代码构建失败，违规在合并前被捕获
3. 衡量健康而非速度的指标 — 跟踪代码流失率、重复百分比、圈复杂度、缺陷逃逸率，而非提交数和代码行数。健康的 AI 辅助代码库应保持 15-25% 的重构比例
4. 将人类判断力保留给不可逆的决策 — AI 用于样板代码、CRUD 层、测试脚手架；人类保留给安全关键代码、系统不变量、架构决策和具有非显而易见边缘情况的业务逻辑
5. 像对待外部依赖代码一样对待 AI 生成代码 — 以"这段代码没有机构知识"的心态审查

数据统计与建议

• 开发者对 AI 代码准确性的信任：从 43% 降至 29%，但采用率却达到 84%
• 预计到 2026 年，75% 的技术决策者将面临 AI 采用带来的中度到严重技术债务
• 第一年建立治理机制的团队将在可维护性上拥有复利式优势

五、德国研究：AI 编程的效率陷阱

来源：https://news.sina.cn/bignews/insight/2026-01-20/detail-inhhyfup7037013.d.html

就如同这篇文章AI 让我更累了，这不是错觉，AI编程一开始带来了效率，而随着它的普及和深入，却带来更多的问题。

核心数据

• 79% 的开发者会直接接受 AI 生成的代码而缺乏批判性审查
• AI 辅助下任务耗时反而增加了 19%（主因是调试时间远超预期）
• 初级开发者依赖 AI 完成 80% 的常规工作，但跳过了数据结构、算法调试等基础训练
• 导致其无法独立解决复杂问题，或修复 AI 产生的"拆东补西式"错误

核心警示

"技术债务的预防不依赖工具本身，而在于开发者能否坚守'不信任 AI'的批判性思维——每一份工作都应为后续开发降低难度，而非制造负担。"

六、AI 编程工具横评：Cursor vs Claude Code vs Copilot

来源：https://www.cnblogs.com/ycfenxi/p/19954947

六维评分

维度	Cursor	Claude Code	GitHub Copilot
代码补全	⭐⭐⭐⭐⭐	❌（非重点）	⭐⭐⭐⭐
对话编程	⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐
自主执行	⭐⭐	⭐⭐⭐⭐⭐	⭐⭐
多文件编辑	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐
上手难度	低	中	低
价格	$20/月	按 token 计费	$10/月
形态	AI IDE	终端 Agent	编辑器插件

三条演进路线

• Copilot 路线：更智能的补全，越来越像"读心术"
• Cursor 路线：AI 原生 IDE，编辑器本身成为 AI 界面
• Claude Code 路线：自主 Agent，AI 从"助手"变成"同事"

终极推荐组合

• 独立开发者 / 个人项目：Cursor + Claude Code（日常 Cursor，大任务 Claude Code）
• 公司团队开发：GitHub Copilot 企业版
• 初学者：先 GitHub Copilot，再升级到 Cursor
• 想体验最前沿 AI Agent：Claude Code
• 预算有限：GitHub Copilot（有免费版）

真实对比实验

任务：给 Node.js 项目添加 Redis 缓存层

• Cursor：实时补全 Redis 用法，Cmd+K 生成中间件。需主动引导，逐步完成。
• Claude Code：自动分析项目 → 安装依赖 → 创建工具类 → 修改路由 → 更新配置。几乎不需要人工干预。
• GitHub Copilot：补全质量不错，Chat 模式可解释生成。需手动操作每一步。

添加新功能类任务，Claude Code 的 Agent 模式效率最高；

日常编码 Cursor 体验最好；

Copilot 是稳定的中间选项。

七、Hacker News 讨论

来源：https://news.ycombinator.com/item?id=48019025

@spicyusername

现在我看到的每个 Jira 工单都有验收标准、复现步骤，以及关于工单为什么存在的详细信息。每条 commit message 现在都匹配仓库风格，并详细说明提交里包含了什么。每个 MR 现在都有关于合并内容的详细信息。我周围团队的每个代码库现在都有 70% 到 90%+ 的代码覆盖率。每行代码现在都内置了最佳实践、有用的注释和优化的热路径。我经常同时跨多个项目交付四个功能。MCP 现在已经自动化了编程中所有的苦差事——从总结邮件，到生成 Confluence 文档，到制作演示文稿。
人们一直在喊技术债务会越积越多，但我认为恰恰相反。软件会越积越多，因为开发它现在变便宜了。大模型出现之前的大部分代码都很烂。我接手过的大多数项目都是无文档的意大利面条式代码，由人类编写。现在坏代码的底线已经被显著提高了，而且修复问题基本上是免费的——只要你的公司愿意付 token 费用。

@lionkor

你能用 AI 替换整个工程师团队吗？可能，是的。你能否干脆把公司所有人都裁了然后关掉公司，也不会有大问题？对大多数公司来说，大概也可以。AI 可以帮助调试、帮助写代码、帮助起草设计，几乎每一步都可以帮忙。但当你让 OpenAI 或 Anthropic 对你的产品完全拥有代码所有权、并裁掉最后一个工程师的那一刻，就是 AI 定价可以上涨到与今天工程师工资持平的时候。你只是重新发明了高薪顾问。或者你可以走中间路线：雇佣优秀的工程师，确保他们保持对代码库的理解，让他们使用任何能帮助他们完成工作、并且完成得好的工具。这是我所见过的有能力的公司的做法。
你能用 AI 替换整个工程师团队吗？可能，是的。你能否干脆把公司所有人都裁了然后关掉公司，也不会有大问题？对大多数公司来说，大概也可以。AI 可以帮助调试、帮助写代码、帮助起草设计，几乎每一步都可以帮忙。但当你让 OpenAI 或 Anthropic 对你的产品完全拥有代码所有权、并裁掉最后一个工程师的那一刻，就是 AI 定价可以上涨到与今天工程师工资持平的时候。你只是重新发明了高薪顾问。或者你可以走中间路线：雇佣优秀的工程师，确保他们保持对代码库的理解，让他们使用任何能帮助他们完成工作、并且完成得好的工具。这是我所见过的有能力的公司的做法。

@noelwelsh

某些类型的代码是便宜的。概念验证是便宜的。添加适合现有架构的小功能是便宜的。除此之外，我不太确定。编程代理非常擅长琐碎的细节，但没有品味。如果有机会，它们很快会把一个代码库变成一团泥巴。

@torben-friis

"免费如小狗"这个比喻太妙了。每次打开 LinkedIn，我都害怕看到那么多大佬从"编程几乎免费"中得出了"工程免费"的错误结论。那么多钓鱼帖子在质问工程师为什么还需要付他们工资，或者洋洋得意地说他们每月生成数百万行代码……这终将走向糟糕的结局。

@faangguyindia

我在印度，初级开发者的招聘全面下滑。 AI 已经减少了对印度的外包需求，并消除了"清洁工式"工作（通常是外包给初级开发者的）。很多人连实习都很难找到。受影响最大的领域是系统管理、DevOps 和前端。在这些领域你几乎拿不到任何 offer。像 BrowserStack 这样的公司正在撤回校园招聘 offer。与此同时，我在写自己的应用，已经达到了 10,000+ 月活用户，虽然从这一切中一分钱没赚到，但挺有意思的。

@mrothroc

它假设当代码变便宜时，瓶颈会转移到判断你生成的东西到底对不对。端到端测试能做很多事，但经验告诉我这还不够。等测试失败的时候，你已经在一个基于有缺陷的规范或设计生成的产物上浪费了一轮生成周期。我在各阶段边界（标准 SDLC 流程：计划、设计、编码、测试）上加检查点，效果更好。我们都知道，越早发现问题，修复成本越低。 "通过实施来学习"也是同样的道理：你需要足够了解你要去哪里，以及到达那里的路径，才能引导代理走向正确的实现。你与世界有接触——包括用户和运行软件的运维考量。代理没有。我们用 spike（技术探索）做同样的事，只不过现在我们的 spike 变得更加深入了。代码变便宜并没有消除验证，而是把它提前了。

@asG1298

这家伙在 Overture Map Foundation 工作，亚马逊、微软等是赞助商。他一直在互联网上到处鼓吹 AI。我敢肯定微软和亚马逊对这些努力非常高兴。我很高兴"10 种做 X 的方法"这类投稿只要在鼓吹 AI，就能被允许。

一个共识、两个判断、三个数据

最大的共识："代码像免费的小狗，维护才是真成本"。

如同这篇文章提到的GitNexus 把代码库变成知识图谱｜审核 AI 产出更清晰，改 Bug 更精准，为了更好的看清楚AI生成的代码，我们开发了更多新的工具来快捷的审核、评估。

判断一：真正分高下的，不再是敲代码的速度，而是对问题的理解、对Agent的编排、以及对流程的重新设计。

判断二：技术债务的预防不依赖工具本身，而在于开发者能否坚守'不信任AI'的批判性思维。每次工作都应为后续开发降低难度，而非制造负担。

开发者对AI代码准确性的信任从 43% → 29%，但使用率却高达 84%。

资深工程师从AI中获益是初级工程师的近5倍。

AI代码合并后两周内被重写/删除的比例约 40%。

而重写的原因可能是这个：让 AI 帮你修 bug，结果它把整个代码重写了一遍。

你对代码越来越便宜是什么感受？

欢迎评论区留言。

-END-

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2026-05-06，如有侵权请联系 cloudcommunity@tencent.com 删除

工程师

本文分享自技术人生黄勇微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度