AI 编程正在逐渐变为事实,而从成本上来说,它比初、中级工程师要便宜得多:顶级模型一个月只要一千多。
写代码这件事正在从"人写"变成"人指挥 AI Agent 写"。 工程师角色从编码者转型为编排者(Orchestrator),人类专家专注于定义"什么问题值得解决",AI 负责"如何实现"的战术工作。
报告将八大趋势按性质分为三类:
定位:自 GUI 以来人机交互最大的一次变革。
核心变化:
三个预测:
关键观察:
案例:
Augment Code:某企业 CTO 原本估计 4-8 个月才能完成的项目,用了 Augment Code 后两周搞定。
架构模式:
案例(Fountain 劳动力管理平台):
演进轨迹:
案例(乐天 Rakuten):
工程师让 Claude Code 在 vLLM(1250 万行代码)中实现特定向量提取方法。Claude Code 自主工作 7 小时,一次运行完成,数值准确率达到参考方法的 99.9%。
核心突破:Agent 学会了什么时候该求助——不是把人类踢出局,而是让人的注意力花在刀刃上。
"协作悖论":
一位 Anthropic 工程师:"我主要在我知道答案应该是什么样子的情况下使用 AI。这种判断力是我通过'笨办法'做软件工程积累出来的。"
核心洞察:你越有经验,越能从 AI 协作中获益。AI 放大的是你已有的能力,而不是凭空创造能力。
2026 年,编程不再是专业软件工程师的专利。
案例(Legora 法律科技平台):
利用 Claude 的指令遵循能力,让不懂编程的律师也能创建复杂自动化工作流,不需要工程团队介入。
关键数据:
指标 | 数据 |
|---|---|
开发周期变化 | 从周变天,以前"不划算"的项目现在变得可行 |
AI 辅助工作中"新增工作"占比 | 27%(没 AI 根本不会做的事) |
生产力体现方式 | 产出量增幅 > 时间节省幅度 |
案例(TELUS 通信巨头):
案例(Zapier):
软件开发正从"写代码"转变为"编排写代码的 Agent",同时保持人类的判断力和监督。
四大优先行动项:
对个人的启示:
以前 80% 时间花在实现上,20% 花在思考上;现在反过来了。
最值得投资的能力(Agent 时代反而更值钱):
系统设计能力、任务拆解能力、评估代码质量的眼光。
来源:https://www.163.com/dy/article/KS8MTQ6B05566UKH\_pdya11y.html
原视频链接:https://www.youtube.com/watch?v=SlGRN8jh2RI
Claude Code 的代码库其实很简单——TypeScript 加 React,没什么秘密。 大概去年十月、十一月,我们达到了'模型写 100% 代码'的状态。现在我每天发几十个 PR,上周有一天我发了 150 个,就是想试试极限在哪。
现场调查:100% 手写代码(少数),100% 用智能体写(极少),介于两者之间(大多数)
从"人写代码,AI 辅助" → "AI 写代码,人做决策"
真正分高下的,不再是敲代码的速度,而是对问题的理解、对 agent 的编排、以及对流程的重新设计。
现在大部分工作在手机上完成。Claude 应用中 Code 标签下有 5-10 个活跃会话,每个会话下挂着几百个智能体在跑。每晚有几千个智能体做深度后台工作。他本人几乎不再手写代码。
我的 Claude 智能体在 Loop 里跑代码时,会通过 Slack 跟其他同事的 Claude 智能体互相发消息——你的 Claude 和我的 Claude 在 Slack 上协调工作,搞清楚彼此不知道的事情。这不是科幻,是日常。
未来十年颠覆各行业的创业公司数量会比过去十年多十倍。
原因:小团队能做出跟大公司一样有价值的产品;
大公司转型 AI 面临巨大内部阻力;
创业者从零开始天然 AI 原生;
这是有史以来最好的创业时机。
关于软件普及度:
最好的会计软件作者,也许今天就已经不是工程师了,而是一个优秀的会计师。 因为懂业务领域才是最难的部分,写代码反而是最简单的。这显然就是未来。
来源:https://opsera.ai/resources/report/ai-coding-impact-2026-benchmark-report/
样本规模:250,000+ 开发者,60+ 家企业
覆盖工具:GitHub Copilot、Cursor、Claude Code
AI 加快了代码产出速度,但造成了严重的交付瓶颈。 代码审查阶段严重积压,同时安全隐患上升。
AI 工具并未平等赋能所有开发者。 资深工程师能更有效地利用 AI 提升产出,而初级工程师相对滞后。
来源:https://tianpan.co/zh/blog/2026-04-20-vibe-code-at-scale-technical-debt
2026 年 3 月,一家大型电商平台在一天之内损失了 630 万个订单——占美国订单量的 99%。直接原因不是鲁莽的部署,也不是数据库故障。一个 AI 编程工具基于过时的内部文档自主生成并部署代码,导致所有市场的配送时间估算全部出错。深层原因:公司要求 80% 的工程师每周使用该工具,"采用率指标一片绿灯,工程纪律却不然。"
这不是四天就能上线的快速演示,而是第 365 天消失的 630 万个订单。
指标 | AI 生成代码 | 人工代码 | 变化 |
|---|---|---|---|
每个 PR 产生的问题数 | 10.83 个 | 6.45 个 | 高出 1.7 倍 |
逻辑/正确性错误 | — | — | 高出 75% |
代码流失率(14 天内被回滚/重写) | ~40% | — | — |
重构占变更比例 | 从 25% 降至不足 10% | — | 下降 60% |
代码重复率 | — | — | 增加 48% |
每段 AI 生成的代码在孤立状态下看起来都正确,逻辑流畅、模式可识别、测试通过。 没有任何单个 PR 明显错误。 但 AI 在孤立提示上下文中生成代码,没有对早期决策、现有模式或系统级约束的持久记忆。 后果包括:同一个抽象以三种不同方式实现;错误处理不一致;服务边界被绕过(AI 为让测试通过找更快的路径,不理解边界存在的原因)。
组合性缺陷:不是单段代码的问题,而是碎片积累到一定数量后才暴露的系统性问题。
前 3 个月:每个功能快速交付,代码库看起来没问题。 第 4-8 个月:重复开始带来影响,简单更改需要跨多个实现并行更新,复杂度指标爬升,但无灾难性事件。 第 12-18 个月:添加一个功能需要理解同一模式的五种变体,修复一处 bug 破坏另一处假设,工程师导航时间超过构建时间,事故率飙升。
重复逻辑、丢弃的重构投资和不一致的模式,需要这么长时间才能以团队可感知的协调成本形式显现出来。
75% 开发者声称手动审查了 AI 代码,但事故率同期飙升 23.5%,变更失败率跳升 30%。 工程师努力在审查,但没有起作用。
把 AI 视为精确执行规格但没有架构判断力的初级开发者。
人类的角色不是编写代码,而是提供 AI 无法提供的判断力。
如同这篇文章89.2%攻击成功率!腾讯、字节研究发现 OpenClaw Agent 存在可利用结构性漏洞,如果利用得不好,AI Agent 会给使用者带来更多安全的问题。
5 项具体实践:
来源:https://news.sina.cn/bignews/insight/2026-01-20/detail-inhhyfup7037013.d.html
就如同这篇文章AI 让我更累了,这不是错觉,AI编程一开始带来了效率,而随着它的普及和深入,却带来更多的问题。
"技术债务的预防不依赖工具本身,而在于开发者能否坚守'不信任 AI'的批判性思维——每一份工作都应为后续开发降低难度,而非制造负担。"
来源:https://www.cnblogs.com/ycfenxi/p/19954947
维度 | Cursor | Claude Code | GitHub Copilot |
|---|---|---|---|
代码补全 | ⭐⭐⭐⭐⭐ | ❌(非重点) | ⭐⭐⭐⭐ |
对话编程 | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ |
自主执行 | ⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐ |
多文件编辑 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ |
上手难度 | 低 | 中 | 低 |
价格 | $20/月 | 按 token 计费 | $10/月 |
形态 | AI IDE | 终端 Agent | 编辑器插件 |
任务:给 Node.js 项目添加 Redis 缓存层
添加新功能类任务,Claude Code 的 Agent 模式效率最高;
日常编码 Cursor 体验最好;
Copilot 是稳定的中间选项。
来源:https://news.ycombinator.com/item?id=48019025
现在我看到的每个 Jira 工单都有验收标准、复现步骤,以及关于工单为什么存在的详细信息。 每条 commit message 现在都匹配仓库风格,并详细说明提交里包含了什么。每个 MR 现在都有关于合并内容的详细信息。 我周围团队的每个代码库现在都有 70% 到 90%+ 的代码覆盖率。每行代码现在都内置了最佳实践、有用的注释和优化的热路径。 我经常同时跨多个项目交付四个功能。MCP 现在已经自动化了编程中所有的苦差事——从总结邮件,到生成 Confluence 文档,到制作演示文稿。
人们一直在喊技术债务会越积越多,但我认为恰恰相反。软件会越积越多,因为开发它现在变便宜了。大模型出现之前的大部分代码都很烂。 我接手过的大多数项目都是无文档的意大利面条式代码,由人类编写。现在坏代码的底线已经被显著提高了,而且修复问题基本上是免费的——只要你的公司愿意付 token 费用。
你能用 AI 替换整个工程师团队吗?可能,是的。你能否干脆把公司所有人都裁了然后关掉公司,也不会有大问题?对大多数公司来说,大概也可以。AI 可以帮助调试、帮助写代码、帮助起草设计,几乎每一步都可以帮忙。但当你让 OpenAI 或 Anthropic 对你的产品完全拥有代码所有权、并裁掉最后一个工程师的那一刻,就是 AI 定价可以上涨到与今天工程师工资持平的时候。你只是重新发明了高薪顾问。 或者你可以走中间路线:雇佣优秀的工程师,确保他们保持对代码库的理解,让他们使用任何能帮助他们完成工作、并且完成得好的工具。这是我所见过的有能力的公司的做法。
你能用 AI 替换整个工程师团队吗?可能,是的。你能否干脆把公司所有人都裁了然后关掉公司,也不会有大问题?对大多数公司来说,大概也可以。AI 可以帮助调试、帮助写代码、帮助起草设计,几乎每一步都可以帮忙。但当你让 OpenAI 或 Anthropic 对你的产品完全拥有代码所有权、并裁掉最后一个工程师的那一刻,就是 AI 定价可以上涨到与今天工程师工资持平的时候。你只是重新发明了高薪顾问。 或者你可以走中间路线:雇佣优秀的工程师,确保他们保持对代码库的理解,让他们使用任何能帮助他们完成工作、并且完成得好的工具。这是我所见过的有能力的公司的做法。
某些类型的代码是便宜的。概念验证是便宜的。添加适合现有架构的小功能是便宜的。 除此之外,我不太确定。编程代理非常擅长琐碎的细节,但没有品味。如果有机会,它们很快会把一个代码库变成一团泥巴。
"免费如小狗"这个比喻太妙了。 每次打开 LinkedIn,我都害怕看到那么多大佬从"编程几乎免费"中得出了"工程免费"的错误结论。 那么多钓鱼帖子在质问工程师为什么还需要付他们工资,或者洋洋得意地说他们每月生成数百万行代码……这终将走向糟糕的结局。
我在印度,初级开发者的招聘全面下滑。 AI 已经减少了对印度的外包需求,并消除了"清洁工式"工作(通常是外包给初级开发者的)。 很多人连实习都很难找到。受影响最大的领域是系统管理、DevOps 和前端。在这些领域你几乎拿不到任何 offer。 像 BrowserStack 这样的公司正在撤回校园招聘 offer。 与此同时,我在写自己的应用,已经达到了 10,000+ 月活用户,虽然从这一切中一分钱没赚到,但挺有意思的。
它假设当代码变便宜时,瓶颈会转移到判断你生成的东西到底对不对。端到端测试能做很多事,但经验告诉我这还不够。 等测试失败的时候,你已经在一个基于有缺陷的规范或设计生成的产物上浪费了一轮生成周期。 我在各阶段边界(标准 SDLC 流程:计划、设计、编码、测试)上加检查点,效果更好。 我们都知道,越早发现问题,修复成本越低。 "通过实施来学习"也是同样的道理:你需要足够了解你要去哪里,以及到达那里的路径,才能引导代理走向正确的实现。你与世界有接触——包括用户和运行软件的运维考量。代理没有。 我们用 spike(技术探索)做同样的事,只不过现在我们的 spike 变得更加深入了。 代码变便宜并没有消除验证,而是把它提前了。
这家伙在 Overture Map Foundation 工作,亚马逊、微软等是赞助商。他一直在互联网上到处鼓吹 AI。我敢肯定微软和亚马逊对这些努力非常高兴。我很高兴"10 种做 X 的方法"这类投稿只要在鼓吹 AI,就能被允许。
最大的共识:"代码像免费的小狗,维护才是真成本"。
如同这篇文章提到的GitNexus 把代码库变成知识图谱|审核 AI 产出更清晰,改 Bug 更精准,为了更好的看清楚AI生成的代码,我们开发了更多新的工具来快捷的审核、评估。
判断一:真正分高下的,不再是敲代码的速度,而是对问题的理解、对Agent的编排、以及对流程的重新设计。
判断二:技术债务的预防不依赖工具本身,而在于开发者能否坚守'不信任AI'的批判性思维。每次工作都应为后续开发降低难度,而非制造负担。
开发者对AI代码准确性的信任从 43% → 29%,但使用率却高达 84%。
资深工程师从AI中获益是初级工程师的近5倍。
AI代码合并后两周内被重写/删除的比例约 40%。
而重写的原因可能是这个:让 AI 帮你修 bug,结果它把整个代码重写了一遍。
你对代码越来越便宜是什么感受?
欢迎评论区留言。
-END-