重磅！OpenAI首提AI原生研发团队时代到来！

AgenticAI

发布于 2025-11-29 14:14:19

2850

文章被收录于专栏：AgenticAIAgenticAI

继多年前云原生服务开发，催生了各种云服务，诸如aws，azure，google cloud，阿里云，腾讯云；以及各种微服务，各种工具，诸如k8s，rancher；还有基于此构建的各种云服务，也同时催生看非常多的实力强大的公司！

在AI时代，随着llm的能力增强，各种编码vibe coding工具层出不穷，诸如claude code，codex，gemini，antigravity，cline和kiro等。相信各位也认识到这些工具的强大，他们不仅仅只能编码，还可以编写文档，甚至还有人用来写小说。现在所谓前端已死，设计已死等话题也甚嚣尘上，这里不做具体评价。

而今也越来越多公司，开始要求提高ai编码的比率，因为部分效率的提高，甚至有公司裁员来节省开支，也出现了很多的一人司。而这催生了一个新的概念：AI-Native Engineering Team，由OpenAI首次提出。

OpenAI作为此轮大语言模型的领导者，首次完整阐述了如何构建AI-Native Engineering Team，系统回答了“如何让 AI 成为研发流程的一等公民”。

把 AI 从“IDE 里的补全工具”升级为“贯穿需求 → 设计 → 编码 → 测试 → 评审 → 文档 → 运维”的全职队友。

1. 模型到底能“连续干多久的活”？ • 2020 年：≈30 s 的推理链（只能补全一行函数）。 • 2025 年 8 月：≈2 h 17 min 连续工作，50 % 概率一次性把任务做对。 • scaling 规律：任务长度每 7 个月翻倍。

或许半年后的模型就能做完一次 Sprint 的编码子任务；现在正是把“整段工作流”打包给 AI 的窗口期。

2 人才模型

任何任务都用同一套“Delegate → Review → Own”分工，让团队瞬间有共识： 1. Delegate（AI 先干）凡机械、可验证、上下文封闭的工作一律交给 Agent。 2. Review（人二次把关）重点看架构、性能、安全、业务一致性。 3. Own（人最终兜底）新抽象、模糊需求、跨系统 trade-off 仍归人类负责。

3 需求阶段：把“需求澄清会” 1. 把 Jira/GitHub Issue 通过 MCP 接到 Codex。 2. Agent 读取 spec → 自动输出： ‑ 涉及的服务/文件列表 ‑ 依赖接口与枚举值 ‑ 模糊/缺失点 Q&A 清单 3. 人类只做“Review & 补缺口”，省去 60 % 对齐会议。

4 设计阶段：Figma → 可编译原型 1. 用多模态模型（支持图片输入）直接把设计图转 React/Vue 组件。 2. 通过 MCP 把 Design Token 仓库喂给模型，保证颜色/间距 0 误差。 3. 1小时内得到： ‑ 带 TS 类型的组件骨架 ‑ 可访问性扫描报告 ‑ Storybook 样例人类只调交互状态、复杂业务钩子。

5 编码阶段

让 Agent 写“整个功能”而不是“下一行”，关键动作： 1. 先让模型写 PLAN.md → 人类确认架构边界 → 再开写。 2. 开启长上下文 + 代码压缩，保证 100+ 文件级重构不跑偏。 3. 一次生成：model/schema/API/UI/test/doc，五件套同 PR 提交。 4. 用 AGENTS.md 固化内部规范（error handling、telemetry、命名）。

6 测试/评审

把覆盖率 & PR 评论也自动化

测试 • 先写测试 → 故意跑红 → 再写功能，让 Agent 自己玩 TDD 循环。 • 用单独 Session 生成测试，防止“功能代码泄露”导致虚假绿条。评审 • 用“专精代码评审”微调模型（非通用 chat 模型），噪音降低 70 %。 • 评审范围：并发 bug、DB 隐式锁、硬编码、未来扩容瓶颈。 • 人只看架构契合度 & 产品意图，平均节省 2–5 h/人/周。

7 运维阶段

把 On-Call 头 30 分钟的工作交给 AI，接入套路 1. 把日志系统（ELK/Prometheus）通过 MCP 暴露给 Codex。 2. 预制 Prompt 模板： “过去 30 min 内 /payment 错误率 > 5 %，列出对应 commit diff & 可能根因。” 3. Agent 自动： ‑ 拉日志 → 关联最近部署 → 圈出可疑函数 → 给出修复 PR 草稿。 4. 人只做“判断影响面 + 按合并按钮”。 Virgin Atlantic 实测：MTTR 从 45 min 降到 12 min。最后 “AI 不是帮你写下一行代码，而是帮你跑完整个 Sprint——工程师升级做导演，Agent 当演员。”把这份作战地图钉在 war-room，按图施工，90 天你就能拥有一个“AI-Native”工程团队。

虽然原文充斥了各种codex，但不缺乏泛化到其他AI工具，同时也非常着重的强调了spec的重要性。期待第一个AI Native 研发团队做出的产品！

原文链接：https://cdn.openai.com/business-guides-and-resources/building-an-ai-native-engineering-team.pdf

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2025-11-22，如有侵权请联系 cloudcommunity@tencent.com 删除

模型