首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >重磅!OpenAI首提AI原生研发团队时代到来!

重磅!OpenAI首提AI原生研发团队时代到来!

作者头像
AgenticAI
发布2025-11-29 14:14:19
发布2025-11-29 14:14:19
40
举报
文章被收录于专栏:AgenticAIAgenticAI

继多年前云原生服务开发,催生了各种云服务,诸如aws,azure,google cloud,阿里云,腾讯云;以及各种微服务,各种工具,诸如k8s,rancher;还有基于此构建的各种云服务,也同时催生看非常多的实力强大的公司!

在AI时代,随着llm的能力增强,各种编码vibe coding工具层出不穷,诸如claude code,codex,gemini,antigravity,cline和kiro等。相信各位也认识到这些工具的强大,他们不仅仅只能编码,还可以编写文档,甚至还有人用来写小说。现在所谓前端已死,设计已死等话题也甚嚣尘上,这里不做具体评价。

而今也越来越多公司,开始要求提高ai编码的比率,因为部分效率的提高,甚至有公司裁员来节省开支,也出现了很多的一人司。而这催生了一个新的概念:AI-Native Engineering Team,由OpenAI首次提出。

OpenAI作为此轮大语言模型的领导者,首次完整阐述了如何构建AI-Native Engineering Team,系统回答了“如何让 AI 成为研发流程的一等公民”。

把 AI 从“IDE 里的补全工具”升级为“贯穿需求 → 设计 → 编码 → 测试 → 评审 → 文档 → 运维”的全职队友。

1. 模型到底能“连续干多久的活”? • 2020 年:≈30 s 的推理链(只能补全一行函数)。 • 2025 年 8 月:≈2 h 17 min 连续工作,50 % 概率一次性把任务做对。 • scaling 规律:任务长度每 7 个月翻倍。

或许半年后的模型就能做完一次 Sprint 的编码子任务;现在正是把“整段工作流”打包给 AI 的窗口期。

2 人才模型

任何任务都用同一套“Delegate → Review → Own”分工,让团队瞬间有共识: 1. Delegate(AI 先干) 凡机械、可验证、上下文封闭的工作一律交给 Agent。 2. Review(人二次把关) 重点看架构、性能、安全、业务一致性。 3. Own(人最终兜底) 新抽象、模糊需求、跨系统 trade-off 仍归人类负责。

3 需求阶段:把“需求澄清会” 1. 把 Jira/GitHub Issue 通过 MCP 接到 Codex。 2. Agent 读取 spec → 自动输出: ‑ 涉及的服务/文件列表 ‑ 依赖接口与枚举值 ‑ 模糊/缺失点 Q&A 清单 3. 人类只做“Review & 补缺口”,省去 60 % 对齐会议。

4 设计阶段:Figma → 可编译原型 1. 用多模态模型(支持图片输入)直接把设计图转 React/Vue 组件。 2. 通过 MCP 把 Design Token 仓库喂给模型,保证颜色/间距 0 误差。 3. 1小时内得到: ‑ 带 TS 类型的组件骨架 ‑ 可访问性扫描报告 ‑ Storybook 样例 人类只调交互状态、复杂业务钩子。

5 编码阶段

让 Agent 写“整个功能”而不是“下一行”,关键动作: 1. 先让模型写 PLAN.md → 人类确认架构边界 → 再开写。 2. 开启长上下文 + 代码压缩,保证 100+ 文件级重构不跑偏。 3. 一次生成:model/schema/API/UI/test/doc,五件套同 PR 提交。 4. 用 AGENTS.md 固化内部规范(error handling、telemetry、命名)。

6 测试/评审

把覆盖率 & PR 评论也自动化

测试 • 先写测试 → 故意跑红 → 再写功能,让 Agent 自己玩 TDD 循环。 • 用单独 Session 生成测试,防止“功能代码泄露”导致虚假绿条。 评审 • 用“专精代码评审”微调模型(非通用 chat 模型),噪音降低 70 %。 • 评审范围:并发 bug、DB 隐式锁、硬编码、未来扩容瓶颈。 • 人只看架构契合度 & 产品意图,平均节省 2–5 h/人/周。

7 运维阶段

把 On-Call 头 30 分钟的工作交给 AI,接入套路 1. 把日志系统(ELK/Prometheus)通过 MCP 暴露给 Codex。 2. 预制 Prompt 模板: “过去 30 min 内 /payment 错误率 > 5 %,列出对应 commit diff & 可能根因。” 3. Agent 自动: ‑ 拉日志 → 关联最近部署 → 圈出可疑函数 → 给出修复 PR 草稿。 4. 人只做“判断影响面 + 按合并按钮”。 Virgin Atlantic 实测:MTTR 从 45 min 降到 12 min。 最后 “AI 不是帮你写下一行代码,而是帮你跑完整个 Sprint——工程师升级做导演,Agent 当演员。”把这份作战地图钉在 war-room,按图施工,90 天你就能拥有一个“AI-Native”工程团队。

虽然原文充斥了各种codex,但不缺乏泛化到其他AI工具,同时也非常着重的强调了spec的重要性。期待第一个AI Native 研发团队做出的产品!

原文链接:https://cdn.openai.com/business-guides-and-resources/building-an-ai-native-engineering-team.pdf

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-11-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AgenticAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档