首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Karpathy:多数人未真正学会用AI编程,4大准则将编码准确率提升至94%

Karpathy:多数人未真正学会用AI编程,4大准则将编码准确率提升至94%

作者头像
老周聊架构
发布2026-05-22 18:48:40
发布2026-05-22 18:48:40
1270
举报

OpenAI联合创始人、"Vibe Coding"概念提出者Andrej Karpathy,近期在推特上引发了开发者圈的"九级地震"。他坦言自己已经好几个月没有手写一行代码,并分享了一套让AI编码准确率从65%提升到94%的方法论。这套方法被开源社区提炼成一个65行的CLAUDE.md文件,短短几周斩获超过22万GitHub Star,成为2026年增长最快的开源项目。


一、一条推特引发的"九级地震"

2025年12月27日,Andrej Karpathy发了一条推特,瞬间被转发上万次:

"I've never felt this much behind as a programmer. The profession is being dramatically refactored... I have a sense that I could be 10X more powerful if I just properly string together what has become available in the last year, and failing to do so feels like a skill issue." ——我从来没有觉得自己作为一个程序员落后这么多过。这个职业正在被剧烈重构……我感觉如果能正确地组合过去一年出现的工具,我可以变得强大10倍,而做不到这一点感觉像是一个"技能问题"。

Andrej Karpathy:OpenAI联合创始人,Tesla前AI总监,"Vibe Coding"概念提出者

他还列出了一长串新概念:Agents、Sub-agents、Prompts、Contexts、Memory、Modes、Permissions、Tools、Plugins、Skills、Hooks、MCP、LSP、Slash Commands、Workflows、IDE Integrations——这些就像一套强大的外星工具,被扔到了世界上,却没有说明书。每个人都在摸索着如何使用它。

这条推特在开发者社区引发了广泛讨论,被称为编程界的"九级地震"


二、从80%手写到80%AI生成的巨变

2026年1月26日,Karpathy又发了一条长推,记录了他使用Claude Code的实战体验:

"Given the latest lift in LLM coding capability, like many others I rapidly went from about 80% manual+autocomplete coding and 20% agents in November to 80% agent coding and 20% edits+touchups in December." ——随着LLM编码能力的最新提升,和很多人一样,我在短短几周内从80%手动编码+20%代理,迅速转变为80%代理编码+20%手动修改润色。

他称这是"20年编程生涯中最大的工作流变革,而且发生在几周之内"

到了2026年3月,他更是坦言:"I haven't typed a line of code probably since December(从12月起就没打过一行代码了)"。

但在拥抱AI的同时,Karpathy也清醒地指出了LLM编码的三大致命缺陷——而这正是他分享准则的原因。


三、AI编码的三大致命缺陷

Karpathy在实践中发现,AI编码助手反复犯同样的错误:

缺陷1:无声的假设(Silent Assumptions)

"Models make wrong assumptions on your behalf and just run with them." ——模型会替你做出错误的假设,然后一路狂奔。

当你说"导出用户数据",AI可能自作主张地假设了导出格式、文件路径、字段选择——全都没有跟你确认。研究表明,94%的LLM编译错误源于模型自行假设了数据类型

缺陷2:过度复杂化(Over-complication)

一个三行就能解决的折扣计算函数,AI可能生成一整套策略模式。你要的是if-else,它给你的是设计模式全家桶。应用准则后,生成代码量减少30-40%,功能不受影响

缺陷3:附带损伤(Collateral Damage)

让AI修一个空邮箱的Bug,它可能顺手重构了周围的代码、改了注释、加了类型提示——把diff搞得面目全非,你根本看不出哪些是真正的修改。


四、Karpathy四大准则详解

针对这些缺陷,开发者Forrest Chang将Karpathy的观察提炼为4大核心准则,写成了一个65行的CLAUDE.md配置文件。这个文件让AI编码准确率从65-70%飙升至91-94%

准则1:编码前先思考(Think Before Coding)

核心原则:不要假设,不要隐藏困惑,暴露权衡。

代码语言:javascript
复制
1  - 明确陈述你的假设
2  - 如果不确定,停下来问
3  - 如果存在多种解释,列出所有选项——不要自作主张
4  - 发现更简单的方案时,主动推荐

这条规则要求AI在写第一行代码之前,先把所有假设摊在桌面上。不确定就问,有歧义就列选项。就像一个靠谱的同事,不会闷头干活然后给你一个"惊喜"。

准则2:极简优先(Simplicity First)

核心原则:用最少的代码解决当前问题,不做投机。

代码语言:javascript
复制
1  - 不加未要求的功能
2  - 不为一次性代码创建抽象
3  - 不添加不必要的灵活性或可配置性
4  - 不为不可能发生的场景添加错误处理
5  - 50行能搞定的,不要写200行

自检标准:一个资深工程师看到这段代码,会觉得过度设计吗?如果是,精简它。

准则3:外科手术式修改(Surgical Changes)

核心原则:只动必须动的,只清理自己的烂摊子。

代码语言:javascript
复制
1  - 不"顺便优化"旁边的代码
2  - 不调整无关的格式或注释
3  - 不重构没坏的代码
4  - 保持现有代码风格
5  - 只删除你的改动导致废弃的代码,不动之前就存在的死代码

验证标准:每一行改动都应该能直接追溯到用户的需求。如果某行改动无法对应到需求,删掉它。

准则4:目标驱动执行(Goal-Driven Execution)

核心原则:定义成功标准,循环直到验证通过。

代码语言:javascript
复制
1  ❌ "修复认证问题"
2  ✅ "写一个测试复现这个Bug → 让测试通过 → 确认没有回归"
3  
4  ❌ "添加输入验证"
5  ✅ "为无效输入写测试,然后让它们通过"

Karpathy指出:"LLMs are very good at looping until a specific goal is met."(LLM非常擅长循环直到达成特定目标)。与其告诉AI怎么做(how),不如告诉它什么算成功(what)。越清晰的成功标准,AI越能独立迭代。


五、实战效果:数据说话

这套准则的效果是惊人的:

应用场景

准则前

准则后

提升

融资技能(Fundraising Skill)

70%

94%

+24%

销售技能(MEDDIC合规)

65%

91%

+26%

Shopify模板渲染

-

-

快53%

Claude错误率

41%

3%

-38%

一个65行的Markdown文件,让AI从"不靠谱的实习生"变成了"靠谱的高级工程师"。


六、GitHub史上增长最快的单文件项目

这个CLAUDE.md文件在GitHub上创造了历史:

  • 第1天:5,828 Star
  • 2周内:60,000 收藏
  • 1个月:100,000+ Star
  • 截至2026年5月:两个仓库合计超过 220,000 Star

它不是框架,不是库,不是工具——只是一个65行的Markdown文件

社区评论说得好:"围绕模型的脚手架,才是真正的产品。"


七、如何使用这套准则?

方法1:项目级配置

将CLAUDE.md文件放到你的项目根目录:

代码语言:javascript
复制
1  # 克隆并复制到项目
2  curl -o CLAUDE.md https://raw.githubusercontent.com/multica-ai/andrej-karpathy-skills/main/CLAUDE.md

方法2:全局配置

放到~/.claude/CLAUDE.md,对所有项目生效。

方法3:Claude Code插件市场

直接在Claude Code插件市场中搜索安装。

方法4:Cursor用户

使用仓库中附带的.cursor/rules/规则文件。


八、Karpathy的更深洞察

除了这四大准则,Karpathy还分享了几个关键观察:

1. "AGI时刻"的三个维度

  • 坚韧(Tenacity):AI不知疲倦地解决问题
  • 拓展(Expansion):让你能涉足之前不可能的技术领域
  • 杠杆(Leverage):从命令式指令切换到声明式指令,最大化AI的自主性

2. 90%的AI编码费用是浪费的

"90% of your AI coding bill is paying for context you didn't need to send." ——你90%的AI编码费用,花在了不需要发送的上下文上。

大多数人在不知不觉中燃烧Token。真正的开销是浪费。

3. Vibe Coding只是起点

Karpathy在2025年2月创造了"Vibe Coding"这个概念——全身心拥抱氛围感,忘记代码的存在。但到了2026年,他的观点已经进化:Vibe Coding抬高了地板,但真正的战场在于如何精确控制AI的行为边界


九、写在最后

Karpathy的这套方法论揭示了一个深刻的道理:AI编程的瓶颈不是模型能力,而是行为管理

大多数人还在用AI像用搜索引擎一样——输入问题,接受答案。而真正高效的做法是:设定清晰的行为边界,定义明确的成功标准,让AI在约束中自由迭代

这不仅仅是编码技巧,更是一种全新的人机协作范式

  • 人类负责:定义目标、设定边界、审查结果
  • AI负责:在边界内探索、迭代、执行

正如Karpathy所说,这个职业正在被"剧烈重构"。而那些率先掌握了"驾驭AI"能力的开发者,将拥有10倍的生产力优势。

你准备好了吗?


— 完 —

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-05-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 老周聊架构 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、一条推特引发的"九级地震"
  • 二、从80%手写到80%AI生成的巨变
  • 三、AI编码的三大致命缺陷
    • 缺陷1:无声的假设(Silent Assumptions)
    • 缺陷2:过度复杂化(Over-complication)
    • 缺陷3:附带损伤(Collateral Damage)
  • 四、Karpathy四大准则详解
    • 准则1:编码前先思考(Think Before Coding)
    • 准则2:极简优先(Simplicity First)
    • 准则3:外科手术式修改(Surgical Changes)
    • 准则4:目标驱动执行(Goal-Driven Execution)
  • 五、实战效果:数据说话
  • 六、GitHub史上增长最快的单文件项目
  • 七、如何使用这套准则?
    • 方法1:项目级配置
    • 方法2:全局配置
    • 方法3:Claude Code插件市场
    • 方法4:Cursor用户
  • 八、Karpathy的更深洞察
    • 1. "AGI时刻"的三个维度
    • 2. 90%的AI编码费用是浪费的
    • 3. Vibe Coding只是起点
  • 九、写在最后
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档