首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >开源一周狂揽 35K 标星!Karpathy 开源 autoresearch:630 行代码让 AI 自动“炼丹”!

开源一周狂揽 35K 标星!Karpathy 开源 autoresearch:630 行代码让 AI 自动“炼丹”!

作者头像
开源星探
发布2026-03-16 18:37:19
发布2026-03-16 18:37:19
2.6K0
举报
文章被收录于专栏:翩翩白衣少年翩翩白衣少年

前些日子,GitHub 上有一个新项目炸翻了。

前 OpenAI、特斯拉前 AI 总监 Andrej Karpathy,发布了一个新项目——autoresearch,短短一周左右就狂揽 35.6k Star。

这个项目之所以能引起如此大的轰动,倒不是因为它用了什么惊为天人的技术,而是它向我们展示了一个未来:AI不仅能写代码,甚至能直接接管最硬核的 AI 算法研究本身。

给 AI 一个真实的 LLM 训练环境,让人类通过 Prompt 指导它,让 AI 自己去修改 Python 代码、调参数、改架构,通宵达旦地进行模型训练实验。

这不再是“用 AI 写代码”,这是真正的 “AI 自动做 AI 研究(Automated AI Research)”。

这就是 Karpathy 所说的 "后AGI时代的感觉"

这个项目到底是什么?

autoresearch 本质上是一个极简版的 LLM 训练环境,它基于 Karpathy 之前的nanochat项目,把核心训练代码压缩成了一个只有630行左右的单文件。

整个项目设计得非常精巧,只有三个核心文件,而且分工极其明确:

  • prepare.py:这个文件是固定的,包含常量定义、一次性数据准备(下载训练数据、训练BPE分词器)和运行时工具(数据加载器、评估器)。AI不会去碰这个文件。
  • train.py:这是唯一一个AI会修改的文件。里面包含了完整的GPT模型、优化器(Muon + AdamW)和训练循环。AI可以在这里自由发挥:改架构、调超参数、换优化器、调整batch size……一切都可以改。
  • program.md:这是给人类用的文件。你在这里给AI写指令,告诉它应该怎么思考、怎么研究。这相当于你在设计你的"自主研究机构"的章程。
快速上手

1、安装uv(如果还没有的话)

代码语言:javascript
复制
curl -LsSf https://astral.sh/uv/install.sh | sh

2、克隆项目并安装依赖

代码语言:javascript
复制
git clone https://github.com/karpathy/autoresearch.git
cd autoresearch
uv sync

3、准备数据和分词器(一次性,大约2分钟)

代码语言:javascript
复制
uv run prepare.py

4、手动运行一次训练,确保一切正常(大约5分钟)

代码语言:javascript
复制
uv run train.py

如果上面这些都没问题,那你的环境就搭好了!接下来就可以进入自主研究模式了。

让AI Agent开始工作

你只需要把你的AI Agent(Claude、Codex等等)放到这个仓库里(记得把权限都关掉),然后给它一个类似这样的Prompt:

"Hi,看看program.md,我们开始新实验吧!先做一下设置。"

然后你就可以去休息了,AI会自己搞定一切。

工作流程
  1. 1. 首先,你得把环境搭好:安装uv,下载依赖,运行prepare.py准备数据和分词器。
  2. 2. 然后,你可以手动运行一次train.py,确保一切正常。
  3. 3. 接下来就是关键的一步:启动你的AI Agent(可以是Claude、Codex或者你想用的任何大模型),让它看看program.md,然后对它说:"Hi,看看program.md,我们开始新实验吧!先做一下设置。"
  4. 4. 然后AI就会开始工作:它会修改train.py,运行5分钟训练,看看val_bpb有没有下降。如果下降了,说明修改有效,保留;如果上升了,说明不行,扔掉,重新想别的改法。
  5. 5. 就这样循环往复,一晚上能跑上百个实验。

Karpathy自己说,他把一个AI Agent扔在GPU上跑了两天,Agent自己改代码、自己训练、自己评估,跑完了大约700个实验,从中找到了20个真正有效的改进。

或许在未来,谁能写出更好的Prompt,谁能调教出更聪明的AI智能体,谁才是真正的核心竞争力。

写在最后

Karpathy 的 autoresearch 项目,用一种极其简洁优雅的方式,向我们展示了AI自主做研究的可行性。

630行代码,一张GPU,5分钟一轮实验,AI自己改代码、自己训练、自己评估。这是正在发生的事实。

或许正如 Karpathy 所说,写好Prompt然后去蒸桑拿,就是人类研究员在这个新时代的新工作。

GitHub:

https://github.com/karpathy/autoresearch

如果本文对您有帮助,也请帮忙点个 赞👍 + 在看 哈!❤️

在看你就赞赞我!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-03-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 开源星探 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 这个项目到底是什么?
  • 快速上手
  • 工作流程
  • 写在最后
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档