
前些日子,GitHub 上有一个新项目炸翻了。
前 OpenAI、特斯拉前 AI 总监 Andrej Karpathy,发布了一个新项目——autoresearch,短短一周左右就狂揽 35.6k Star。

这个项目之所以能引起如此大的轰动,倒不是因为它用了什么惊为天人的技术,而是它向我们展示了一个未来:AI不仅能写代码,甚至能直接接管最硬核的 AI 算法研究本身。
给 AI 一个真实的 LLM 训练环境,让人类通过 Prompt 指导它,让 AI 自己去修改 Python 代码、调参数、改架构,通宵达旦地进行模型训练实验。
这不再是“用 AI 写代码”,这是真正的 “AI 自动做 AI 研究(Automated AI Research)”。
这就是 Karpathy 所说的 "后AGI时代的感觉"。
autoresearch 本质上是一个极简版的 LLM 训练环境,它基于 Karpathy 之前的nanochat项目,把核心训练代码压缩成了一个只有630行左右的单文件。

整个项目设计得非常精巧,只有三个核心文件,而且分工极其明确:
1、安装uv(如果还没有的话)
curl -LsSf https://astral.sh/uv/install.sh | sh2、克隆项目并安装依赖
git clone https://github.com/karpathy/autoresearch.git
cd autoresearch
uv sync3、准备数据和分词器(一次性,大约2分钟)
uv run prepare.py4、手动运行一次训练,确保一切正常(大约5分钟)
uv run train.py如果上面这些都没问题,那你的环境就搭好了!接下来就可以进入自主研究模式了。
让AI Agent开始工作
你只需要把你的AI Agent(Claude、Codex等等)放到这个仓库里(记得把权限都关掉),然后给它一个类似这样的Prompt:
"Hi,看看program.md,我们开始新实验吧!先做一下设置。"
然后你就可以去休息了,AI会自己搞定一切。
Karpathy自己说,他把一个AI Agent扔在GPU上跑了两天,Agent自己改代码、自己训练、自己评估,跑完了大约700个实验,从中找到了20个真正有效的改进。
或许在未来,谁能写出更好的Prompt,谁能调教出更聪明的AI智能体,谁才是真正的核心竞争力。
Karpathy 的 autoresearch 项目,用一种极其简洁优雅的方式,向我们展示了AI自主做研究的可行性。
630行代码,一张GPU,5分钟一轮实验,AI自己改代码、自己训练、自己评估。这是正在发生的事实。
或许正如 Karpathy 所说,写好Prompt然后去蒸桑拿,就是人类研究员在这个新时代的新工作。
GitHub:
https://github.com/karpathy/autoresearch

如果本文对您有帮助,也请帮忙点个 赞👍 + 在看 哈!❤️
在看你就赞赞我!
