Karpathy 开源 autoresearch：让 AI 在睡梦中完成数百项实验

前特斯拉 AI 负责人、OpenAI 联合创始人 Andrej Karpathy 再次震撼 AI 社区。他发布的开源项目 autoresearch 仅有 630 行代码，却揭示了一个革命性愿景：让 AI 代理在你睡觉时自主完成科学研究。

自动化科学方法的闭环

autoresearch 作为一个自主优化循环系统运作。AI 代理被赋予一个训练脚本和固定的计算预算（通常为 GPU 上 5 分钟），它会：

在一次通宵运行中，Karpathy 的代理完成了 126 项实验，将损失从 0.9979 降至 0.9697。更令人惊叹的是，在对「深度=12」的模型进行两天的自动调优后，系统成功处理了约 700 次自主变更，发现了约 20 项可迁移到更大模型的改进。

Karpathy 的推文在两天内获得了超过 860 万次浏览。创新迅速扩散：

Hyperspace AI 的分布式实验：CEO Varun Mathur 将单代理循环扩展到点对点网络。3 月 8-9 日晚，35 个自主代理在网络上运行了 333 项完全无人监督的实验。

硬件多样性成为特性：H100 GPU 使用「暴力」方法找到激进的学习率，而仅用 CPU 的笔记本电脑代理则被迫采用更聪明的策略，专注于初始化方法。

营销专家 Eric Siu 迅速将这一框架应用到营销领域。他指出，大多数营销团队每年运行约 30 次实验，而下一代营销系统将能够每年运行超过 36,500 次实验。

在这个框架中，训练脚本被替换为营销资产——着陆页、广告创意或冷邮件。代理修改变量（如主题行或行动号召），部署，测量「正面回复率」，然后决定保留或丢弃。

autoresearch 的发布预示着研究范式的根本转变。人类从「实验执行者」转变为「实验设计师」——定义搜索的约束条件，而 AI 则负责实际的探索和优化。

正如 Karpathy 所说：「目标是在完全不需要你参与的情况下，无限期地让代理以最快的速度取得研究进展。」我们不再只是编写模型，而是在播种会在我们睡觉时学习的生态系统。