前特斯拉 AI 负责人、OpenAI 联合创始人 Andrej Karpathy 再次震撼 AI 社区。他发布的开源项目 autoresearch 仅有 630 行代码,却揭示了一个革命性愿景:让 AI 代理在你睡觉时自主完成科学研究。

自动化科学方法的闭环

autoresearch 作为一个自主优化循环系统运作。AI 代理被赋予一个训练脚本和固定的计算预算(通常为 GPU 上 5 分钟),它会:

  • 阅读自己的源代码
  • 形成改进假设(如改变学习率或架构深度)
  • 修改代码并运行实验
  • 评估结果并决定保留或回滚

在一次通宵运行中,Karpathy 的代理完成了 126 项实验,将损失从 0.9979 降至 0.9697。更令人惊叹的是,在对「深度=12」的模型进行两天的自动调优后,系统成功处理了约 700 次自主变更,发现了约 20 项可迁移到更大模型的改进。

社区驱动的创新扩散

Karpathy 的推文在两天内获得了超过 860 万次浏览。创新迅速扩散:

Hyperspace AI 的分布式实验:CEO Varun Mathur 将单代理循环扩展到点对点网络。3 月 8-9 日晚,35 个自主代理在网络上运行了 333 项完全无人监督的实验。

硬件多样性成为特性:H100 GPU 使用「暴力」方法找到激进的学习率,而仅用 CPU 的笔记本电脑代理则被迫采用更聪明的策略,专注于初始化方法。

从机器学习到营销:跨领域应用

营销专家 Eric Siu 迅速将这一框架应用到营销领域。他指出,大多数营销团队每年运行约 30 次实验,而下一代营销系统将能够每年运行超过 36,500 次实验。

在这个框架中,训练脚本被替换为营销资产——着陆页、广告创意或冷邮件。代理修改变量(如主题行或行动号召),部署,测量「正面回复率」,然后决定保留或丢弃。

人类角色的转变

autoresearch 的发布预示着研究范式的根本转变。人类从「实验执行者」转变为「实验设计师」——定义搜索的约束条件,而 AI 则负责实际的探索和优化。

正如 Karpathy 所说:「目标是在完全不需要你参与的情况下,无限期地让代理以最快的速度取得研究进展。」我们不再只是编写模型,而是在播种会在我们睡觉时学习的生态系统。