MiniMax发布M2.7模型：自我进化的AI能完成50%强化学习研究工作

中国AI创业公司MiniMax发布了最新专有大模型M2.7，该模型不仅能进行常规推理，还能自主完成30-50%的强化学习研究工作流，标志着AI向着自我进化方向迈出了重要一步。模型在Artificial Analysis全球智能指数中排名第8，得分为50，较前代提升8分。

自我进化：AI构建AI

M2.7最引人注目的特点是其”自我进化”能力。据公司文档，早期版本的M2.7被用于构建研究代理框架，能够管理数据流水线、训练环境和评估基础设施。通过自主触发日志读取、调试和指标分析，模型完成了自身开发工作流的30-50%。

这不仅仅是自动化常规任务。模型能够分析失败轨迹，规划代码修改，在100轮以上的迭代循环中优化自身的编程性能。MiniMax工程负责人Skyler Miao在社交媒体上表示：”我们有意训练模型在规划和与用户明确需求方面做得更好。下一步是更复杂的用户模拟器来进一步推进这一点。”

与2月发布的前代M2.5相比，M2.7在多项关键指标上取得显著进步：

在MLE Bench Lite机器学习竞赛测试中，M2.7获得66.6%的奖牌率，与Google Gemini 3.1持平，接近Claude Opus 4.6的当前最佳水平。

M2.7的专有性质代表了中国AI创业公司策略的转变。过去一年，中国公司如Qwen和DeepSeek一直是开源AI前沿的旗手，吸引了全球企业用户。但现在，MiniMax成为继z.ai（GLM-5 Turbo）之后第二家发布专有前沿LLM的中国创业公司。

有传言称阿里巴巴的Qwen团队也在高层领导和研究人员离职后转向专有开发。这一趋势表明中国AI公司正在效仿OpenAI、Google和Anthropic等美国领导者的策略。

M2.7通过MiniMax API和Agent创建平台提供，定价极具竞争力：

这一价格远低于西方竞争对手，同时提供了接近前沿水平的智能。对于需要大量调用的代理式AI应用，这种性价比优势尤为明显。

M2.7专门针对AI代理和第三方框架后端进行了优化，支持Claude Code、Kilo Code和OpenClaw等工具。模型被归类为”仅推理文本模型”，在提供与其他领先系统相当的智能水平的同时，保持更高的成本效率。

MiniMax的目标是向模型训练和推理架构完全自主的方向演进，无需人类干预。M2.7代表了这一愿景的重要一步：AI不仅执行任务，还能参与自身的改进过程。对于AI研究人员和企业来说，这意味着一个新范式的开始——模型正在从工具进化为合作者。