中国AI创业公司MiniMax发布了最新专有大模型M2.7,该模型不仅能进行常规推理,还能自主完成30-50%的强化学习研究工作流,标志着AI向着自我进化方向迈出了重要一步。模型在Artificial Analysis全球智能指数中排名第8,得分为50,较前代提升8分。
自我进化:AI构建AI
M2.7最引人注目的特点是其”自我进化”能力。据公司文档,早期版本的M2.7被用于构建研究代理框架,能够管理数据流水线、训练环境和评估基础设施。通过自主触发日志读取、调试和指标分析,模型完成了自身开发工作流的30-50%。
这不仅仅是自动化常规任务。模型能够分析失败轨迹,规划代码修改,在100轮以上的迭代循环中优化自身的编程性能。MiniMax工程负责人Skyler Miao在社交媒体上表示:”我们有意训练模型在规划和与用户明确需求方面做得更好。下一步是更复杂的用户模拟器来进一步推进这一点。”
基准测试表现
与2月发布的前代M2.5相比,M2.7在多项关键指标上取得显著进步:
- 软件工程:SWE-Pro基准得分56.22%,与GPT-5.3-Codex持平
- 专业办公:GDPval-AA Elo得分1495,声称是开源可访问模型中最高
- 幻觉率:降至34%,优于Claude Sonnet 4.6(46%)和Gemini 3.1 Pro(50%)
- 系统理解:Terminal Bench 2得分57.0%
- 技能遵循:MM Claw评估中97%的遵循率
在MLE Bench Lite机器学习竞赛测试中,M2.7获得66.6%的奖牌率,与Google Gemini 3.1持平,接近Claude Opus 4.6的当前最佳水平。
专有策略的转变
M2.7的专有性质代表了中国AI创业公司策略的转变。过去一年,中国公司如Qwen和DeepSeek一直是开源AI前沿的旗手,吸引了全球企业用户。但现在,MiniMax成为继z.ai(GLM-5 Turbo)之后第二家发布专有前沿LLM的中国创业公司。
有传言称阿里巴巴的Qwen团队也在高层领导和研究人员离职后转向专有开发。这一趋势表明中国AI公司正在效仿OpenAI、Google和Anthropic等美国领导者的策略。
极具竞争力的定价
M2.7通过MiniMax API和Agent创建平台提供,定价极具竞争力:
- 输入:$0.30/百万token
- 输出:$1.20/百万token
这一价格远低于西方竞争对手,同时提供了接近前沿水平的智能。对于需要大量调用的代理式AI应用,这种性价比优势尤为明显。
为代理和工具优化
M2.7专门针对AI代理和第三方框架后端进行了优化,支持Claude Code、Kilo Code和OpenClaw等工具。模型被归类为”仅推理文本模型”,在提供与其他领先系统相当的智能水平的同时,保持更高的成本效率。
MiniMax的目标是向模型训练和推理架构完全自主的方向演进,无需人类干预。M2.7代表了这一愿景的重要一步:AI不仅执行任务,还能参与自身的改进过程。对于AI研究人员和企业来说,这意味着一个新范式的开始——模型正在从工具进化为合作者。
发表回复