中国科技巨头小米日前发布了MiMo-V2-Pro,这是一款拥有万亿参数的大语言模型,在多项基准测试中表现接近OpenAI的GPT-5.2和Anthropic的Claude Opus 4.6,但调用成本仅为西方竞品的七分之一到六分之一。这一突破性进展标志着中国AI企业在全球前沿模型竞争中迈出了重要一步。

稀疏架构:效率与性能的平衡

MiMo-V2-Pro采用了创新的稀疏架构设计:虽然总参数量达到1万亿,但每次推理仅激活420亿参数,约为前代产品MiMo-V2-Flash的三倍。这一设计使其能够在保持强大性能的同时,大幅降低计算成本。

模型的核心创新在于升级版的混合注意力机制,采用7:1的混合比例(较Flash版本的5:1进一步提升),有效管理高达100万token的上下文窗口。这一架构选择使模型能够在长任务中保持深度”记忆”,而不会出现前沿模型常见的性能衰减。

基准测试:接近世界顶尖水平

第三方评测机构Artificial Analysis的验证数据显示,MiMo-V2-Pro在全球智能指数中排名第10,得分49分,与GPT-5.2 Codex同级别,领先于Grok 4.20 Beta。在GDPval-AA基准测试中,该模型Elo得分达到1426,超越了GLM-5(1406)和Kimi K2.5(1283)等中国竞争对手。

更值得注意的是幻觉率的显著改善:MiMo-V2-Pro的幻觉率降至30%,较前代Flash版本的48%大幅下降,也优于Claude Sonnet 4.6(46%)和Gemini 3.1 Pro Preview(50%)。

专为AI代理优化

小米在发布中强调了模型针对代理式AI场景的优化。在ClawEval代理基准测试中,MiMo-V2-Pro得分61.5,接近Claude Opus 4.6的66.3,显著领先GPT-5.2的50.0。在Terminal-Bench 2.0编程测试中,模型得分高达86.7,显示出在终端环境中执行命令的出色能力。

项目领导者Fuli Luo曾是DeepSeek R1项目的核心成员。他在社交媒体上表示,公司计划在”模型足够稳定时”开源部分版本。

极具竞争力的定价

小米为MiMo-V2-Pro制定了极具侵略性的价格策略:

  • 256K上下文以内:输入$1/百万token,输出$3/百万token
  • 256K至1M上下文:输入$2/百万token,输出$6/百万token
  • 缓存读取:$0.20/百万token(低档)/ $0.40/百万token(高档)

作为对比,GPT-5.2的调用成本约为输入$1.75/输出$14,Claude Opus 4.6约为$15/$75。Artificial Analysis的测试显示,运行完整智能指数评测,MiMo-V2-Pro仅需$348,而GPT-5.2需要$2,304,Claude Opus 4.6需要$2,486。

对于正在评估大模型方案的企业,MiMo-V2-Pro提供了一个极具吸引力的选择:全球前十的智能水平,加上极低的调用成本,以及针对代理式AI场景的深度优化。随着中国AI企业持续发力前沿模型,全球AI市场的竞争格局正在被重新定义。