小米发布MiMo-V2-Pro大模型：万亿参数对标GPT-5，成本仅为西方竞品七分之一

中国科技巨头小米日前发布了MiMo-V2-Pro，这是一款拥有万亿参数的大语言模型，在多项基准测试中表现接近OpenAI的GPT-5.2和Anthropic的Claude Opus 4.6，但调用成本仅为西方竞品的七分之一到六分之一。这一突破性进展标志着中国AI企业在全球前沿模型竞争中迈出了重要一步。

稀疏架构：效率与性能的平衡

MiMo-V2-Pro采用了创新的稀疏架构设计：虽然总参数量达到1万亿，但每次推理仅激活420亿参数，约为前代产品MiMo-V2-Flash的三倍。这一设计使其能够在保持强大性能的同时，大幅降低计算成本。

模型的核心创新在于升级版的混合注意力机制，采用7:1的混合比例（较Flash版本的5:1进一步提升），有效管理高达100万token的上下文窗口。这一架构选择使模型能够在长任务中保持深度”记忆”，而不会出现前沿模型常见的性能衰减。

基准测试：接近世界顶尖水平

第三方评测机构Artificial Analysis的验证数据显示，MiMo-V2-Pro在全球智能指数中排名第10，得分49分，与GPT-5.2 Codex同级别，领先于Grok 4.20 Beta。在GDPval-AA基准测试中，该模型Elo得分达到1426，超越了GLM-5（1406）和Kimi K2.5（1283）等中国竞争对手。

更值得注意的是幻觉率的显著改善：MiMo-V2-Pro的幻觉率降至30%，较前代Flash版本的48%大幅下降，也优于Claude Sonnet 4.6（46%）和Gemini 3.1 Pro Preview（50%）。

专为AI代理优化

小米在发布中强调了模型针对代理式AI场景的优化。在ClawEval代理基准测试中，MiMo-V2-Pro得分61.5，接近Claude Opus 4.6的66.3，显著领先GPT-5.2的50.0。在Terminal-Bench 2.0编程测试中，模型得分高达86.7，显示出在终端环境中执行命令的出色能力。

项目领导者Fuli Luo曾是DeepSeek R1项目的核心成员。他在社交媒体上表示，公司计划在”模型足够稳定时”开源部分版本。

极具竞争力的定价

小米为MiMo-V2-Pro制定了极具侵略性的价格策略：

256K上下文以内：输入$1/百万token，输出$3/百万token
256K至1M上下文：输入$2/百万token，输出$6/百万token
缓存读取：$0.20/百万token（低档）/ $0.40/百万token（高档）

作为对比，GPT-5.2的调用成本约为输入$1.75/输出$14，Claude Opus 4.6约为$15/$75。Artificial Analysis的测试显示，运行完整智能指数评测，MiMo-V2-Pro仅需$348，而GPT-5.2需要$2,304，Claude Opus 4.6需要$2,486。

对于正在评估大模型方案的企业，MiMo-V2-Pro提供了一个极具吸引力的选择：全球前十的智能水平，加上极低的调用成本，以及针对代理式AI场景的深度优化。随着中国AI企业持续发力前沿模型，全球AI市场的竞争格局正在被重新定义。

小米发布MiMo-V2-Pro大模型：万亿参数对标GPT-5，成本仅为西方竞品七分之一

稀疏架构：效率与性能的平衡

基准测试：接近世界顶尖水平

专为AI代理优化

极具竞争力的定价

发表回复取消回复

最新文章

文章分类

小米发布MiMo-V2-Pro大模型：万亿参数对标GPT-5，成本仅为西方竞品七分之一

稀疏架构：效率与性能的平衡

基准测试：接近世界顶尖水平

专为AI代理优化

极具竞争力的定价

发表回复 取消回复

最新文章

文章分类

发表回复取消回复