英伟达在 GTC 2026 大会上正式发布了代号为 Vera Rubin 的新一代 AI 计算平台。这个平台集成了七颗专门设计的芯片,号称在推理性能和能效方面实现了代际飞跃。

突破性的七芯片架构

Vera Rubin 平台整合了 Vera CPU、Rubin GPU、NVLink 6 交换机、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6 以太网交换机以及新集成的 Groq 3 LPU 推理加速器。英伟达将这些芯片组织成五个相互连接的机架级系统,作为一个统一的超级计算机运行。

旗舰级 NVL72 机架集成了 72 个 Rubin GPU 和 36 个 Vera CPU,通过 NVLink 6 互连。英伟达表示,它可以用四分之一的 GPU 训练大型混合专家模型,相比 Blackwell 系统大幅降低了构建前沿 AI 系统的成本。

顶级客户阵容

令人瞩目的是,Anthropic、OpenAI、Meta 和 Mistral AI 等 AI 巨头都已宣布支持该平台。亚马逊 AWS、谷歌云、微软 Azure 和甲骨文云基础设施都将提供该平台服务,超过 80 家制造合作伙伴正在围绕它构建系统。

英伟达 CEO 黄仁勋称之为”一代人的飞跃”,将开启”历史上最大的基础设施建设”。Vera Rubin 平台声称每瓦推理吞吐量提升高达 10 倍,每 token 成本仅为 Blackwell 系统的十分之一。

为 AI 代理时代而生

这一发布的核心战略是英伟达对 AI 行业正在跨越门槛的判断——聊天机器人时代正在让位于”智能代理 AI”时代:能够自主推理数小时甚至数天、编写和执行软件、调用外部工具并持续改进的系统。

这不仅是一个品牌营销,而是代表了计算基础设施设计的真正架构转变。聊天机器人的查询可能只消耗毫秒级的 GPU 时间,而编排药物发现流程或调试复杂代码库的智能代理系统可能需要持续运行,消耗 CPU 周期来执行代码、GPU 周期来推理,以及大量存储来维护跨数千个中间步骤的上下文。