在GTC 2026大会上,Nvidia正式发布了Vera Rubin计算平台,这是一个由七颗芯片组成的全新AI基础设施,获得了OpenAI、Anthropic、Meta、Mistral AI等顶级AI公司以及所有主流云服务商的支持。
CEO黄仁勋将其称为”代际飞跃”,将开启”史上最大的基础设施建设”。Vera Rubin平台宣称在每瓦推理吞吐量上提升10倍,每个token的成本降至Blackwell系统的十分之一。
七芯片架构详解
Vera Rubin平台整合了七颗芯片:
- Vera CPU:专为代理AI和强化学习设计,配备88个定制Olympus核心,LPDDR5X内存带宽达1.2TB/s,功耗仅为传统服务器CPU的一半
- Rubin GPU:新一代图形处理器
- NVLink 6 Switch:第六代高速互联
- ConnectX-9 SuperNIC:网络接口卡
- BlueField-4 DPU:数据处理单元
- Spectrum-6以太网交换机:采用共封装光学技术,能效提升5倍
- Groq 3 LPU:集成的推理加速器
旗舰级NVL72机架整合了72个Rubin GPU和36个Vera CPU,通过NVLink 6互联。Nvidia声称它可以用Blackwell四分之一的GPU数量训练大型专家混合模型。
代理AI时代的架构革命
黄仁勋强调,AI行业正在跨越门槛——从聊天机器人时代进入代理AI时代。代理系统能够自主推理数小时或数天,编写和执行软件,调用外部工具并持续改进。
这种转变要求计算基础设施的根本性重新设计。一个聊天机器人查询可能只消耗毫秒级GPU时间,而一个协调药物发现流程或调试复杂代码库的代理系统可能连续运行,消耗CPU周期执行代码、GPU周期进行推理,以及大量存储维护跨数千个中间步骤的上下文。
企业合作伙伴阵容
AWS、Google Cloud、Microsoft Azure和Oracle Cloud Infrastructure都将提供Vera Rubin平台,超过80家制造商正在围绕它构建系统。
Roche宣布在美国和欧洲部署超过3500个Blackwell GPU,这是制药行业最大的已公开GPU部署。在自动驾驶领域,比亚迪、吉利、五十铃和日产正在基于Nvidia Drive Hyperion平台打造L4级自动驾驶车辆。
Nvidia还发布了DGX Station桌面超级计算机,配备GB300 Grace Blackwell Ultra桌面超级芯片,提供748GB一致内存和高达20 PFLOPS的AI计算性能,可以从桌面运行高达万亿参数的开源模型。
从数据中心到太空
Vera Rubin Space Module为轨道推理提供比H100 GPU高25倍的AI计算能力。Aetherflux、Axiom Space、Kepler Communications、Planet Labs和Starcloud正在基于此构建太空计算基础设施。
黄仁勋表示:”太空计算,最后的边疆,已经到来。”
发表回复