英伟达在美国CES上正式发布了下一代AI芯片平台“Rubin”。Rubin平台采用极端协同设计理念,整合了6颗芯片,包括NVIDIA Vera CPU、Rubin GPU、NVLink 6交换芯片、ConnectX-9 SuperNIC、BlueField-4 DPU以及Spectrum-6以太网交换芯片,覆盖了从计算、网络到存储与安全的多个层级,机柜等级仍为nvl72。
Vera rubin平台推理性能提升5倍,训练效率提升3.5倍,大型MoE模型推理token成本与英伟达blackwell平台相比可降至1/10,引入NVIDIA推理上下文内存存储平台,基于BlueField-4与Spectrum-X Ethernet加速,实现5倍的推理性能。同时,其计算托盘物理形态达到极致工程化,采用完全无电缆、模块化设计,机架组装时间从2小时缩短至约5分钟,并实现100%液冷。Vera Rubin平台的发布不仅仅是单个芯片的升级,而是数据中心计算范式的重构。