用心打造
VPS知识分享网站

Nvidia在Vera Rubin NVL144 CPX平台中搭载“全新GPU”

英伟达周二发布了即将推出的 Vera Rubin NVL144 计算平台的替代版本,该平台将显著增加计算机芯片的数量,并采用旨在加速复杂 AI 应用的“新型 GPU”。

Nvidia在Vera Rubin NVL144 CPX平台中搭载“全新 GPU”

这款名为 Rubin CPX 的新 GPU 在 AI 基础设施峰会上亮相。Nvidia 表示,它将使 AI 系统能够更好地处理软件编码和生成视频应用程序,这些应用程序可以接收来自用户的多达一百万个或更多的令牌作为输入,并将信息保留在所谓的“长上下文窗口”中,以执行复杂的操作。

Rubin CPX 和相关的 Vera Rubin NVL144 CPX 平台预计将于明年年底推出,此前,Rubin GPU和相关的 Vera Rubin NVL144 平台将于 2026 年下半年某个时候首次亮相。Nvidia 还计划为 Rubin CPX 提供“其他灵活配置,以满足希望重复使用现有基础设施的客户的需要”。

这家总部位于加州圣克拉拉的公司表示,领先的人工智能公司已经在评估 Rubin CPX,其中包括人工智能代码编辑工具提供商 Cursor、生成视频提供商 Runway 和软件工程平台提供商 Magic。

Cursor 首席执行官 Michael Truell 在 Nvidia 提供的一份声明中表示:“借助 Nvidia Rubin CPX,Cursor 将能够提供闪电般的代码生成和开发者洞察,从而改变软件创作方式。这将提升生产力,使用户能够将遥不可及的想法付诸实践。”

英伟达数据中心产品总监沙尔·纳拉辛汉(Shar Narasimhan)在与记者和分析师的简报会上表示,这些包含100万个或更多标记的大型上下文窗口使人工智能代理能够“超越简单的代码错误修复,并支持高级软件应用程序和系统开发”。他补充道,它们还能生成“具有上下文感知能力、时间稳定的视频”。

Narasimhan 表示,Rubin CPX 将作为 Nvidia 的专用 GPU,用于上下文和预填充计算,从而显著提升这些“海量上下文”AI 应用的性能。这是 Nvidia 分解式推理服务流程中两个步骤的第一步。而原版 Rubin GPU 将负责生成和解码计算,这是第二步。

他说:“这将大幅提高人工智能工厂的生产力和性能。”

Vera Rubin NVL144 CPX 平台的独立 GPU 数量将比普通 Vera Rubin NVL144 平台翻倍,该平台在 18 个计算托盘中分别添加了 4 个 Rubin CPX GPU。(虽然该平台配备了 72 个双光罩 Rubin GPU,但 Nvidia 将每个光罩都算作一个 GPU,从而达到 144 个 GPU 的数量——这与 Nvidia 将每个双光罩 Blackwell 和 Blackwell Ultra GPU 算作一个 GPU 的方式不同。)

Nvidia 表示,每个计算托盘包含四块 Rubin CPX GPU、四块 Rubin GPU 和两块基于 Arm 的 Vera CPU,这将使 Vera Rubin NVL144 CPX 平台能够实现每秒 8 百亿亿次浮点运算 (EBFP4)。NVFP4 是 Nvidia 近期推出的一种新型 4 位浮点格式,旨在为 AI 模型保持更高的精度,而这种精度通常只有更大的数值格式才能实现。

据 Nvidia 称,该平台的 8 exaflop 性能是 Vera Rubin NVL144 平台(基于 NVFP4 计算)3.6 exaflop 的两倍多。此外,它的速度也比今年推出的基于 Blackwell Ultra 的 GB300 NVL72 平台快 7.5 倍。

Vera Rubin NVL144 CPX 还将配备 1.7 PBps 的内存带宽和 100 TB 的快速内存,高于原版平台的 1.4 PBps 和 75 TB。据该公司称,这些规格还意味着其带宽比 GB300 NVL72 平台高出三倍,容量高出 2.5 倍。

Nvidia预计将推出一款双机架产品,将Vera Rubin NVL144和Vera Rubin NVL144机架结合在一起,将快速内存容量提升至150 TB。该产品预计也将于明年年底上市。

在底层,Rubin CPX 具有 30 petaflops 的 NVFP4 计算能力,指数运算比 GB300 Superchip 大三倍,128 GB 的 GDDR7 内存以及四个 Nvidia 视频编码器和四个 Nvidia 视频解码器,用于辅助生成视频应用程序。

相比之下,普通版 Rubin GPU 配备 288 GB HBM4 高带宽内存,价格比 GDDR7 更贵。该公司在 3 月份发布 Rubin 时表示,该 GPU 将能够实现每秒 50 千万亿次浮点运算(FP4),而 Nvidia 则在 6 月份公布了 NVFP4 格式。

赞(0)
未经允许不得转载;国外VPS测评网 » Nvidia在Vera Rubin NVL144 CPX平台中搭载“全新GPU”
分享到