快科技5月19日消息,NVIDIA副总裁、CUDA之父Ian Buck亲手将首批Vera CPU交付给Anthropic、OpenAI、SpaceX、Oracle,标志着NVIDIA首款自研数据中心CPU正式离开实验室,进入客户部署阶段。
Vera CPU是Grace处理器的继任者,专为智能体AI工作负载设计,但与Grace主要作为GPU的配套主机处理器不同,Vera被赋予了更明确的独立角色,主要负责智能体工作负载中的编排调度、工具调用、强化学习训练、数据分析、智能体沙箱隔离和长上下文状态管理等任务。

芯片采用NVIDIA下一代定制Arm架构Olympus,配备88核176线程,系统内存达1.5TB(3倍于Grace),内存带宽1.2TB/s,NVLink-C2C互联带宽1.8TB/s,支持机架级机密计算。
NVIDIA称其单核满载性能较Grace提升50%,数据处理、压缩和CI/CD性能达到Grace的2倍。
在内存方案上,Vera是全球首款采用LPDDR5内存的数据中心CPU,使用SOCAMM封装的LPDDR5X模组。
传统数据中心CPU普遍依赖DDR5或HBM,而LPDDR5此前几乎只出现在移动设备和轻薄本中。

NVIDIA选择这条路线的逻辑在于能效,LPDDR5在提供高带宽的同时功耗明显低于DDR5,NVIDIA宣称Vera的每瓦性能处于行业领先水平。
不过,1.5TB的内存容量也意味着单颗Vera CPU将消耗大量LPDDR5X,随着Vera大规模出货,LPDDR5X DRAM的需求预计将显著增长,供应链可能面临进一步收紧。
首批客户名单此前已有部分披露,上周报道称CoreWeave、Meta等将成为Vera早期采用者,Oracle同样在列,加上此次实际交付的Anthropic、OpenAI和SpaceX,Vera的早期客户已覆盖当前AI行业最具影响力的几家公司。
Vera CPU将以两种形态交付:独立的LPX服务器,以及作为Vera Rubin NVL72机架的主机处理器。
NVIDIA不仅将Vera集成到Vera Rubin平台中,还将单独销售Vera CPU,并预计这将开辟一个新的数十亿美元级业务线。




【本文结束】如需转载请务必注明出处:快科技
责任编辑:黑白