在生成式AI加速迭代的当下,专为“智能体AI”(Agentic AI)打造的定制芯片正成为下一个关键战场。NVIDIA近日官方确认,其首款面向Agentic AI的CPU——Vera,已成功向多家头部AI公司出货。这意味着Vera CPU正式进入量产阶段,也为后续的智能体计算生态铺平了道路。
从规格上看,Vera CPU搭载了88颗自研Olympus核心,内存带宽高达1.2TB/s,相比上一代Grace CPU性能提升达50%。值得注意的是,在面向大规模Agentic AI工作负载时,Vera依然能维持强悍的单核性能表现——这对于需要实时推理和自主决策的智能体场景尤为关键。NVIDIA此举也暗示,公司正在从GPU霸主向“CPU+GPU”双轨架构的领导者转型。
上周五,NVIDIA副总裁Ian Buck亲自将首批Vera CPU系统交付给了Anthropic、OpenAI、SpaceXAI以及Oracle等一线企业。Anthropic计算负责人James Bradbury表示,算力提升是模型进步的核心驱动力,他非常期待Vera成为生态中的关键组件。

在OpenAI总部,计算基础设施负责人Sachin Katti不仅对Buck的到来表示感谢,还现场演示了Vera的内部架构细节。SpaceXAI创始人Elon Musk则亲自签收设备,并针对CPU的核心数量、内存布局等技术细节表现出浓厚兴趣。他们计划利用Vera优化强化学习工作负载和智能体模拟流水线——这两项正是当前大模型训练和部署中的算力瓶颈。
Oracle云基础设施团队同样关注了Vera CPU的开箱过程,并宣布计划从2026年开始部署数十万颗Vera CPU,以满足Agentic AI对高效算力的需求。Oracle代表Kalan Batra指出,Vera的架构将显著提升推理工作负载的效率,有助于下一代企业级AI的发展。
随着Vera CPU的量产,NVIDIA还计划在未来几天内发布Vera Rubin平台。Vera CPU将不仅作为独立产品出售,更将与NVIDIA的Rubin GPU及其他系统深度整合,形成一套高效的计算架构。可以认为,Vera CPU的交付标志着NVIDIA真正向“智能体AI基础设施”的完整闭环迈出了关键一步——当AI从“对话”走向“自主行动”,底层算力的定制化设计将成为决定行业格局的核心变量。
亮点速览:
🌟 Vera CPU专为Agentic AI设计,性能较上一代Grace提升50%。
💡 NVIDIA已完成首批交货,客户涵盖OpenAI、SpaceXAI等头部AI公司。
🔧 Oracle计划2026年起部署数十万颗,用于支撑智能体推理负载。