Rain科技3月17日消息,在今日举办的GTC大会上,英伟达(NVIDIA)发布了多款重磅新品,其中Vera Rubin系统无疑是今年的出货重点,并被定位为当前最强大的AI平台。
Vera Rubin系统并非首次亮相,此前在去年的GTC大会上已有原型展示。该系统已远超传统AI显卡的范畴,而是一个集成多种先进芯片的复杂AI整机系统,由七种芯片和五个机架组成。
其核心构成包括Rubin GPU、Vera CPU、NVLink 6.0互联技术、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6网络交换机,以及本次新增的Groq 3 LPU。Groq 3 LPU是英伟达在去年底斥资200亿美元收购Groq公司的LPU技术授权后整合进来的,主要面向推理AI应用场景,旨在提升AI模型的推理效率。
要构成一个完整的Vera Rubin系统,需要将这七款芯片与五种特定的机架进行整合:Vera Rubin NVL72机架、Vera CPU机架、Groq 3 LPX机架、BlueField-4 STX存储机架,以及Spectrum-6 SPX以太网机架。只有各组件协同工作,才能发挥其最大潜力。
Vera Rubin平台的性能表现极为惊人,实现了高达3.6ExaFlops(10的18次方浮点运算每秒)的算力,拥有260TB/s的全网络带宽,并采用100%水冷散热设计,Token生成速度更是达到了每秒7亿个。这样的性能指标,足以应对当前和未来极其庞大的AI计算需求。
在性能提升幅度上,英伟达CEO黄仁勋以一个极具冲击力的对比来展示Vera Rubin的强大:相较于10年前的计算系统,其性能提升了高达4000万倍。需要指出的是,这个对比的基准10年前的系统可能并未针对AI进行优化,且在支持新兴AI算法(如FP4)方面存在显著差距。因此,Vera Rubin相比早期系统获得如此巨大的性能飞跃是完全符合逻辑的,也反映了AI计算领域的技术迭代速度之快。
从技术角度分析,4000万倍的提升虽然听起来十分震撼,但考虑到AI技术在过去十年间的快速发展,特别是GPU架构的演进、并行计算能力的提升以及AI算法的优化,这一数值虽有夸张成分,但很大程度上也表明了英伟达在AI硬件领域的领导地位。Vera Rubin平台整合了多种专为AI优化的组件,其整体性能远超同期或更早期的通用计算设备。
此外,Vera Rubin系统并非英伟达AI产品线的终点。据悉,更强大的Vera Rubin Ultra版本已经规划中,其GPU数量将从现有的72个翻倍至144个,可以预见其性能也将随之实现新一轮的飞跃。
展望更长远,英伟达仍在积极研发下一代GPU架构——费曼(Feynman)。该架构预计将采用台积电的A16(1.6nm级)工艺,并运用3D堆栈封装技术,搭配定制HBM内存。同时,全新的LP40 LPU芯片、NVLink 8.0以及CX10等新一代连接和网络芯片也将一同问世,预计该项目将在2028年完成。这标志着英伟达将持续推动AI计算的边界。


