一年一度的科技盛会CES正在拉斯维加斯火热进行。
每年的这个时候,无论是通宵达旦的数码博主,还是攒了一年钱的游戏爱好者,目光都会聚焦在那位在科技界举足轻重的“老黄”身上。
按照往年的惯例,此时本应是新一代高性能显卡,例如60系或50系Super系列问世的时刻。
尽管英伟达官方早已在CES之前公告,明确表示将不会发布新显卡。
然而,许多人仍抱有一丝期待,或许会有其他令人惊喜的新产品,或者英伟达会出乎意料地带来惊喜。
但当人们站在拉斯维加斯寒冷的风中时,就会发现,剧本早已彻底改变,对于期待游戏显卡更新的玩家们来说,这似乎已沦为一场“无关紧要”的旁观。
接下来,让我们一同回顾一下老黄在本次CES展上发布的新品。
毫无疑问,本次发布会的绝对焦点依然是人工智能(AI)。
当英伟达将一台重达2.5吨的AI服务器机架直接搬上舞台,这个名为Vera Rubin的新架构便瞬间吸引了所有AI领域从业者的目光。
Vera Rubin的命名颇具深意,它源自著名的天文学家Vera Rubin,她因发现了暗物质而闻名。这似乎寓意着,英伟达希望通过Vera Rubin新架构,在未来加速AI的研发进程,进一步探索AI领域的“暗物质”——那些未知且潜力巨大的区域。
从纸面数据来看,这款新架构的性能表现无疑是极其强悍的。英伟达CEO黄仁勋指出,当前AI领域最大的挑战在于,算力需求的指数级增长与受制于摩尔定律失效而效率提升缓慢的芯片之间的矛盾。
因此,如果沿用英伟达以往“堆叠式”的产品迭代策略,仅仅小幅升级个别芯片,已不足以满足日益增长的需求。为此,Vera Rubin架构一口气重新设计了六款关键芯片,旨在从根本上提升算力效率。
这六款芯片分别是:Vera CPU(专为AI数据传输设计的控制核心),Rubin GPU(实现算力密度物理极限),NVLink 6 Switch(连接神经网络的超高速接口),ConnectX-9 SuperNIC(超高速网络接口卡),BlueField-4 DPU(数据处理单元),以及Spectrum-6 Ethernet Switch(以太网交换机)。
仔细分析,英伟达的这“六位一体”在各自领域均实现了质的飞跃。我们不妨重点关注其中两款。
首先来看Vera CPU,其变化与其说是性能的突破,不如说是职责的重新定义。在过往的AI系统中,CPU更多扮演着为GPU提供“弹药”的角色,其主要任务是全力支持GPU高效完成运算。
而集成了88个定制Olympus ARM核心的Vera CPU,通过全新的超高速互联技术,与GPU的互联带宽达到了惊人的1.8 TB/s。这意味着,在这种高速连接下,Vera CPU甚至能充当GPU的显存扩展池,极大地拓宽了AI模型能够处理的上限。
Rubin GPU则更是重中之重。引入HBM4显存后,每个Rubin GPU配备了8堆栈的HBM4高带宽内存,单卡容量高达288GB,带宽可达22 TB/s。更值得一提的是,HBM4技术还引入了底层逻辑晶圆,使得内存本身具备了一定的计算能力,从而大幅度降低了数据搬运的能耗。
此外,第六代NVLink技术,通过铜缆实现互联,总带宽高达260 TB/s。英伟达对此的描述甚至带有几分“凡尔赛”的意味,声称这比“整个互联网的带宽”还要高。
如此大幅的性能提升,直接带来了丰厚的回报。据测算,集成Vera Rubin架构后,AI推理的Token成本可降低10倍,算力性能飙升5倍,甚至训练MoE模型所需的GPU数量也能减少4倍。
更令人瞩目的是,在实现如此巨大的性能飞跃的同时,Vera Rubin的晶体管数量仅增加了1.7倍。这可以说是在技术迭代上实现了“弯道超车”,有效突破了摩尔定律的瓶颈,并显著缓解了内存墙和IO墙的限制。
如果说Vera Rubin巩固了英伟达在云端算力领域的领导地位,那么随后的Alpamayo则标志着英伟达开始开辟新的战场,矛头直指特斯拉的FSD(全自动驾驶)模式。
Alpamayo并非国内常见的自动驾驶软件栈,而是一个集模型、仿真工具和数据集于一体的开放平台,支持跨平台移植,这使其被一些媒体誉为“自动驾驶界的安卓”。英伟达旗下的Cosmos基础模型能够根据交通模拟器的信号,生成逼真且运动规律的视频,从而帮助AI学习现实世界的驾驶行为模式。英伟达表示,他们已经准备好了构建高质量数据的算力。
与以往的智能驾驶技术相比,Alpamayo最大的亮点在于引入了“推理能力”。黄仁勋解释道,这样一套端到端训练的系统,在面对复杂未知路况时,不再是机械地执行代码,而是能够像人类司机一样进行分析并做出合理的决策。
这听起来似乎与国内主流厂商在智能驾驶方面的探索方向不谋而合。然而,真正的成效还需要等到实际路测才能见分晓。不过,这个时间点已经不远了,因为搭载Alpamayo技术栈的奔驰CLA将在今年第一季度正式上市。
更重要的是,Alpamayo的应用场景远不止于自动驾驶,它同样可以无缝集成到机器人、机械臂、扫地机等各种智能系统中。
在此契机下,英伟达也对其机器人战略进行了阐述,当前的首要目标是将自家技术深度融入到Synopsys、Cadence、西门子等工业设计和制造体系中。
当然,老黄也并未忘记他的游戏玩家群体,推出了备受期待(并非)的DLSS 4.5。
DLSS 4.5通过“超分辨率技术”显著提升了图像质量,弥补了DLSS 4的不足。同时,它将帧生成数量从之前的1生3提升至1生5,实现了6倍的生成水平。这意味着,原本40帧运行的游戏,在开启DLSS 4.5后,输出帧率可高达240帧,这足以让那些高刷新率的电竞显示器发挥其最大潜力。(手动狗头)
总体而言,本次发布会所展示的英伟达新品无疑是技术上的巨大飞跃,理应获得掌声。然而,回望过去,那个陪我们玩游戏、搞超频的显卡公司NVIDIA,似乎已经渐行渐远。
如今的英伟达,更像是一家“AI时代的电力公司”。它专注于如何通过Vera Rubin构建万亿参数的AI工厂,如何利用Alpamayo赋能汽车和机器人。
作为科技、数码与AI领域的观察者,我们乐见其成。但对于另一重身份是游戏玩家的我们而言,这种变化也带来了一种“兄弟渐行渐远,难以深入交流”的隔阂感。英伟达在不断向上发展,而曾经的玩家们,似乎只能带着敬意,称呼其为“老爷”了。
我们之间的距离,已经形成了一层令人唏嘘的厚壁障。
不禁让人好奇,未来的某一天,黄仁勋是否还会想起当年,游戏玩家们省吃俭用、一张张抢购显卡,共同成就英伟达辉煌的日子。












