算力“卷王”来了?曙光ScaleX 640在乌镇刷新智能计算上限
在刚刚闭幕的2023世界互联网大会乌镇峰会上,中国在智能计算领域再次投下了重磅炸弹。中科曙光携其最新一代智算产品ScaleX 640亮相,以“单机柜640卡互连”的概念,彻底打破了人们对现有智算服务器极限的认知。这不仅仅是一次技术迭代,更像是向业界宣示,在算力密度和互连效率的赛道上,一场新的“军备竞赛”已经悄然打响。
640卡裸奔:一场“不可能三角”的极致挑战
一直以来,提升算力密度是智能计算领域永恒的主题。但现实的挑战却像一个“不可能三角”:如何在有限的机柜空间内,集成尽可能多的高性能计算卡,同时还要保证它们之间的高效互连,并解决随之而来的功耗和散热难题?
传统的解决方案往往是在集成度、互连带宽和散热能力之间做出妥协。而曙光ScaleX 640,似乎是将这个“不可能三角”的边界,狠狠地向外推了一大步。
“单机柜640卡互连”——这绝非一个简单的数字堆砌。它意味着在标准的42U机柜中,曙光实现了史无前例的640颗高性能计算卡的集成。如果我们将常见的GPU(例如4卡或8卡的服务器)类比为“小单元”,那么ScaleX 640则如同建造了一个“巨型集装箱”,直接将数量庞大的计算单元打包在一起。
然而,真正的挑战在于“互连”。GPU之间的通信速度和效率,直接决定了AI大模型训练和推理的成败。640颗卡,如何在同一个机柜内实现低延迟、高带宽的互连,其网络拓扑设计、线缆管理以及克服信号衰减的难度,足以让任何一位资深技术专家为之惊叹。
曙光官方资料显示,ScaleX 640采用了其自研的“交叉网技术”,能够实现640颗AI加速卡的全互联,延迟低至微秒级。这是一种超越传统RDMA(远程直接内存访问)和PCIe直连的全新互连范式,它旨在彻底打破卡与卡之间的通信瓶颈,让每一颗计算核心都能感受到“近在咫尺”的伙伴。
算力密度提升20倍:量变引发质变?
曙光官方宣称,ScaleX 640的算力密度相较于上一代产品提升了20倍。这是一个令人咋舌的数字。这意味着,在相同的空间占用下,ScaleX 640能够提供20倍的算力输出。
想象一下,以往需要占据数排机柜才能完成的AI训练任务,现在可能只需要一两个ScaleX 640机柜就能搞定。这对于数据中心而言,意味着极高的空间利用率和能效比。在算力需求呈指数级增长的当下,这如同为开发者们注入了一剂强心针,有望大幅降低部署AI算力的门槛和成本。
更长远来看,算力密度的爆炸式增长,可能会催生更多以前难以想象的应用场景。分布式训练的效率瓶颈被大幅缓解,更大、更复杂的模型将不再遥不可及。AI在科学研究、药物发现、自动驾驶、气候模拟等领域的潜能,因此得到了进一步释放。
深度技术解读:光寒技术与全序互联的秘密
要实现如此高的密度和互连效率,背后必然是深厚的技术积累。ScaleX 640的成功,离不开曙光在“光寒技术”上的突破。
在如此高的算力密度下,散热是首要解决的难题。ScaleX 640采用了全浸没式液冷方案,直接将计算卡浸泡在绝缘的冷却液中,通过液体的循环带走巨大的热量。这不仅解决了风冷难以应对的高温问题,还大大降低了风扇噪音,提升了设备的可靠性,为算力的持续释放提供了坚实保障。
而“全序互连”则是ScaleX 640实现高效数据传输的核心。曙光通过自研的“交叉网技术”,构建了一个逻辑上任意两颗卡之间都可以直接通信的高性能网络。这种技术或许借鉴了高性能计算领域的一些先进理念,并将其与AI算力集群的需求进行深度融合。其核心价值在于,能够确保在大规模并行计算中,数据传输不再成为拖后腿的因素。
“算力平权”的新动力,还是“算力鸿沟”的加速器?
曙光ScaleX 640的出现,无疑为中国在智能计算领域的地位添上了重要一笔。它不仅展示了国内厂商在高端硬件设计和制造上的实力,也为国内AI产业的发展提供了强大的算力支撑。
然而,任何颠覆性的技术都可能开启双刃剑。一方面,ScaleX 640极高的算力密度和可能降低的单位算力成本,有望加速“算力平权”的进程,让更多中小型企业和研究机构能够负担得起高性能AI算力,促进AI技术的普惠。
另一方面,这种对尖端技术的追求,是否也会拉大企业之间在算力获取上的差距?只有少数能够承担高昂初期投入的巨头,才能率先享受到“算力王”带来的红利?这仍是值得我们持续关注的课题。
总体而言,曙光ScaleX 640的发布,标志着智能计算的硬件基础设施正迈向一个前所未有的新阶段。它的出现,不仅刷新了我们对算力密度的认知,更可能为AI的未来发展打开新的想象空间。在乌镇峰会这个汇聚全球智慧的舞台上,ScaleX 640无疑是本次大会上最耀眼的“硬核”明星之一,它的未来表现,值得我们翘首以待。