在2025年度的华为云生态大会上,华为云计算业务迎来了一项重大突破。华为常务董事兼云计算业务CEO张平安重点介绍了华为在人工智能基础设施上的最新进展,并正式发布了CloudMatrix 384超节点技术。值得关注的是,该技术目前已在芜湖数据中心实现了大规模部署,这无疑是华为云AI战略落地的重要一步。
CloudMatrix 384超节点的问世,代表着华为云在算力供给模式上的一次显著升级。以往的算力供给基于服务器级别,而CloudMatrix则实现了矩阵级的跃迁。华为将其概括为“高密”、“高速”和“高效”,这些优势来源于其先进的架构设计,从而在算力、互联带宽乃至内存带宽等关键指标上都达到了行业领先水平。这种架构的优化,不仅提升了整体性能,也意味着更高效率的资源利用率,对于降低AI模型训练的成本具有重要意义。
华为云一直在积极优化其昇腾AI云服务。目前,该服务已全面适配超过160个第三方大模型,其中就包括知名的大模型DeepSeek。这为大型模型的训练和推理提供了强大的基础设施支持,加速了行业应用的落地进程。除了基础设施的构建,华为云盘古大模型的应用场景也在不断拓展。它目前已经覆盖了超过30个行业,并在400多个具体场景中落地应用,例如城市治理、智慧金融、医疗健康和气象预测等领域。可以看出,华为云的AI赋能正在渗透到国民经济的各个方面。
此外,硅基流动公司与华为云展开深度合作,双方基于CloudMatrix 384超节点昇腾云服务以及高性能推理框架SiliconLLM,合作推出了DeepSeek-R1服务。据硅基流动介绍,该服务在保证单用户20 TPS(每秒事务数)的性能水平下,单卡Decode吞吐量能够达到惊人的1920 Tokens/s,其性能表现可以媲美使用H100 GPU的同类部署。更重要的是,经过主流测试集的严格验证和大规模线上盲测,使用昇腾算力部署的DeepSeek-R1模型在精度上与官方版本保持高度一致,这意味着昇腾算力在支持高精度模型方面已经具备了相当的竞争力。这一成功合作也侧面印证了国产AI芯片在性能和生态适配上取得的显著进步,对于促进中国AI产业的自主可控具有重要意义。