华为云CloudMatrix 384超节点亮相,硅基流动DeepSeek-R1服务正式上线

在2025年度的华为云生态大会上,华为云计算业务迎来了一项重大突破。华为常务董事兼云计算业务CEO张平安重点介绍了华为在人工智能基础设施上的最新进展,并正式发布了CloudMatrix 384超节点技术。值得关注的是,该技术目前已在芜湖数据中心实现了大规模部署,这无疑是华为云AI战略落地的重要一步。

华为云CloudMatrix 384超节点亮相,硅基流动DeepSeek-R1服务正式上线

CloudMatrix 384超节点的问世,代表着华为云在算力供给模式上的一次显著升级。以往的算力供给基于服务器级别,而CloudMatrix则实现了矩阵级的跃迁。华为将其概括为“高密”、“高速”和“高效”,这些优势来源于其先进的架构设计,从而在算力、互联带宽乃至内存带宽等关键指标上都达到了行业领先水平。这种架构的优化,不仅提升了整体性能,也意味着更高效率的资源利用率,对于降低AI模型训练的成本具有重要意义。

华为云一直在积极优化其昇腾AI云服务。目前,该服务已全面适配超过160个第三方大模型,其中就包括知名的大模型DeepSeek。这为大型模型的训练和推理提供了强大的基础设施支持,加速了行业应用的落地进程。除了基础设施的构建,华为云盘古大模型的应用场景也在不断拓展。它目前已经覆盖了超过30个行业,并在400多个具体场景中落地应用,例如城市治理、智慧金融、医疗健康和气象预测等领域。可以看出,华为云的AI赋能正在渗透到国民经济的各个方面。

此外,硅基流动公司与华为云展开深度合作,双方基于CloudMatrix 384超节点昇腾云服务以及高性能推理框架SiliconLLM,合作推出了DeepSeek-R1服务。据硅基流动介绍,该服务在保证单用户20 TPS(每秒事务数)的性能水平下,单卡Decode吞吐量能够达到惊人的1920 Tokens/s,其性能表现可以媲美使用H100 GPU的同类部署。更重要的是,经过主流测试集的严格验证和大规模线上盲测,使用昇腾算力部署的DeepSeek-R1模型在精度上与官方版本保持高度一致,这意味着昇腾算力在支持高精度模型方面已经具备了相当的竞争力。这一成功合作也侧面印证了国产AI芯片在性能和生态适配上取得的显著进步,对于促进中国AI产业的自主可控具有重要意义。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
AI快讯网编辑-青青AI快讯网编辑-青青
上一篇 2025年 4月 10日 下午7:26
下一篇 2025年 4月 10日 下午8:23

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!