华为AI推理突破:或将降低HBM内存依赖

华为将于8月12日发布AI推理领域突破性技术成果,该技术有望降低中国AI推理对HBM内存的依赖,提升国内大模型推理性能。HBM作为高端AI芯片的关键组件,其在产能和出口限制下,此项新进展对完善中国AI推理生态尤为重要。

Rain科技8月10日消息,据国内媒体报道,华为将于8月12日在2025金融AI推理应用落地与发展论坛上,发布AI推理领域的突破性技术成果。

据透露,这项成果或许能够有效降低中国AI推理对HBM(高带宽内存)技术的依赖,同时提升国内AI大模型推理性能,并进一步完善中国AI推理生态的关键环节。

HBM,即高带宽内存(High Bandwidth Memory),是一种先进的DRAM解决方案,其核心在于采用了3D堆叠技术。通过将多层DRAM芯片垂直集成,HBM能够显著提升数据传输效率,具备超高带宽与低延迟、高容量密度以及高能效比等突出优势。

AI推理过程需要频繁地调用海量的模型参数,例如千亿级的权重,以及实时的输入数据。HBM凭借其超高的带宽和大容量,允许GPU直接访问完整的模型,从而有效避免了传统DDR内存因带宽不足而导致的算力闲置问题。特别是对于拥有千亿参数以上的大模型而言,HBM的引入能够显著缩短响应时间,大幅提升推理效率。

当前,HBM已成为高端AI芯片的“标配”。在AI训练领域,其渗透率已接近100%;而在AI推理领域,随着模型复杂度的不断提升,HBM的应用普及速度也在持续加快。

然而,当前HBM面临着产能紧张以及美国出口限制的双重挑战。这些外部因素也正倒逼国内厂商积极探索如Chiplet封装、低参数模型优化等一系列替代性解决方案,以寻求突破。

华为即将发布AI推理领域突破性成果:或能降低对HBM内存依赖

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
Rain科技Rain科技
上一篇 2025年 8月 10日 上午9:19
下一篇 2025年 8月 10日 上午11:48

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!