昇腾950PR加持华为发布新一代算力加速卡性能近3倍H20 支持FP4

中国，2026年3月21日电——在刚刚落幕的华为中国合作伙伴大会2026上，华为正式发布并展示了其最新一代AI训练推理加速卡Atlas 350。该加速卡搭载了全新的昇腾950PR（Ascend 950PR）处理器，标志着华为在AI算力领域迈出了坚实的一步。

相较于上一代昇腾芯片，昇腾950PR在多项关键性能指标上实现了显著的飞跃，包括低精度数据格式支持、向量算力、互联带宽以及自研HBM（高带宽内存）技术等，这些优化将直接转化为更强大的AI处理能力。

据华为昇腾计算业务总裁张迪煊介绍，Atlas 350单卡算力相比英伟达H20提升了2.87倍，并且是目前国内市场上唯一一款支持FP4低精度推理的产品。这一突破性的进展，尤其是在低精度计算方面的优势，预示着Atlas 350在加速AI模型推理，降低延迟方面将拥有得天独厚的优势。FP4的引入，意味着在精度略微下降的前提下，计算速度能够得到指数级提升，这对于大规模部署AI应用至关重要。

此外，Atlas 350的HBM容量达到了112GB，是H20的1.16倍，这一大幅度的提升将显著加速多模态生成的速度，预计可提升60%。同时，其内存访问颗粒度也从512字节缩减至128字节，这意味着小算子访存效率提升了4倍，对于需要频繁小粒度数据访问的AI模型训练和推理任务来说，这将带来巨大的性能增益。

在大会展厅的Atlas 350展台，华为公布的详细参数显示，Atlas 350的FP4精度算力达到了1.56 PFLOPS，带宽高达1.4TB/s。虽然其功耗为600W，是H20的1.5倍，但考虑到其在算力上的巨大优势，这种功耗的提升是完全可以接受的，并且从单位性能功耗比来看，Atlas 350有望展现出更强的竞争力。

Atlas 350不仅支持FP16和FP8等主流精度，更重要的是其对FP4低精度的支持。这一能力使得集成Atlas 350的服务器能够处理更大规模的AI模型，同时实现更低的推理延迟。低精度计算的优势在于能够显著减少模型体积和计算量，从而在有限的硬件资源下支持更复杂的AI任务，并大幅度提升响应速度。

华为昇腾计算业务总裁张迪煊进一步表示，依托Atlas 350等明星产品，结合当前AI技术的飞速发展趋势以及客户多样化的实际需求，昇腾计算将构建包括大、中、小在内的三大核心算力场景。此举旨在为合作伙伴提供灵活、差异化的解决方案，共同推动各行各业的智能化转型和深度融合。

文章内容举报

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，可联系本站进行审核删除。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

昇腾950PR加持 华为发布新一代算力加速卡 性能近3倍H20 支持FP4

相关推荐

发表回复

昇腾950PR加持华为发布新一代算力加速卡性能近3倍H20 支持FP4