中国,2026年3月21日电——在刚刚落幕的华为中国合作伙伴大会2026上,华为正式发布并展示了其最新一代AI训练推理加速卡Atlas 350。该加速卡搭载了全新的昇腾950PR(Ascend 950PR)处理器,标志着华为在AI算力领域迈出了坚实的一步。
相较于上一代昇腾芯片,昇腾950PR在多项关键性能指标上实现了显著的飞跃,包括低精度数据格式支持、向量算力、互联带宽以及自研HBM(高带宽内存)技术等,这些优化将直接转化为更强大的AI处理能力。
据华为昇腾计算业务总裁张迪煊介绍,Atlas 350单卡算力相比英伟达H20提升了2.87倍,并且是目前国内市场上唯一一款支持FP4低精度推理的产品。这一突破性的进展,尤其是在低精度计算方面的优势,预示着Atlas 350在加速AI模型推理,降低延迟方面将拥有得天独厚的优势。FP4的引入,意味着在精度略微下降的前提下,计算速度能够得到指数级提升,这对于大规模部署AI应用至关重要。
此外,Atlas 350的HBM容量达到了112GB,是H20的1.16倍,这一大幅度的提升将显著加速多模态生成的速度,预计可提升60%。同时,其内存访问颗粒度也从512字节缩减至128字节,这意味着小算子访存效率提升了4倍,对于需要频繁小粒度数据访问的AI模型训练和推理任务来说,这将带来巨大的性能增益。
在大会展厅的Atlas 350展台,华为公布的详细参数显示,Atlas 350的FP4精度算力达到了1.56 PFLOPS,带宽高达1.4TB/s。虽然其功耗为600W,是H20的1.5倍,但考虑到其在算力上的巨大优势,这种功耗的提升是完全可以接受的,并且从单位性能功耗比来看,Atlas 350有望展现出更强的竞争力。
Atlas 350不仅支持FP16和FP8等主流精度,更重要的是其对FP4低精度的支持。这一能力使得集成Atlas 350的服务器能够处理更大规模的AI模型,同时实现更低的推理延迟。低精度计算的优势在于能够显著减少模型体积和计算量,从而在有限的硬件资源下支持更复杂的AI任务,并大幅度提升响应速度。
华为昇腾计算业务总裁张迪煊进一步表示,依托Atlas 350等明星产品,结合当前AI技术的飞速发展趋势以及客户多样化的实际需求,昇腾计算将构建包括大、中、小在内的三大核心算力场景。此举旨在为合作伙伴提供灵活、差异化的解决方案,共同推动各行各业的智能化转型和深度融合。

