Rain科技9月26日消息,AI基准测试MLPERF发布了Storage V1.0 AI基准测试结果。这项测试结果对于衡量AI存储系统性能具有重要意义,因为它反映了实际应用场景下的数据吞吐能力和效率。
MLPERF由图灵奖得主大卫·帕特森联合谷歌、斯坦福、哈佛大学等顶尖企业和学术机构成立,是目前权威性最大、影响力最广的国际AI性能基准测试组织。其测试结果的公正性和权威性得到了业界的广泛认可。
华为OceanStor A800全新AI存储在全球厂商中表现突出,在总性能、每节点性能和每U性能三个关键指标上均排名全球第一。这一结果充分展现了华为在AI存储领域的领先技术实力。
本次存储性能测试共有13家业界主流厂商参与,测试过程通过运行一个分布式训练测试程序,模拟GPU计算过程,最大程度地还原了AI服务器对存储系统的实际访问模式,确保了测试结果的可靠性和参考价值。
华为OceanStor A800凭借其强大的性能表现,单台设备成功满足了255张GPU模拟训练的数据吞吐需求,GPU利用率保持在90%以上,单框稳定带宽高达679 GB/s,是传统存储性能的10倍。如此显著的性能提升,源于华为在AI存储架构设计和优化算法方面的技术突破。
其平均每节点提供高达354GB/s带宽,每U提供高达85GB/s的带宽,分别为第二名2.88倍和1.44倍。这表明华为OceanStor A800在单位资源利用效率方面也具有显著优势,可以有效降低用户的大规模AI训练成本。
此外,OceanStor A800可以通过大规模横向扩展提供百TB级带宽,并大幅缩短checkpoint读写时间(从10分钟缩短至秒级),断点续训时间小于15分钟。这些优化有效减少了GPU等待时间,使得端到端算力利用率提升30%以上,全面提升了大模型训练效率。这对于需要处理海量数据的AI应用场景至关重要,可以显著加快模型训练速度,缩短研发周期。