Rain科技10月11日美国旧金山现场报道:
在本次活动中,AMD除了正式发布Instinct MI325X GPU加速卡的升级版外,还重磅宣布了全新一代Instinct MI350系列的首款产品——Instinct MI355X,并公布了部分规格和性能数据。
据悉,MI355X计划于2025年下半年上市,这意味着我们还需要等待大约一年时间。
MI350系列的亮点在于首次采用了台积电3nm工艺和全新的CDNA 4架构,并首次引入了FP6和FP4浮点数据类型。值得关注的是,其内存依然采用HBM3E,但容量却惊人地达到了288GB。
虽然AMD尚未公布MI355X的具体功耗,但考虑到MI325X的最高功耗已达1000W,以及英伟达B200(1000W)和GB200(1700W)等竞争产品的功耗水平,MI355X的功耗很可能显著超过1000W,这与业界整体趋势相符。
FP6和FP4都属于低精度浮点数据格式,分别代表6位和4位精度。相比于FP16和FP8,其精度虽然降低,但数据处理速度大幅提升,非常适合大模型的量化计算,尤其在大语言模型和混合专家模型等应用场景中具有显著优势。如果对精度要求不高,而更注重运算速度,那么FP6和FP4将是理想的选择。
MI355X的FP6和FP4浮点性能均达到了9.2 PFlops(每秒9200万亿次运算);同时,其FP16和FP8性能也分别提升了80%,达到2.3 PFlops和4.6 PFlops。 需要注意的是,英伟达Blackwell GPU也引入了FP6和FP4精度,但其性能更高,分别达到20 PFlops和40 PFlops,这体现了竞争对手之间在技术上的激烈竞争。
单卡288GB HBM3E内存以及高达8TB/s的带宽,是MI355X的另一大亮点,相比MI325X分别提升了约1/8和1/3,而与目前已上市的MI300X相比也有50%的增长。虽然Blackwell B200也拥有192GB HBM3E内存和8TB/s带宽,但在内存容量方面仍逊于MI355X。
MI355X支持单平台八卡互联,这将带来总计2.3TB HBM3E内存和64TB/s的带宽,其峰值性能将达到FP16 18.5 PFlops、FP8 37 PFlops以及FP6/FP4 74 PFlops。这款产品也计划在明年下半年上市。
Instinct系列GPU的性能提升速度令人瞩目,每一代产品都展现出显著的进步,跨代对比更是令人印象深刻。与MI300X相比,MI355X的FP16性能提升了7.4倍,HBM内存容量也增加了1.5倍,这使得其能够处理的模型参数规模从7140亿增加到4.2万亿,足足提升了6倍。
展望未来,AMD计划在2026年推出下一代Instinct MI400系列,并基于全新的CDNA架构(可能是CDNA 5),届时其规格和性能将再次实现质的飞跃,值得期待。





