**一、前言:制程工艺不变,IPC 性能暴涨 20% 的 Zen 5 架构**
这十年来,AMD 的 CPU 给我们带来了无数惊喜!
今天上市的 AI PC 所搭载的锐龙 AI 300 系列处理器,与上代的锐龙 8000 系列移动处理器一样,都采用了台积电 4nm 先进工艺。
**但如标题所言,基于 Zen 5 架构的锐龙 AI 9 HX 370 是当今最优秀的移动处理器,甚至没有之一!**
那么 AMD 是怎么做到的呢?Zen 5 架构和锐龙 AI 300 系列处理器到底做了哪些技术上的革新呢?
**1、更多的算术逻辑单元 (ALU)**
在拥有了足够成熟且强大的设计能力之后,AMD 的工程师大幅度提升了 Zen 5 核心流水线宽度,ROB 重排序缓冲区 (Reorder Buffer) 从原来的 320 个条目指令提高到了 448 个条目指令,增加了 40%。
更宽的流水线,让 Zen 5 核心可以容纳更多的算术逻辑单元 (ALU) 和地址生成单元 (AGU)。
Zen 4 架构每个整数寄存器中包含了 4 个 ALU 和 3 个 AGU,**而 Zen 5 则分别提升到了 6 个和 4 个。特别是至关重要的 ALU 单元数量相比上代增加了 50%,这也意味着 Zen 5 核心在相同周期内能处理更多的指令集。**
配套的调度器数量也大幅度增长!
Zen 4 拥有 3×24 一体化 ALU/AGU Scheduler 和单独的 1×24 ALU Scheduler,总计是 96 个。Zen 5 则设计了 88 ALU Scheduler 和 56 AGU Scheduler,理论上可提升 50% 的运算吞吐量。
**2、更快的 L1/L2 缓存**
Zen 5 主要改进了一级数据缓存 (L1 Date Cache),从 Zen 4 的 8 路 32KB 提升到了 12 路 48KB。
同时,通往一级缓存、浮点单元的最大带宽,也比上代翻了一番,并改进了相应的数据预取。
二级缓存的容量没有变化,依旧是每核心 1MB,但是链路通道从 8 路倍增到了 16 路。简单的说,就是 L2 带宽翻倍。
更快的 L1/L2 缓存能让 Zen 5 核心拥有更稳定的峰值性能。
**3、更高效的同构大小核设计**
酷睿第 12 代处理器开始采用大小核策略让 Intel 一时风头无两,大核玩游戏,小核提升多线程性能。
核心数量和多线程性能上的劣势让 AMD 略显被动,而代号为“Strix Point”的 Ryzen AI 300 系列处理器就是 AMD 首次采用混合核心设计的产品。
Strix Point SOC 包含 2 个 CCX,大核拥有 4 个高性能 Zen 5 内核,16MB 三级缓存;小核则有 8 个紧凑型 Zen 5c 内核,8MB 三级缓存。
**不同于 Intel P-Core + E-Core 的大小核异构架构设计,Zen 5 和 Zen 5c 拥有完全相同的架构设计、IPC 性能和 ISA 指令集,不同之处只是后者缓存更小、频率更低 (但能效更高)。**
另外需要注意的是,由于 Zen 5 和 Zen 5c 分别位于 2 个 CCX 之中,它们的三级缓存虽然理论上可以互相访问,但延迟会有所增加,同时传输速率也会受到 IF 带宽的限制。所以**AMD 采取了特殊的控制策略,通过 Windows 调度管理,尽可能地让 Zen 5、Zen 5c 分别访问自己的三级缓存。**
**4、1024 个流处理器的 RDNA 3.5 GPU**
在内置集显领域,AMD 一直没有对手!
锐龙 AI 300 系列处理器集成了升级版的 RDNA 3.5 架构的 AMD Radeon 800M 系列 GPU,最多拥有 1024 个流处理器,足足提升了 1/3。
除了增加流处理器数量之外,RDNA 3.5 还增强了向量指令集架构 (ISA),提高了插值和比较的速率,从而提升了图形渲染的效率。
内存管理方面,AMD 对图形数据结构进行了优化,包括 L2 缓存和 SoC (System on Chip) 总线,以减少内存访问次数,提高数据压缩技术和工作负载的优化。
按照官方说法,在同样的 15W 功耗释放下,Radeon 800M 系列对比前代的 3DMark 理论性能,在 Night Raid 和 Time Spy 项目中分别提升了多达 19%、32%。
当然,理论性能并非与实际等同,新一代的 GPU 架构肯定需要驱动的持续优化才能发挥出效能。
**除了以上几点之外,Zen 5 处理器的浮点性能也得到了增强,拥有了完整位宽的 AVX 512 指令集。**
其实 Zen 4 架构也能支持 AVX 512 浮点运算,但它是通过 2 个 256-bit FPU 合并运算来实现,而 Zen 5 则是拥有完整的 512-bit FPU 以及与其位宽匹配的流水线管道。
对于支持 AVX 512 指令集的程序,例如 AIDA64 GPGPU、Geekbench 6、PS3 模拟器等应用,Zen 5 架构最多可以带来 50% 的性能提升!
**此次我们收到的是华硕送测的灵耀 16 Air,它搭载的是锐龙 AI 9 HX 370 处理器**,拥有 4 个 Zen 5 和 8 个 Zen 5c 内核,共计 12 核心 24 线程,二级缓存 12MB、三级缓存 16MB+8MB、Zen 5 核心加速频率可达 5.1GHz,本机**性能释放 28~33W。**
这一款厚度仅有 1.1cm 的高端超轻薄笔记本,下面我们来看在 30W 的功耗限制下,锐龙 AI 9 HX 370 能发挥出怎样的性能。





