Rain科技1月25日消息,华硕Tony大叔发布了RTX 5090/D的详尽评测跑分、液氮超频视频,其中首次公开展示了RTX 5090/5090D所用GB202 GPU核心的内核照片,引发业界关注。
GB202 采用升级版台积电 4N 增强版工艺制造,与上一代 AD102 使用的 4N 工艺相比,性能有所提升,但都属于 5nm 级别。值得注意的是,NVIDIA 对此工艺进行了单独定制,导致命名略显混乱。
GB202 集成晶体管数量高达 922 亿个,比 AD102 的 763 亿个增加了约 21%。同时,芯片面积也从 616 平方毫米增加到 761 平方毫米,增幅约为 23.5%。尽管晶体管数量大幅增加,但面积的增幅更大,导致晶体管密度反而略有下降。这可能与工艺改进和设计优化有关,旨在提升性能和稳定性。
GB202 仍然采用 12 组 GPC,但每组 GPC 内部的 TPC 数量从 6 组增加到 8 组。每组 TPC 中仍然包含两组 SM,每组 SM 拥有 128 个 CUDA 核心。满血核心总计拥有 24756 个 CUDA 核心。RTX 5090/5090D 均屏蔽了部分 TPC,屏蔽幅度约为 11%。
值得关注的是,RTX 5090D 并没有减少 Tensor 核心的数量,仍然保持在 680 个。这表明 RTX 5090D 的 AI 算力限制可能是通过底层软件实现的,而非硬件裁减。未来是否可以解除此限制,还有待进一步观察。
GB202 的一级缓存从 16MB 增加到 21.5MB,二级缓存从 72MB 增加到 96MB,增幅与 CUDA 核心的增加比例一致。这种同步扩容优化了缓存性能,提升了数据访问速度。
芯片中间竖向的长条区域是编解码器。满血核心拥有 4 组第九代编码引擎 NVENC 和 4 组第九代解码引擎 NVDEC,而 RTX 5090 和 5090D 分别只启用了 3 组和 2 组。这可能是为了控制功耗和成本,并根据不同市场需求进行差异化设计。
芯片底部边缘是 PCIe 5.0 x16 PHY 物理层和 5 条视频输出接口;顶部和左右边缘是 GDDR7 显存控制器,每组 32-bit,共 16 组,构成 512-bit 的位宽,保证了高速的数据传输能力。
在液氮超频测试中,Tony大叔将 RTX 5090 的核心频率超频至 3390MHz,显存等效频率达到 34GHz。在 3DMark 测试中,其成绩令人瞩目:Time Spy Extreme 突破 3 万分(世界第三),Fire Strike Ultra 接近 3.7 万分(世界第一),Port Royal 超过 4.3 万分(世界第一)。这些成绩充分展现了 RTX 5090 的强大性能潜力。



















