通常情况下,新产品的发布会信息,我(托尼)都会选择在工作日进行报道,因为厂商们也习惯于选择工作日来举办发布会。不过,一家名为“砺算科技”的厂商却很特别,他们在周末召开了新品发布会(虽然这迫使我也跟着加了班)。不过,这次发布的内容确实堪称重磅——这是国内首款自研的6nm工艺显卡!
没错,就是那种可以安装在电脑上玩游戏使用的显卡。而且,根据砺算科技在发布会上宣称的数据,这款显卡的栅格化性能已经超越了英伟达的RTX 4060,甚至能够稳定运行1080P分辨率下的《黑神话:悟空》。作为一名关注中国科技发展的作者,在看完砺算科技的新品发布会后,我不得不说,我至今仍感到有些意外和兴奋。
值得注意的是,根据公开报道,砺算科技截至2024年的总募资额仅为6.28亿元人民币。将其与我们熟悉的英伟达、英特尔和AMD相比较,这三家巨头的年研发投入动辄数百亿。试想一下,国内的芯片初创公司,仅凭对方研发投入的十分之一甚至更少的资源,就“凭空”开发出了接近RTX 4060级别的显卡?这无疑是一个了不起的成就,堪称中国芯片领域的“DeepSeek”时刻。
当然,对于急切想了解这两款产品详细测试表现的读者,可能还需要耐心等待一段时间。昨天发布的消费级显卡7G106和专业级显卡7G105,预计将在8月份开始送样,并在9月份正式量产。
因此,真正意义上的实际上手评测还需要一段时间。但如果您对昨天的发布会公布的其他细节仍有兴趣,我将在这里为您梳理这两款国产自研显卡的最新信息。
首先,这两款显卡的核心GPU部分,均基于台积电的N6(6nm)工艺制程,并且采用了“砺算科技”自主研发的TrueGPU图形架构。这意味着从计算核心到指令集的完整设计都由中国自主完成,而非市场上常见的“公版IP授权+自主优化”模式。这种完全自主的研发路径,对于长期以来受制于人的中国半导体产业而言,具有里程碑式的意义。
那么,这种自主研发的优势体现在何处呢?发布会中提到了一些具体的例子,可以帮助我们更好地理解。
我们都知道,GPU的3D渲染是通过无数个三角形如同积木般拼接而成的。GPU的渲染过程,实际上就是三角形的拆分、拼接以及后续的计算过程。砺算科技官方表示,其7G106显卡在三角形渲染方面,重新设计了图形管线的执行逻辑,实现了智能乱序渲染,并能根据负载情况动态分配计算单元。这种优化避免了传统GPU需要按照固定、低效的步骤一步步执行的模式,从而在适配的场景下,能够直接提升高达50%的渲染效率。
此外,砺算7G106还支持FP32或INT32指令的双发射,以及以方块形式存储矩阵数据等特性,这些设计有望优化40%的显存使用效率。从这些技术支持特性来看,砺算显卡的设计思路相当超前。
例如,FP32/INT32双发射这一特性,我查阅资料发现,英伟达是在其20系显卡上才开始支持,AMD是近两年的RX 7000系列才开始支持,而英特尔则是在A700系列独显上才实现。砺算科技能够在一开始就实现这一先进特性,显示出其在架构设计上的深厚功底。
在GPU部分之后,我们再来看看这两款显卡的具体硬件规格:
根据发布会披露的信息,消费级显卡砺算7G106配备了12GB GDDR6显存。虽然功耗和核心频率等基础硬件信息尚未公布,但根据业内爆料,砺算7G106拥有192bit的显存位宽,192个纹理单元(TMU)和96个光栅单元(ROP)。
如果这些爆料属实,那么砺算7G106的纹理单元和光栅单元规模分别是RTX 4060的两倍,这似乎也解释了为何其在跑分上能够超越4060。此外,砺算7G106支持DirectX 12、Vulkan 1.3、OpenGL 4.6和OpenCL 3.0等主流API,这表明其在图形处理能力方面达到了主流水平,但可能在某些进阶特性上有所欠缺。
例如,目前DirectX 12 API的最新版本是DX12 Ultimate,Vulkan的最新版本是1.4。缺乏对这两个API最新版本的支持,可能意味着砺算7G106在光线追踪(Ray Tracing)和可变速率着色(VRS)等高级图形技术方面存在限制,这将直接影响游戏画面的表现和帧率,并在渲染能力上存在一定的劣势。
可变速率着色(VRS)示意图(从左到右,着色率降低):
对比之下,砺算科技的目标是挑战行业巨头英伟达。英伟达早在2014年发布的GTX 900系列显卡上就引入了瓦片式渲染和改进的调度器,这些技术在某种程度上类似于砺算科技宣传的“智能乱序渲染”。然而,英伟达直到4年后的RTX 20系列才开始支持可变速率着色(VRS),并全面支持DX12 Ultimate API。可见,在这些面向未来的图形技术方面,砺算7G106的后续产品仍有很大的提升空间。
在其他方面,砺算7G106采用了PCIe 4.0 x16接口标准,并提供4个DisplayPort 1.4接口,公版卡似乎没有配备HDMI接口。这对于用户连接显示器和组建多屏显示系统提供了基础支持。
另外,专业卡7G105的规格也值得一提,整体定位属于中高端。它配备了24GB GDDR6 ECC显存,最大纹理填充率为384GT/s,最大像素填充率为192GP/s,并支持FP32和INT8计算,FP32峰值吞吐量高达24TFLOPS,非常适合高像素渲染以及大规模模型训练等专业应用。
尽管在架构和规格方面,目前公开的资料还不多,但我相信大多数游戏玩家更关心的还是实际的游戏性能表现。正如前面提到的,砺算7G106在部分栅格化性能上确实能够与RTX 4060媲美。
例如,在Geekbench测试中,衡量GPU通用计算能力的OpenCL跑分,砺算7G106获得了111290分,比RTX 4060的101028分高出约10%,甚至能与RTX 5060媲美。如果上市价格具有竞争力,那么在仅考虑栅格化性能的前提下,玩家可能会用更少的成本获得与RTX 4060相当的体验,这将改变目前AMD显卡在这一定位市场的优势格局。
而在更能反映游戏性能的3DMark Fire Strike(1080p)测试中,砺算7G106的得分为26800分,而RTX 4060的得分大约在27000到28000分之间,砺算7G106的表现也几乎追平了4060。
在更具挑战性的4K分辨率测试项目Steel Nomad中,砺算7G106的跑分为2256分,参考公开的测试数据,RTX 4060在此项测试中的得分大约在2302分左右。这表明在更高分辨率下,砺算7G106的性能差距略有扩大,但总体而言,其栅格化性能已经达到了一个令人印象深刻的水平。
总的来说,砺算7G106显卡的整体表现,虽然还不能完全说与英伟达RTX 4060旗鼓相当,但其栅格化性能已经非常接近,并且在一些细节方面展现出了自身优势。然而,我们也清楚,英伟达除了硬件实力,强大的软件生态同样是其核心竞争力,而DLSS技术便是其中的代表。
根据发布会的演示,砺算也开发了一款名为NRSS的DLSS类似技术,但现场并未展示实际效果。我注意到发布会最后播放的演示视频中,使用了“游戏科学NXSR”技术,通过原生低画质配合超采样来实现4K分辨率下《黑神话:悟空》的流畅运行。不过,对于一款定位甜点级的显卡,玩家们更关注的还是在1080P分辨率下的表现。
在《黑神话:悟空》1080P分辨率、高画质的设置下,砺算7G106能够提供平均超过70帧的流畅体验,并且在激烈的战斗场面,如遭遇野怪、释放技能和特效时,帧数也没有出现明显的波动。这个表现已经与RTX 4060在关闭DLSS时的帧数相当(虽然如此对比并不算公平)。
更令我感到惊喜的是,在另一款新作《明末:渊虚之羽》中,砺算7G106在1080P分辨率、高画质设置下,依然能保持70帧以上的流畅运行。参考业内针对这款游戏进行的实测,RTX 5060显卡在开启DLSS 4多帧生成后,帧数可达149帧,但同时也会出现明显的卡顿感。要知道,《明末:渊虚之羽》这款游戏上线时间不长,砺算7G106能在如此短的时间内,在未进行深度优化的前提下,取得这样的可玩性表现,这无疑得益于其更大的核心规模、更多的显存以及更高的显存位宽带来的“力大砖飞”式的性能提升。
然而,在老牌3A游戏《古墓丽影:暗影》中,砺算7G106的表现就稍显逊色,平均帧数仅在80帧左右。在相同的画质设置下,RTX 4060由于有专门的优化,可以达到147帧。这恰恰指出了国产GPU目前面临的最大挑战:硬件上的突破只是第一步,后续的驱动适配和游戏优化还有很长的路要走。
如果我后续有机会拿到这款显卡,届时一定会为大家带来更全面、更深入的评测。
我认为,随着驱动程序的不断优化,砺算7G106的整体性能有望达到RTX 4060的水平。而且,游戏玩家社区对国产显卡一直抱有很大的包容性。即便是最终的实际表现略逊于4060,或者在使用过程中出现一些bug,但只要价格合理,不“割韭菜”,并且愿意与国内玩家群体一同成长,我相信大众的支持和理解将是巨大的动力。
我们可以参考另一款国产显卡摩尔线程S80的例子。
刚推出时,S80显卡也面临着许多游戏无法运行、缺乏优化的批评。但随着其价格的下调,特别是优惠后的价位一度跌破千元,人们对摩尔线程的评价也发生了巨大的转变,不少评论区甚至出现了“只有中国人真心对中国人好”的感言。
这不禁让人产生一个问题:大家认为这次砺算的显卡,最终会以怎样的价格上市呢?这是一个值得我们期待和关注的焦点。













