七彩虹 iGame GeForce RTX 4090 Vulcan OC 显卡评测
脚本之家
每当 NVIDIA 发布全新显卡时,玩家们的目光总会聚集到各式各样的非公版显卡上。而七彩虹作为国产 AIC 厂商中的佼佼者,一直凭借着出彩的设计和扎实负责的保修受到玩家们的青睐。在 RTX 4090 系列 GPU 首发之际,七彩虹也推出了旗下高端产品:iGame GeForce RTX 4090 Vulcan OC。
它的特别之处在于,提供了磁吸智屏和一键超频两大独占功能。我们也是提前收到了它,在本次测试中,我们将使用七彩虹最好全家桶,看看这款支持一键超频的高端非公 RTX 4090 能把核心压榨到什么水平。具体配置如下:
外观设计
七彩虹 iGame GeForce RTX 4090 Vulcan OC 包装盒体积巨大,正面印有显卡型号和显存规格,即 GDDR6X 24GB 显存。下方还有它使用的一些先进技术,比如 NVIDIA DLSS、光线追踪、NVIDIA Reflex 和 NVIDIA Studio。
包装内除了必备的延长线缆、说明书等配件外,单独配备了一副防静电手套和一张擦拭布。
由于 RTX 4090 独特的定位,七彩虹 iGame GeForce RTX 4090 Vulcan OC 还随机附赠了独特的磁吸智屏部件和安装工具。此外还附赠了用于支撑显卡重量的三角支架。
显卡本体方面,七彩虹 iGame GeForce RTX 4090 Vulcan OC 显卡采用 3 风扇设计,整体为锖铁黑配色,全金属框架,设计灵感来自「后・赛博时代」。产品尺寸为 348.5*159.5*70.4mm,是一张占据三槽半的大型显卡。
风扇中央印有七彩虹 iGame 图形 Logo 和英文字母 Logo,周围有多种样式的金属材质不规则装饰件。风扇规格为 104mm 大口径,9 片扇叶,采用「聚风镰环」设计。
七彩虹 iGame GeForce RTX 4090 Vulcan OC 显卡背板采用拉丝金属纹理,右侧有一块不规则开窗设计和三角形 Logo 装饰片。
开窗内是一组导热鳍片,七彩虹官方称其为采用了“回流焊”工艺,确保鳍片与热管紧密焊接。
显卡侧面是散热模组的另一面,同样布满散热鳍片,内置 9 根 8mm 热管,右侧和下方被金属外骨骼和金属中框包裹,下侧中间有一个用于连接磁吸智屏的平台,通过金属触点方式连接。
小屏幕也支持通过外置延长线和底座单独摆放,成为硬件发烧友们“桌面美学”的一部分。
在七彩虹的控制中心 iGame Center 中,可以对这块屏幕进行细致的自定义。
七彩虹 iGame GeForce RTX 4090 Vulcan OC 显卡的 I / O 金属挡板上,配备了 3 个 DP1.4 接口和 1 个 HDMI2.1 接口,支持最高 8K 输出。最大的亮点莫过于能够一键超频的实体按钮,这是七彩虹的专利设计,让超频成了小白们也能轻松完成的一件事。
最后,是七彩虹 iGame 联合拼奇积木打造的桌搭周边“iGame 奇趣主机”积木玩具搭配 iGame GeForce RTX 4090 Vulcan OC 显卡的效果。如果大家对这款属于极客的桌搭周边感兴趣的话,可以前往微信小程序搜索“COLORFUL 官方旗舰店”购买图中同款。
技术解析
GeForce RTX 40 系列首发三款型号分别是 GeForce RTX 4090、GeForce RTX 4080 16GB、GeForce RTX 4080 12GB,iGame GeForce RTX 4090 Vulcan OC 是基于目前最高端的 AD102 核心打造的,内有 16384 个 CUDA 核心、512 个 Tensor 核心、128 个光追核心、512 个纹理单元、176 个 ROP 单元,比上一代 RTX 3090 核心规模大了一半还多。后续应该还有真旗舰 RTX 4090 Ti,解锁剩下的 2 个 GPC 单元。
GeForce RTX 4090 公版的核心频率是 2235-2520MHz,而 iGame GeForce RTX 4090 Vulcan OC 在启用一键超频后,频率默认就能达到 2625MHz,相比上代提升了一半还多。显存方面依旧是 384-bit 24GB GDDR6X,但带宽来到了 1TB / s。默认模式下 TDP 为 450W,一键超频后 TDP 则能达到 510W,和非公版 RTX 3090 Ti 差不多,相比于 RTX 3090 增加了整整 160W。
GeForce RTX 4090 的架构也发生了不小的变化,它升级到了最新的 NVIDIA Ada Lovelace 架构。它基于 TSMC 定制 4N 工艺打造,因此实现了高达 2 倍的性能功耗比飞跃。流式多处理器具有高达 83 TFLOPS 的着色能力,吞吐量超过上一代产品 2 倍。第三代 RT Cores 的有效光线追踪计算能力达到 191 TFLOPS,是上一代产品 2.8 倍。第四代 Tensor Cores 新增 FP8 引擎,具有高达 1.32 petaflops 的 Tensor 处理性能,超过上一代的 5 倍。SER 为光线追踪带来最高可达 3 倍的性能提升,整体游戏性能提升可高达 25%。
以上这些数据可能比较抽象。反映到具象的功能上,新架构带来了不少的新功能。由于双 NVENC 编码器的引入,让它新增了对 AV1 编码的支持,可以将视频导出时间至多缩短一半。正是由于 Ada 光流加速器的引入,使得 DLSS 3 能够预测场景中帧和帧之间的运动变化,实现 AI 插帧,在保持图像质量的同时提高帧率。总之就是游戏生产两相宜。
发布会上最重磅的一个技术升级,便是 DLSS 3 技术了。DLSS 3 是一款由 AI 驱动的性能倍增器,由全新第四代 Tensor Core 和 GeForce RTX 40 系列 GPU 的全新光流加速器驱动,是 NVIDIA 广受好评的深度学习超级采样技术的最新版本,并拥有开创性的光学多帧生成功能,将开启 NVIDIA RTX 神经网络渲染游戏和应用的新时代。
基于 NVIDIA Ada Lovelace 架构的新光流加速器可分析两帧连续的游戏图像,并计算帧到帧中物体和元素的运动矢量数据,而不使用传统游戏引擎的运动矢量进行建模。这极大地减少了 AI 在渲染诸如粒子、反射、阴影和光照等元素时的视觉异常。
简单地说,过去的 DLSS 2 是通过渲染出一个低分辨率图像,然后 AI 放大至高分辨率,实现画质与帧数的兼顾。而全新的 DLSS 3 在兼容 DLSS 2 的基础上,还新增了插帧功能,可以在两个真实帧之间插入 AI 推算出来的虚拟帧,实现帧数的倍增。再结合 DLSS 2 的超分辨率功能,AI 能重建至多八分之七的显示像素,与没有 DLSS 相比,游戏性能最高提升了 4 倍!
口说无凭,我们直接进入测试环节。最新版的 3DMark 已经适配了 DLSS 3 的 BenchMark,我们把 iGame GeForce RTX 4090 Vulcan OC 的测试结果和 DLSS 2 进行控制变量的对比,可以直观地看出差异。实测在 DLSS 2 模式下,平均帧数为 135 帧,相比于不开 DLSS 2 已经提升了两倍多。
但如果我们开启最新的 DLSS 3 技术,iGame GeForce RTX 4090 Vulcan OC 显卡帧数直接来到了平均 166 帧,比不开 DLSS 提升了 3 倍多。至于具体的游戏帧数提升,我们稍后统一进行测试。
目前,DLSS 3 已经得到了许多全球领先游戏开发者的支持,超过 35 款游戏和应用宣布即将支持该技术,比如《超级人类》(SUPER PEOPLE)、《生死轮回》(Loopmancer)、《逆水寒》“拂云庭“(Justice ‘Fuyun Court’)、《微软模拟飞行》(Microsoft Flight Simulator)、《瘟疫传说:安魂曲》(A Plague Tale: Requiem) 都将提供 DLSS 3 的支持。
压力测试 & 理论跑分
这样一款非公旗舰,会在公版显卡的基础上有多大的进步呢?接下来我们进行理论测试,首先是单烤甜甜圈,烤机 15 分钟后,核心温度稳定在 59℃左右,功耗稳定在 510W 左右,比公版的 440W-450W 更高,符合一键超频后的 TDP。不过这也意味着 GeForce RTX 4090 的确特别吃电源。如果配 i7 / i9 这样等级的处理器的话,还是老老实实上 1000W 以上的电源吧,最少也要 850W 不虚标的电源。
接下来进行 3DMark 压力测试,这个测试可以检测连续跑分下显卡性能有没有发生下降,一般 97% 以上才算合格的显卡。实测 iGame GeForce RTX 4090 Vulcan OC 的得分为 99%,几乎没有降频,完美通过测试。
在 3DMark TimeSpy DX12 测试中,iGame GeForce RTX 4090 Vulcan OC 显卡分数达到了 35180 分,作为对比,GeForce RTX 4090 公版的分数为 34725 分,RTX 3090 为 18981 分。
我们还测试了一下关闭一键超频与打开一键超频后的性能对比。关闭一键超频后,TimeSpy Extreme 的分数为 18587 分,而在打开后则提升了大约 4.5%,来到了 19450 分,看来一键超频的提升是肉眼可见的,所以接下来的测试我们全部在一键超频模式下进行。
在 3DMark Fire Strike DX11 测试中,iGame GeForce RTX 4090 Vulcan OC 显卡分数达到了 76434 分,作为对比,GeForce RTX 4090 公版的分数为 75013 分,GeForce RTX 3090 为 46045 分。这个分数意味着可以 4K 分辨率流畅运行所有的游戏了,哪怕是光追游戏和 VR 游戏也能满足高刷新率的需求。
在 3DMark Portal Royal 光追测试中,iGame GeForce RTX 4090 Vulcan OC 获得了 25312 分,比公版 RTX 4090 的 25080 分更高。过去 GeForce RTX 3090 可以在 2K 分辨率下流畅体验的光追游戏,RTX 4090 已经可以再在 4K 分辨率下畅玩了。
游戏实测
反映到实际游戏中,DLSS 3 能带来多大的提升呢?目前 DLSS 3 已经适配了不少新游戏,由于只要适配 DLSS 3 就可以向下兼容 DLSS 2,开发难度非常低,所有后续肯定会有越来越多开发商加入 DLSS 阵营。我们选取了《赛博朋克 2077》、《逆水寒 》和《虚幻引擎 5:天琴座》这几款已经适配了 DLSS 3 的游戏来进行测试。此外我们还会测试一款 Unity 引擎的 Demo《Enemies》。
首先我们测试一下国产武侠网游《逆水寒》中,同样提供了 RTX 光线追踪和 DLSS 3 的选项。我们开启 4K 最高画质来试试它的帧数表现吧。从下面的数据可以看出,不开启 DLSS 几乎是不可玩的状态,而在开启 DLSS 3 后,帧率提高了近 5 倍。相比于同档位的 DLSS 2 也提升了近 65%。
在画质方面,我们选择了一处 BenchMark 中的细节,可以看出 DLSS 关闭和 DLSS 平衡的画面差距微乎其微,由于抗锯齿的存在,开启 DLSS 后甚至更养眼了一些,这就是 AI 技术的魅力所在。
↑ 左 DLSS 关闭 ,右 DLSS 3 平衡
在《赛博朋克 2077》这款显卡杀手中,我们可以在 4K 最高画质超级光追的模式下运行它自带的 BenchMark,得到了以下数据。iGame RTX 4090 Vulcan 可以在原生 4K 分辨率下运行超级光追的《赛博朋克 2077》。而在开到 DLSS 超级性能档位的前提下,能实现 4K144Hz 畅玩,对于超级发烧友,甚至能满足 8K60 帧的畅玩。
接下来是一款使用虚幻 5 引擎制作的游戏 Demo《Lyra》。虚幻 5 引擎提供了对 RTX 光线追踪、DLSS 3 和 NVIDIA Reflex 完整的支持,因此后续会有大量基于虚幻 5 引擎打造的 3A 大作上线(比如《黑神话:悟空》)。
DLSS 3 在《天琴座》中的表现同样符合预期。在开启 DLSS 3 后,帧率提高了近 1.7 倍。相比于同档位的 DLSS 2 也提升了近 20%。
除了虚幻引擎外,Unity 引擎也提供了对 RTX 光线追踪、DLSS 3 和 NVIDIA Reflex 的完整支持。最后我们测试一款画质爆炸的 Demo《Unity:Enemies》。这款 Demo 就没有那么多档位可以选了,只能调整开关。GeForce RTX 4090 在开启 DLSS 3 后,帧数暴涨了近 3 倍,4K 渲染丝般顺滑。
在对于 AI 来说难度颇高的衣物纹理和发丝渲染方面,打开 DLSS 和关闭 DLSS 仅有轻微的画质差异,在 4K 显示器上很难看出。可以说在 DLSS 3 的 AI 助力下,4K 光追游戏终将普及,成为各种游戏的标配。
↑ 左 DLSS 关闭 ,右 DLSS 3 开启
那么 DLSS 3 技术就是十全十美的吗?当然不是。DLSS 3 的本质是插帧,插帧必定有一个副作用就是延迟的提高。毕竟我们鼠标是对我们看到的那一帧做出的反馈,而 AI 却会加上额外的帧,这个延迟的提高对于竞技游戏的影响是很大的。所以在打开 DLSS 3 的插帧功能时,NVIDIA Reflex 会强制打开,尽量弥补插帧带来的渲染延迟。从测试数据中我们可以看出,开启 DLSS 3 后的延迟甚至比啥都不开还要略低一些,如果想要追求绝对的低延迟的话,可以关闭 DLSS,单独打开 NVIDIA Reflex,享受极限的电竞体验。
在《古墓丽影: 暗影》中,实测在 4K 分辨率最高画质下运行 BenchMark 能跑到 180 帧,已经能满足 4K144Hz 的显示器畅玩了。
这款游戏也有 DLSS 支持,但版本比较老,所以效果肯定没有 DLSS 3 那么明显了,实测 DLSS 下平均提升到了 218 帧。
最后我们测试一款光追 3A 大作《控制》,4K 最高画质最高光追下不开 DLSS 只能勉强 72 帧流畅游玩,而 iGame RTX 4090 Vulca 开启 DLSS 后帧数几乎翻倍,这个 4K 游戏体验相当出色了。
创意生产
到了 RTX 4090 这个级别的,肯定不仅仅是打游戏,创意生产和深度学习才是主要受众。iGame RTX 4090 Vulca 也是一款通过 NVIDIA Studio 认证的 GPU。目前有超过 75 款创意应用可以调用 AI 算力,来大大提高工作效率。
在建模渲染类软件中,GeForce RTX 4090 可以利用 CUDA 为工作提供硬件加速,目前几乎所有的建模软件都会对 NVIDIA 的 GPU 有优化,所以能做到效率、稳定和兼容性的共存。比如在常用的渲染工具 V-Ray 中,可以借助 RTX 加速的光线追踪,实现高性能最终帧渲染。借助搭载 AI 的降噪功能,GPU 可进一步加速交互式渲染。
V-Ray Benchmark 开启 CUDA 加速的话,分数达到了 4311 分,比公版的 4200 多分更高,创下了我们的历史记录。
得益于光追性能的提升,iGame RTX 4090 Vulcan 在 V-Ray GPU RTX 中的分数也提高到了 5870 分,也比公版卡略高一些,足以应对实时光追的重度渲染。
在视频后期这一块,RTX 40 系 GPU 新增了对 AV1 编码的支持。AV1 是下一代的视频编码技术,能够在占用相同空间情况下,提供更加快速的视频编码和更高质量的流媒体传输性能。NVIDIA 与多家行业合作伙伴密切合作,当今主流多媒体应用均可以支持 AV1。目前国内的万兴喵影和剪映专业版已经支持 AV1 的视频加速。
OBS 直播软件也支持了 AV1 编码的录制,希望能尽快适配 AV1 编码的直播,大大节约直播带宽。
常用的视频调色剪辑软件 Davinci 也提供了 AV1 编码的支持,作为一个免费开源的编码,后面会有越来越多的主流软件加入进来。
我们为大家测试了 PugetBench For Davinci。基于 NVIDIA CUDA 技术的 GPU 加速特效可实现更快速度的实时视频编辑和帧渲染,使用 NVIDIA 编码的输出速度提升最高可达 5 倍。iGame RTX 4090 Vulcan 最终分数可以达到 2687 分,比公版的 2610 分还要更高。
总结
iGame GeForce RTX 4090 Vulcan OC 火神显卡最吸引人目光的莫过于独特的磁吸智屏了。搭载屏幕的显卡并不少,而能取下作为一个桌面摆件的可不多。对于显卡个性化有要求的玩家们来说,七彩虹 iGame GeForce RTX 4090 Vulcan OC 的确是一个很好的选择。性能方面,RTX 4090 在 4K 分辨率下已经能满足高帧数 3A 的全部要求。如此强悍的性能,再加上 DLSS 3 的加持,即便是 8K 游戏也是可以挑战的。
如果你是想体验 4K144Hz 的游戏发烧友,那么 iGame GeForce RTX 4090 Vulcan OC 这款兼顾了外观设计与强悍性能的个性化显卡会是入手 RTX 4090 非公卡的好选择,该显卡将于 10 月 12 日晚 9 点整在京东、天猫、抖音、快手等电商平台及全国经销零售渠道开售。另外,七彩虹战斧 GeForce RTX 4090 豪华版、iGame GeForce RTX 4090 Neptune OC 两款也将随 iGame 4090 火神一同开售,售价在 12999-14999 元之间。