再掀波普冲击波 七彩虹iGame RTX 4070 SUPER Ultra显卡评测
脚本之家
随着GeForce RTX 4070 SUPER正式发布,GeForce RTX 40系列在今年正式步入了SUPER版本的更新节奏。相比Ti系列作为数字型号之间的性能补充,SUPER系列更像是原来数字版本的进化,但在定价策略上与数字相当,这让SUPER本身的性价比变得更为凸显。
而如果希望让这块GPU的性价比还能进一步提升,非公版的显卡就相当值得考虑一下了,例如这篇文章的主角iGame GeForce RTX 4070 SUPER Ultra W OC 12GB,就是很好的例子。
有意思的是,RTX 4070 SUPER本身就提供了丰富的话题度,与RTX 4070 Ti看齐的48MB L2缓存,高达7168个CUDA Core,224个第四代Tensor Core和56个第三代RT Core,都让这块GPU本身充满了Ti系列的味道,再加上NVIDIA近段时间在DLSS 3.5、生成式AI创作、NVIDIA Studio上升级迅猛,都让RTX 4070 SUPER充满了很多可玩性。
而作为RTX 4070 SUPER性价比的升级进阶,iGame GeForce RTX 4070 SUPER Ultra W OC 12GB是不是也能延续性价比、游戏、AI创作体验时的畅快?现在就让我们奉上首发评测。
48MB L2的AD104
AD104 GPU迄今为止已经推出了许多产品,包括GeForce RTX 4070,GeForce RTX 4070 Ti,移动端的GeForce RTX 4080,以及专业领域的RTX 4000 Ada Generation,RTX 4500 Ada Generation。
AD104作为中高端产品线的选择很有竞争力,例如完全体的AD104包含5个GPC,每个GPC包含6组TPC,每组TPC包含2个流式多处理器(Streaming Multiprocessors,SM),每个SM包含128KB的L1缓存,L2缓存最多达48MB,CUDA Core数量7680个,同时包含240个第四代Tensor Core,60个第三代RT Core,80个ROP等。
iGame GeForce RTX 4070 SUPER Ultra使用的GPU型号为AD104-350-A1,在配置上已经非常接近完全体,不但继承了所有AD102、AD103上的功能特性,包括对DirectX 12 Ultimate很好的支持,芯片面积达到294mm2,晶体管数量358亿个,采用台积电4N NVIDIA定制工艺。
这意味着iGame GeForce RTX 4070 SUPER Ultra与GeForce RTX 4070 Ti相当接近,仅在GeForce RTX 4070 Ti的基础上减少2个TPC,即4个SM,最终拥有56组SM,7168个CUDA Core,224个第四代Tensor Core,56个第三代RT Core,224个纹理单元,80个ROP,并搭配192-bit 12GB GDDR6X。特别是12GB GDDR6X显存,在后续的生成式AI加速中,起到了相当关键的作用。
同时iGame GeForce RTX 4070 SUPER Ultra的L1缓存容量达到了7,168KB,L2缓存则没有任何减少,达到49,152KB,也就是48MB。这对于GeForce RTX 30系列的GPU而言是非常庞大的数字,就算是上一代旗舰GeForce RTX 3090的L2缓存也不过48MB,GeForce RTX 3070仅有4MB,也就是说,iGame GeForce RTX 4070 SUPER Ultra的L2缓存是GeForce RTX 3070的12倍。
iGame Ultra Family
白色主题设计已经成为iGame Ultra的一大特色,而iGame GeForce RTX 4070 SUPER Ultra延续了波普(POP)的表达方式,从包装开始就融入了大量的点阵与波普元素。这项视觉文化起源于50年代的英国,作为一种经典的流行文化风格被延续至今。在开箱文章中,我们也详细说明了这张显卡的漫画特效,虹镀面板将展现非同寻常的视觉观感,以及大块的渐变设计风格,让人眼前一亮。
只有iGame GeForce RTX 4070 SUPER Ultra是白色主题显然是不够的,随着设计不断沉淀升级,iGame Ultra Family已经升级到了全套DIY硬件产品。这一次iGame GeForce RTX 4070 SUPER Ultra测试,我们就使用了括iGame Z790D5 Ultra主板,iGame DDR5 16GB 6800*2 Ultra W内存,CN700 2TB PRO SSD,iGame C23A Ultra W机箱,iGame P850G Ultra W电源,iGame LQ360 Ultra W水冷,iGame F12025 Ultra W风扇。CPU则使用了英特尔酷睿i9-14900K。
具体配置如下:
其中iGame Z790D5 Ultra主板同样也使用了定制白色主题设计,大块的渐变风格与iGame GeForce RTX 4070 SUPER Ultra在主题上做了很好的配合。主板本身使用了18+1+1相供电设计,定制寒霜散热装甲,搭配全覆盖式冷凝片强化散热,能够很好的发挥酷睿i9-14900K的性能。
iGame Z790D5 Ultra还提供了4个PCIe 4.0 x4 M.2 SSD接口,前后都提供了2个USB 3.2 Gen 2x2 20Gbps Type-C,并且支持Wi-Fi 6E、2.5G有线网口,蓝牙5.3。同时主板安装布局合理,右侧的USB与SATA扩展接口使用了向外设计,安装时更容易走线。
搭配酷睿i9-14900K CPU的是一套iGame DDR5 16GB 6800*2 Ultra W内存,除了开启XMP达到6800MHz之外,顶部的导光条也同样使用了波普反射RGB灯效设计,产生出发散式的幻色光,并且支持iGame Center调整,实际呈现效果很出色。同时,在内存不发光的情况下,Ultra家族丝印仍然能够根据光线实现颜色变化。
SSD则使用了CN700 2TB PRO SSD作为系统盘,其读取速度最高可达7400MB/s,写入速度6600MB/s。
CPU散热部分则使用了iGame LQ360 Ultra W一体水冷,利用iGame Ultra主题设计搭配冷头“深渊镜”ARGB灯效凸显iGame Logo,效果拉满。水冷本身拥有9极高速马达,提供3000R动力,并在设计上非常考究。
特别是一体式调整的CPU背夹板设计,能够根据不同平台直观且轻松调整,并配备了粘贴固定在主板后方的设计,对于笔者而言,这些贴心设计在安装过程中节省了不少时间。
机箱前后部分的则总共使用了4个iGame F12025 Ultra W风扇。除了拥有iGame Ultra设计风格,风扇本身支持PWM温控,专属范围达到宽至500-2000RPM,可在低噪音与高效能模式之间适时切换。同时风扇背面提供减震垫,并配备螺杆与螺帽,有效避免安装的时候损伤机箱外壳。
电源部分使用了iGame P850G Ultra W电源,这是一套ATX 3.0标准电源,单个16Pin端口瞬时峰值输出可达3倍(1800W),支持PCIe5.0 12VHPWR原生接口并配有对应的线材,从而给iGame GeForce RTX 4070 SUPER Ultra供电不再需要转接线。
iGame P850G Ultra W本身也通过了80PLUS金牌认证,在用料上使用了全日系固态/电解电容,13.5cm FDB轴承风扇,提供i-Stop风扇智能启停功能,在波普艺术设计加持下,也更容易于其他iGame Ultra融为一体。
最后所有配件都安装进了iGame C23A Ultra W机箱内。在装机过程中,iGame C23A Ultra W给人留下很好的印象,例如前置3风扇位标配有配件长螺杆从正面安装,尾部如使用同系列风扇则风扇包装内也配有螺杆+螺帽设计。置顶的水冷风扇有独立的托盘,更换的时候不需要拆卸机箱,只需要将托盘拿下。
可以看到,iGame C23A Ultra W在诸多细节都展现出了iGame Ultra形象,包括.顶盖、电源仓侧边、理线仓配置系列主题丝印,电源仓上部、内置灯板配置大面积系列主题点阵开孔,两侧强化玻璃采用免螺丝与超白玻设计,并在四边框加印主题带条等等。再加上白色机箱主题本身颜值特别高,即使不配合iGame Ultra全家桶效果也非常出众。
机身背后提供了足够的理线孔,配合装饰板,能够轻松隐藏各式各样的走线。同时iGame C23A Ultra W前置面板深渊镜也支持RGB同步,以及背走线仓预置有1转5 ARGB&PWM HUB,方便RGB风扇、灯条同步光效。
至此,iGame Ultra全家桶集合完毕,接下来就是探讨性能的时候了。
SUPER遇上Ultra的火力全开
GeForce RTX 4070 SUPER无疑是当前最具有性价比的GPU之一,iGame GeForce RTX 4070 SUPER Ultra则让性价比更近了一步。iGame著名的一键超频设计在iGame GeForce RTX 4070 SUPER Ultra继续发扬光大,在不做任何驱动和软件设置的情况下,按下接口面板上的物理按键,就能将GPU频率从公版最高的2475MHz,提升至2565MHz,进一步发挥GeForce RTX 4070 SUPER的性能。
因此iGame GeForce RTX 4070 SUPER Ultra在散热上也做足了功课,包括使用更大面积的散热鳍片,以及4x6mm热管来提升导热效率,并通过“回流焊”工艺使热管与鳍片紧密接触。并且这次背面装甲没有使用裸露电容的设计,而是使用了一整块完整的散热装机,后半部分镂空加速散热片导流的作用。
显卡风扇则使用了三环形90mm扇叶设计,并加固叶片环环相连确保耐久性,同时风扇转轴则使用双滚珠轴承设计,以获得更长的使用寿命。
得益于很好的效能控制,iGame GeForce RTX 4070 SUPER Ultra能耗表现也非常出众,在默认模式下TDP与公版相当,均为220W。而在一键超频状态下,TDP调教会变高一些,达到245W。
从整体而言,超频多出的15W需要对发挥很好的供电系统设计进行过多调整,iGame GeForce RTX 4070 SUPER Ultra供电接口16pin(12VHPWR)接口设计,随机包装配送了2x8pin转接线。对于本次装机的iGame P850G Ultra W电源而言,已经专门针对GPU留下了支持600W的12VHPWR接口和专用电源线,重点是,电源线也是白色的,iGame细节设计很到位。
如果测试实际的游戏功耗,会发现在大多数情况下,2K分辨率最高画质基本上不会让iGame GeForce RTX 4070 SUPER Ultra功耗表现超过200W,这里我们对5款游戏功耗进行了测试,参考如下。
同样,在压力测试下,iGame GeForce RTX 4070 SUPER Ultra的散热模组应付起来绰绰有余,GPU最高温度仅为58℃左右,红外线测温来看,显卡表面温度最高的地方在显卡顶部PCB外露的地方,不到50℃。
因此在基础测试环节,iGame GeForce RTX 4070 SUPER Ultra表现亮眼。这里选用了检测DirectX 11和DirectX 12性能的3DMark Time Spy,3DMark Time Spy Extreme,3DMark Fire Strike Extreme,3DMark Fire Strike Ultra,Port Royal作为参考。
iGame GeForce RTX 4070 SUPER Ultra进一步拉进了与GeForce RTX 4070 Ti的距离,差距在5%左右。同时iGame GeForce RTX 4070 SUPER Ultra能比GeForce RTX 4070快20%以上,比GeForce RTX 3070 Ti快40%,甚至在部分场景中超过RTX 3090,要知道iGame GeForce RTX 4070 SUPER Ultra的TDP也不过245W,RTX 3090则要350W。
若果用支持DLSS 2的游戏对比,在2K分辨率最高画质下,可以看到iGame GeForce RTX 4070 SUPER Ultra相对RTX 3090提升16%到45%,相对RTX 3070提升50%到100%,相对RTX 2070提升130%到232%以上。
而如果用近期发布的游戏进行对比,iGame GeForce RTX 4070 SUPER Ultra相对前一代GPU的差距还能进一步提升,原因是DLSS 3和DLSS 3.5游戏已经大面积实装,AI加速游戏流畅性与画质成为未来的必然。
DLSS技术近年来提升幅度巨大,得益于第四代Tensor Core性能提升幅度巨大,包括的FP16、BF16、TF32、INT8、INT4性能相对前一代提升两倍以上,并支持商业Hopper GPU架构中出现的FP8 Transformer Engine。并且辅以光流加速器(Optical Flow Acceleration,OFA)与DLSS相结合的办法,构建出了一个更为立体的分析方式,让GPU实际执行过程压缩到原本的 1/8,更多的工作由DLSS 3及以后的版本完成。
特别是DLSS 3.5更近一步,它是一套基于AI,让画质和帧率同时提升的解决方案,同时包含DLSS帧生成(FG)与光线重建(RR, Ray Reconstruction)技术搭配,再加上超分辨率(Super Resolution)、DLAA、帧生成(Frame Generation)多种技术融合,让游戏效率表现更为突出。
在理论测试中,通过3DMark DLSS 3功能测试可以看出iGame GeForce RTX 4070 SUPER Ultra的DLSS表现要比GeForce RTX 3070 Ti高出110%以上,也比GeForce RTX 4070高出了15%。
DLSS带来的游戏画质和帧率提升是双重的,例如在《赛博朋克2077:往日之影》中,早期车灯照射不准确的效果被修正,原因是之前人工调整降噪器的采样不准确,现在交予DLSS 3.5的AI不仅节省了调整的成本,效果也非常出色。特别在广告牌、霓虹灯反射的积水路面上,有了更准确的表达。
另外在《心灵杀手2》也能够明显感受到DLSS光线重建带来质的变换。以第二章节开始的咖啡厅橱窗为例,如果关闭DLSS 3.5,就会在玻璃上看到明显的噪点,窗户内人物衣服的二次反射,也不会投影到橱窗中,缺少了真实玻璃通透的质感。
更为普遍的DLSS 3游戏亦是如此,我们用即将上市的多人武侠开放世界RPG游戏《燕云十六声》作为参考,为了保证游戏流畅性,《燕云十六声》会根据GPU性能锁定画质等级,iGame GeForce RTX 4070 SUPER Ultra最高可以开启超高档位,在4K分辨率下,我们能够清楚的看到DLSS 3与原画质对比差距不大,甚至柔光下的光影细节处理更为自然。
与此同时,开启DLSS 3后游戏帧率获得了进一步提升,在原画质4K分辨率下,iGame GeForce RTX 4070 SUPER Ultra可以达到60FPS的程度,而一旦开启DLSS,帧率还能提升170%以上,同时也优于GeForce RTX 4070 15%以上的性能表现。
DLSS 3另一个好处就是Reflex的加入让游戏响应延迟的进一步降低,在同一场景下,可以看到iGame GeForce RTX 4070 SUPER Ultra不仅让游戏获得了更高的游戏帧率,延迟也更低,也进而提升了游戏击打的准确度,对于《燕云十六声》这款武侠动作游戏而言,无疑显得更为重要。
此外笔者还测试了《无畏契约》《堡垒之夜》和《APEX英雄》的系统响应延迟测试iGame GeForce RTX 4070 SUPER Ultra与DLSS 3.5双重加持下,甚至可以让游戏的延迟部分接近10ms左右。
最后,我们也测试更多DLSS 3游戏,在2K分辨率下,iGame GeForce RTX 4070 SUPER Ultra有强劲的表现,对比当年卡皇RTX 3090也非常轻松。,iGame GeForce RTX 4070 SUPER Ultra相对RTX 3090提升最高可以达到127%,相对RTX 3070最高可以达到250%以上,相对RTX 2070则可以有4倍以上的提升,可见,iGame GeForce RTX 4070 SUPER Ultra的AI加速性能很猛。
拉满创作体验
在测试AI创作之前,让我们先聊一下日常接触更多的专业应用。其中SPECviewperf是可测量在OpenGL和Direct X API下运行的系统的3D图形性能,专业软件包括3dsmax、Catia、Creo、Energy、Maya、Medical、SNX、Solidworks,凭借着几乎完整的AD104核心,iGame GeForce RTX 4070 SUPER Ultra可以做到相对RTX 4070有12%到20%的性能提升,相对RTX 3070 Ti提升达40%以上。
在V-Ray 5 Benchmark中,会分别对CUDA Core和RTX进行检测,借助更多的CUDA Core数量,iGame GeForce RTX 4070 SUPER Ultra对比RTX 4070也有非常明显的优势,提升达到25%以上,相对RTX 3070 Ti提升更是达到65%以上。
Blender Benchmark主要检测了Moster、Junkshop、Classroom三个输出场景,这里也可以看到iGame GeForce RTX 4070 SUPER Ultra提升达到5%左右,相对RTX 3070 Ti提升达到60%以上。
Octane Render RTX则是用来测试GPU的光线追踪性能表现,在复杂场景下考验GPU每秒产生的样本率,iGame GeForce RTX 4070 SUPER Ultra相对GeForce RTX 4070提升5%,相对GeForce RTX 3070 Ti提升50%以上。
除此之外,DLSS 3.5也已经实装D5渲染器,利用iGame GeForce RTX 4070 SUPER Ultra的AI加速可以让渲染创作的流畅度和画质进一步提升。原因是在D5渲染器中,DLSS 3.5使用了比DLSS 3多5倍的数据训练,因此也可以更好的识别光线追踪效果,在时间、空间数据中做出更合理的判断,从而实现高效率的扩展。
在D5渲染器中开启DLSS 3.5的方法很简单,只需要在菜单中找到DLSS 3.5选项,勾选所有的子选项。在画质对比上,搭配光线重建的DLSS 3.5带来的效果非常明显,例如反光质感金属装饰杆噪点被处理得很通透。再例如窗户的透明与折射过度变得更为自然。
与此同时,D5渲染器的实时帧率在DLSS 3.5加持下得到明显提升,这里用iGame GeForce RTX 4070 SUPER Ultra与RTX 3070进行对比,由于RTX 3070不支持帧生成,D5渲染器的场景帧率只有12FPS,但在iGame GeForce RTX 4070 SUPER Ultra中,开启DLSS 3.5后帧率提升至将近40FPS,性能提升轻松超过200%。
生成式AI更酸爽了
时下流行的生成式AI创作同样是iGame GeForce RTX 4070 SUPER Ultra擅长的工作之一,即便是在离线的状态下,依靠GPU的AI加速已经能很好的实现生成式AI创作,Stable Diffusion生成式图像就是很好的例子。在过去的一段时间中,Stable Diffusion迭代非常迅速,特别是Stable Diffusion SDXL发布,让图像生成质量大幅提升,当然所需要的计算量也更多,因为SDXL模型比1.5版本模型扩大了3倍。
图像质量的提升代价是需要更长时间的出图,自然就敦促更多针对硬件加速优化的诞生。NVIDIA针对Stable Diffusion Web UI 的TensorRT 加速插件就是其中之一,它可以让GeForce RTX在AI性能提升2倍率,并大幅提升Stable Diffusion出图效率。重点是对于消费者而言,这些都是免费的,只要记得将软件更新即可。
在配置完Stable Diffusion Web UI + TensorRT之后,这次我们用更短的语言描述生成10张分辨率为1024x1024的星际航行图片,每次运算1张图片,即总共执行10次,采样步数设置为50。
文字描述部分参考如下:
epic space battle over a water planet, many ships, cinematic lighting, Depth of Field, hyper-detailed, beautifully color-coded, 8k, many details, chiaroscuro lighting
可以看到,在不到2分钟的时间内,iGame GeForce RTX 4070 SUPER Ultra 完成了10张质量非常高的图片创作,12GB GDDR6X被完全使用,精细度高下立判。
Stable Diffusion SDXL + TensorRT
Stable Diffusion 1.5
这里我们通过记录时间,推算出每分钟推算图片效率,参考公式为60 / (TotalTime / (BatchSize * BatchCount)) = Images Per Minute。通过对比可以看出,在768x768分辨率下,iGame GeForce RTX 4070 SUPER Ultra表现出的战斗力已经很接近RTX 4070 Ti的水平了。
另外一个AI测试我们使用了ON1 Resize AI 2022,这是一款利用AI对图片分辨率进行提升的应用,在五个场景中进行比较,并记录平均时间,时间越少说明AI性能越强。可以看出iGame GeForce RTX 4070 SUPER Ultra可以相对GeForce RTX 4070节省了8%的时间,相对GeForce RTX 3070 Ti则节省了50%以上的时间。
写在最后:性价比进阶时
无论颜值、游戏性能、AI创作,iGame GeForce RTX 4070 SUPER Ultra W OC 12GB都给予了很好的体验。特别是iGame Ultra全家桶的全白搭配,从点亮机身那一刻开始就很大的提升了幸福感。
重点是,iGame Ultra Family之间的完美配合的流畅感,从装机开始就得以体现,到位的细节设计,线材的长短与收纳都恰到好处,这让笔者在搭建这套PC的时候也获得了很好的体验。
而iGame GeForce RTX 4070 SUPER Ultra W OC 12GB展现出的性能足以轻松应付2K光追最高画质游戏,特别是DLSS 3和DLSS 3.5加持,让帧率轻松过100FPS,并获得更低的延迟,竞技类游戏也不在话下。对于AI创作而言,12GB GDDR6X让iGame GeForce RTX 4070 SUPER Ultra W OC 12GB也有了更好的发挥,让其无限接近RTX 4070 Ti的表现。
如果近期你有装机计划,那么可以考虑围绕iGame GeForce RTX 4070 SUPER Ultra W OC 12GB搭建一套iGame Ultra全家桶,能同时收获性能、颜值和性价比,那可是相当令人高兴的。
最后,iGame GeForce RTX 4070 SUPER Ultra W OC 12GB已在七彩虹官网商城及京东、天猫、拼多多、抖音等电商平台及全国授权零售经销渠道同步开售。除了本次评测款,七彩虹还同时准备了iGame Vulcan、Neptune、Advanced及战斧、COLORFIRE MEOW等多个不同系列的GeForce RTX 4070 SUPER显卡供选购,售价4899元起。