耕升 RTX 4070怎么样? 耕升 RTX 4070踏雪显卡评测
脚本之家
最近,一大波 RTX 4070 显卡陆续发布,这次 RTX4070 系列主打的依旧是 2K 分辨率游戏,并打出了 2K 游戏帧数 100 + 的口号,而且 Ada 架构带来的能耗比红利也值得期待一波。我们已经首发拿到了这块耕升 RTX 4070 踏雪显卡,接下来就带大家看看它的表现究竟如何吧。
本次测试中,我们将为耕升 RTX 4070 踏雪搭配以下硬件用作测试平台,确保测试时不会出现性能瓶颈。
外观设计
耕升 RTX 4070 踏雪评测采用 40 系比较少见的双槽设计,整卡厚度只有 40mm,长度仅 315mm,纤薄的厚度和体积,可以大大增加对机箱的兼容性,也能给其他硬件腾出更多空间。
在配色的选择上,之前的耕升 RTX4070Ti 星极系列就采用了白色涂装,但是这次的踏雪系列名字更有意境,涂装也更加小清新。纯白的散热装甲覆盖了显卡正面,而风扇的颜色则更加偏向于冷白。
耕升 RTX4070 踏雪还在三枚风扇的转座部分印上了“雪花标”,并用银色拉丝纹理进行点缀,既有雪的氛围感,又有银色的反光质感,不得不说耕升 RTX 4070 踏雪的颜值放在白色显卡中也是不低的。
耕升这次采用了第三代「风雪」散热器设计,三枚 92mm 经过特殊优化的「炫风之刃」风扇,能够有效提升风流量,同时降低声噪。
而在显卡内部,耕升也配备了大面积散热鳍片格栅,4 根 6mm 复合式热导管,热导管还加入了镀镍设计增强抗氧化能力。
装甲侧面部分还有支持 RGB 灯效的信仰 Logo,同样也支持与各大主流主板品牌的灯光同步。背面挡板部分同样印有耕升大字母 Logo,保持白色涂装,镂空部分采用不规则斜切设计。
接口上,耕升 RTX4070 踏雪配备了最为主流的 3 个 DP1.4a 接口和 1 个 HDMI2.1 接口,支持 4K / 240Hz 或 8K / 60Hz 视频输出。
核心解析
RTX 4070 的核心与 RTX4070Ti 一样是基于 AD104 核心所打造的,里面有 4 组满血的 GPC,内部共有 5888 个 CUDA 核心、184个 Tensor 核心、46 个第三代 RT 核心和 64 个 ROP 单元,另外,NVENC 视频编码单元相比 4070Ti 少了一个,NVDEC 视频解码单元依旧保留。
RTX4070 的核心频率是 1920MHz,Boost 频率 2495MHz。显存方面则是 192-bit位宽的 12GB GDDR6X,显存频率高达 21000MHz。从上述定位中我们可以看出,RTX 4070 是一张定位 2K 高帧率游戏的中高端显卡。
RTX 4070 同样基于最新款的 NVIDIA Ada 架构打造,它升级到了TSMC 4N NVIDIA 定制工艺,因此实现了高达 2 倍的性能功耗比飞跃。流式多处理器的吞吐量超过上一代产品 2 倍。第三代 RT Cores 的有效光线追踪计算能力是上一代产品 2.8 倍。第四代 Tensor Cores 新增 FP8 引擎,具有高达 1.32 petaflops 的 Tensor 处理性能,超过上一代的 5 倍。SER 为光线追踪带来最高可达 3 倍的性能提升,整体游戏性能提升可高达 25%。
反映到具象的功能上,新架构带来了不少的新功能:由于 Ada 光流加速器的引入,使得 DLSS 3 能够预测场景中帧和帧之间的运动变化,实现 AI 插帧,在保持图像质量的同时提高帧率。
理论性能
接下来我们进行理论性能测试环节。首先是双烤,烤机 15 分钟后,核心温度稳定在 63℃左右,功耗稳定在 179瓦左右,这个功耗比 200 瓦满功耗上限低了一些,而且此时风扇仅工作了 59% 和 61%,所以噪音控制的也很不错,游戏时很安静。
接下来进行 3DMark 压力测试,这个测试可以检测连续跑分下显卡性能有没有发生下降,一般 97% 以上才算合格的显卡。实测耕升 RTX 4070 踏雪得分为 99.6%,性能释放极其出色。
在 3DMark TimeSpy DX12 测试中,耕升 RTX 4070 踏雪的显卡分数为 18482 分,相比 RTX 3080 12GB 的 18793 分略低一点点,作为对比 RTX 3090 为 20501 分,TimeSpy Extreme 的分数为 8746 分,总体看属于正常水平。
在 3DMark Fire Strike 三项测试中,耕升 RTX 4070 踏雪的显卡分数分别为 43931 分、21389 分和 10138 分,作为对比 GeForce RTX3080 12G 的 Fire Strike Extreme 分数为22781 分。
而在 3DMark Portal Royal 光追测试中,耕升 RTX 4070 踏雪获得了11310 分,RTX3080 12GB 的分数为 12157 分,跑分略逊于 RTX 3080 12G。不过反映到实际游戏中,差距不会太大。
游戏实测
接下来,我们就进行一下游戏实测,所有游戏我们就在 2K 分辨率最高特效下进行测试,有 DLSS 就开启平衡档 DLSS,有 DLSS3 我们则会分别测试打开关闭前后的帧数。首先《CS:GO》这款主流的 FPS 游戏,我们运行游戏中自带的 BenchMark,耕升 RTX 4070 踏雪的平均帧达到了 486 帧,足够用电竞显示器高帧畅玩。
值得一提的是,目前十大竞技射击游戏中已有八款支持 NVIDIA Reflex,包括《Apex 英雄》、 《使命召唤: 战区 2》、《命运 2》、《逃离塔科夫》、《堡垒之夜》、《守望先锋:归来》、《彩虹六号:围攻》和《无畏契约》,开启 NVIDIA Reflex 后可以帮助玩家在保证高画质和高帧率的同时,也能拥有最低的延迟表现,后面的评测中我会详细提到。
接着再来两款 3A 大作,在经典 3A 游戏《古墓丽影:暗影》中,耕升 RTX 4070 踏雪默认用 2K 分辨率最高画质运行自带基准测试,最终平均帧数为 177 分,作为对比 RTX3070Ti 可以跑到 142 帧;接着打开 DLSS2 质量档,此时帧数进一步提升至 209 帧,作为对比 RTX3070Ti 可以跑到 165 帧。
在比较吃配置的《荒野大镖客 2:救赎》中,2K 分辨率最高画质的平均帧为 104,作为对比 RTX3070Ti 可以跑到 90 帧;开启 DLSS 质量档后,也可以达到平均 121 帧的成绩,作为对比 RTX3070Ti 可以跑到 90 帧,因此 2K 下流畅运行完全没问题。
当然,以上这些帧数都是基于 DLSS2 基础上的,RTX40 系列最吸引人的还是 DLSS 3 技术。DLSS 3 是一款由 AI 驱动的性能倍增技术,由全新第四代 Tensor Core 和 GeForce RTX40 系列 GPU 的全新光流加速器驱动,是 NVIDIA 广受好评的深度学习超级采样技术的最新版本,并拥有开创性的光学多帧生成功能,将开启 NVIDIA RTX 神经网络渲染游戏和应用的新时代。
简单地说,过去的 DLSS 2 是通过渲染出一个低分辨率图像,然后 AI 放大至高分辨率,实现画质与帧数的提升。而全新的 DLSS 3 在兼容 DLSS 2 的基础上,还新增了帧生成功能,可以在两个真实帧之间插入 AI 推算出来的全新帧,实现帧数的倍增。再结合 DLSS 2 的超分辨率功能,AI 能重建至多八分之七的显示像素,与没有 DLSS 相比,游戏性能最高可提升4 倍!
就目前来说,首发支持 DLSS 3 的游戏已有 30 款,以后的新游戏势必也会第一时间支持 DLSS 3,并且总数还在按月为时间单位增加,如果算上所有支持 DLSS 的游戏和应用,那么这个数量就一下子来到了 280 余款。
支持 DLSS 3 的游戏我们同样选择了三款进行测试,首先是《赛博朋克:2077》,在2K 最高画质超级光追下运行它自带的基准测试,默认情况下只有 40 帧左右,勉强能玩。开启 DLSS 2 质量后来到 67 帧,可以流畅运行了。如果在此基础上开启 DLSS 3 帧数能上 100,能够发挥高刷屏的优势。
《巫师 3:狂猎》自从更新了次世代版,配置要求一下子就上去了,当然画面表现效果和主机上差距也非常明显,有了光追的加持,看风景的乐趣大大增加。在我们的实测中,默认情况下果然还是没法跑在 60 帧以上,在开启 DLSS 2 之后表现和赛博朋克类似,也能到 60 帧以上,而在 DLSS 3+DLSS 2 的双重 buff 下,终于来到了百帧附近。
最后是画面表现非常出色,但是性能优化更好的《瘟疫传说:安魂曲》,在 2K 最高画质下即使不开启 DLSS,都能跑到 75 帧,可以说是很舒服了。开启 DLSS 2 质量能够达到 100 帧,而同时开启 DLSS 2+ DLSS 3 能够到 150 帧左右,已经可以完全喂饱 2K / 144Hz 的高刷显示器了。
当然,圈子里也流行DLSS 3会导致延迟增加,打游戏不跟手的说法。的确,DLSS 3的本质是 AI 生成全新帧,生成帧是需要一个时间的,这个延迟的提高对于竞技游戏的影响是很大的,但目前支持 DLSS 3 的游戏都是不吃输入延迟的 RPG 游戏。并且在打开 DLSS 3 的帧生成功能时,NVIDIA Reflex 会强制打开,尽量缩短生成帧带来的渲染延迟。我们以《瘟疫传说:安魂曲》为例,开启 DLSS 3 + NVIDIA Reflex 后延迟仅增加了几毫秒,这对于游戏体验是没有影响的。但如果把 DLSS 和 NVIDIA Reflex 都关闭的话,虽然延迟下降明显,但帧数和流畅度方面的折扣也比较大。
还有朋友可能会担心开启 DLSS 后对游戏的画质会不会有很大影响,对此我们从次世代版的《巫师 3: 狂猎》中截取了两张游戏截图,分别为完全关闭 DLSS 状态和同时开启 DLSS 2+DLSS 3 的状态,然后将两张图按相同比例放大对比细节,可以看到放大后几乎看不出什么差别,画质党完全可以放心打开 DLSS。
左:原画质,右:开启 DLSS 2+DLSS 3
左:原画质,右:开启 DLSS 2+DLSS 3
前面我们提到,RTX4070 的功耗在 200 瓦以内,这是它的一大优势,那么实际游戏中的功耗表现如何?会不会超过 200 瓦呢?我们这里也统计了一下几款游戏的实际功耗表现,除了瘟疫传说正好 200 瓦外,都是低于 200 瓦的。当然,这样的表现离不开全新 ADA 架构中的 SM 多单元流处理器,它在提升 2 倍性能的同时,还能做到降低功耗,一举两得。
创意生产
得益于 12G 大显存和强大的 CUDA 核心,RTX 4070 不仅可以用来游戏,拿来进行创意生产也不在话下。耕升 RTX 4070 踏雪拥有 5888 个强大的 CUDA 核心,在应对创意生产和深度学习方面会有一定建树。同时,它也可以安装NVIDIA Studio 驱动,有超过 75 款创意应用都可以调用NVIDIA CUDA 核心的AI 算力,大大提高了工作效率。
在建模渲染类软件中,5888 个CUDA核心可以为工作提供硬件加速,目前几乎所有的建模软件都会对 NVIDIA 的 GPU 有优化,所以能做到效率、稳定和兼容性的共存。比如在常用的渲染工具 V-Ray 中,可以借助 RTX 加速的光线追踪,实现高性能最终帧渲染。借助搭载 AI 的降噪功能,GPU 可进一步加速交互式渲染。
在V-Ray Benchmark中,耕升 RTX 4070 踏雪获得了 1871 分,可以顺利应对大部分的建模渲染需求。
同样,进行光线追踪建模渲染自然也没问题,GPU RTX 项目的跑分来到了 2650 分。
在常用渲染器工具 Octane 自带的 BenchMark 中,RTX4070 的渲染能力也是很强的,各项测试中它的渲染能力差不多约等于 4 到 9 张 GTX 980 的算力,进步可以说是显而易见的了。
在视频后期这一块,耕升 RTX 4070 踏雪同样配备第八代 NVIDIA NVENC 编码器,支持 AV1 编码和双编码器。AV1 是下一代的视频编码技术,能够在占用相同空间情况下,提供更加快速的视频编码和更高质量的流媒体传输性能。
AV1 成为趋势既是科技进步的结果,也戳中了行业对于生产力需求的痛点,那就是大幅压缩视频文件的体积大小,同时保证画质几乎不受影响。
我们对此也进行了一项简单的测试,通过剪映专业版软件采用 H264 和 AV1 这两种不同的编码导出同一段视频素材。最终 H264 编码的文件大小为 159MB,而 AV1 编码的文件大小只有 127MB,体积缩小了 21%,但是画质基本看不出区别。
另外,英伟达还为 RTX30/40 系显卡引入了 RTX 视频超分辨率技术,全称为 RTX Video Super Resolution。它可以通过 GPU 的 AI 计算,至多将在线 1080P 视频提升到 4K 分辨率,实现提高清晰度的效果,原理有点像游戏中的 DLSS 技术。同时,AI 算力还可以智能锐化和强化物体、人物的特征和边缘,目前在 Edge 和 Chrome 这样等主流浏览器中播放在线视频都已经支持 VSR 技术,当然它需要占用一定的 GPU 资源用于计算,所以用该技术看视频时最好不要同时玩显卡占用极高的 3A 游戏哦。
↑ 从左至右依次为 1080P 原生画质和 VSR4 超分辨率后的视频画面对比
除了浏览器,知名的 VLC 本地播放器也在 Beta 版中提供了 RTX VSR 技术的适配。和网页一样,只要在驱动控制面板中打开就可以了。我们用一个 480P 的本地视频做演示,明显感觉右边更清晰了,后面大家欣赏本地电影时,也可以用这个技术进一步优化画质。
在最近大火的 AI 绘画(生成式 AI)中,RTX 4070 也有一战之地。例如我们运用 stable-diffusion 的 v2-1_768-ema-pruned.ckpt 模型,尝试绘制 20 张 AI 老黄的图像,RTX 4070 共计用时 2 分 18 秒。
而 RTX3070Ti 这边,则用时 2 分 57 秒,相比于 RTX4070 的出图速度差距是相当明显的。如果平时只是想简单玩玩 AI 的话,RTX4070 就足以胜任了。当然如果要复杂的研究的话,那还是上 RTX4090 或更高的 GPU 吧。
在创意工作者最常用的非线性编辑软件 Adobe Premiere Pro 中,我们开启 GPU CUDA 加速,然后使用 PugetBenchmark 进行测试。耕升 RTX 4070 踏雪得分为 1537 分,这样的成绩可以轻松应对 4K 甚至 8K 的复杂视频剪辑。
而在特效制作软件 Adobe After Effects 中,我们同样使用 PugetBenchmark 进行测试。最终得分为 1421 分,表现中规中矩。
总结
通过以上一系列的测试来看,RTX4070 是一款定位 2K 分辨率 100 + 帧游戏体验的中高端显卡,借助 NVIDIA DLSS 3 和 NVIDIA Reflax 技术,它可以驾驭绝大多数主流的 2K 分辨率 3A 游戏,并且在生产力方面的综合表现也不容小觑。另外,RTX4070 还是一张能耗比出色的显卡,满载情况下烤机运行 2K 游戏功耗都能控制在 200 瓦以内。耕升 RTX 4070 踏雪拥有 215W 的低功耗供电需求,配合耕升的风雪散热系统,确实做到了其宣传的低功耗超静音双加持。
耕升 RTX 4070 踏雪除了拥有以上这些性能和功耗方面的优势外,也是耕升旗下显卡颜值中较为出色的一款,双槽的厚度让它看上去、拿手里都没有丝毫厚重的感觉,纯白系的装甲涂装配合“雪花标”图案的风扇标志,不仅有辨识度,整体也简约耐看,非常小清晰。最重要的是在 4799 元的价位段,全白涂装的显卡选择很少,如果你想组一台白色海景房主机,对 2K 游戏有重度需求,耕升 RTX 4070 踏雪是个不错的选择。