技嘉魔鹰RTX 3080 Ti显卡评测 酣战未来游戏
曲楠
RTX 3080 Ti作为本代的旗舰游戏卡,可以满足绝大部分3A游戏4K分辨率的流畅体验,首发价格8999元,目前市场价在10000-11000之间。虽然价格过万,但是在众多型号中,算是溢价最少的,今天给大家带来的是技嘉魔鹰GeForce RTX 3080 Ti GAMING OC的评测。
技嘉旗下有众多显卡系列,大雕、超级雕、雪鹰、魔鹰、猎鹰,水冷系列还有水雕。而魔鹰在众多系列中属于面向大多数游戏玩家的电竞主流产品,电商售卖的大部分显卡也以魔鹰为主。
关于RTX 3080 Ti想必笔者不用多说,大家早已了解其定位和性能,就是本代的旗舰级游戏显卡。在评测开始前,笔者先还是先将这款显卡的特点列出方便大家阅读:
1.8+8pin供电设计,方便升级换代
2.双HDMI 2.1接口,扩展性能更强
3.旗舰级的游戏性能
总的来说,作为本代的旗舰级游戏显卡,技嘉魔鹰GeForce RTX 3080 Ti GAMING OC在游戏方面的表现令人满意,而强劲的性能让它在1080P分辨率下已经形成了桎梏,2K或4K才是它的主战场,而未来至少在三五年之内依然能够“征战”3A大作。
技嘉魔鹰GeForce RTX 3080 Ti GAMING OC
此外RTX 3080 Ti对于内容创作者来说也是极大的福音,虽然RTX 3090被冠以创作学习显卡,但在全新的NVIDIA Ampere架构下,加上NVIDIA Studio的软件加成,如果你不是要求极致地渲染8K素材,RTX 3080 Ti 12GB的大显存在专业软件使用也是完全没有问题的。
01旗舰核心GA102-225-A1
下面我们先来看看在架构上有哪些改动,官方白皮书上对比的对象为GeForce RTX 2080 Ti,相较于上一代的NVIDIA Turing架构,NVIDIA Ampere架构下的GeForce RTX 3080 Ti每个时钟执行2次着色器运算,而Turing为1次,GeForce RTX 3080 Ti的着色器性能达到34 TFLOPS单精度性能,而Turing为14 TFLOPS。
第一代NVIDIA RTX架构 Turing下的RTX 2080 Ti
第二代NVIDIA RTX架构 Ampere下的RTX 3080 Ti
NVIDIAAmpere架构翻倍了光线与三角形的相交吞吐量,RT Core达到67 RTTFLOPS,而Turing为43 RT TFLOPS。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。
第三代Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达273 TensorTFLOPS,而Turing为114 TensorTFLOPS。
GeForce RTX 3080 Ti仍然采用了GA102核心,与GeForce RTX 3080/3090相同,下面我们来看一看GeForce RTX 3080 Ti在GA102中做了哪些改动。
完整的GA102核心
完整的GA102 GPU包含7个GPC(图形处理集群)42个TPC(纹理处理集群)以及84个SM(流处理器)组成,而GeForce RTX 3080 Ti的CUDA数量是10240个,所以可以推断GeForce RTX 3080 Ti屏蔽了两组TPC,所以只有80个SM单元,而完整GA102核心的CUDA数量应该是10752个。
为了查询方便,笔者将这几款显卡的核心参数列出,可以看到GeForce RTX 3080 Ti与GeForce RTX 3090的核心参数非常接近。相差的两个SM单元,也就是1组TPC,256个CUDA,其实在实际应用中来讲差距并不是很大,最大差别是GeForce RTX 3090相比GeForce RTX 3080 Ti多了12GB的显存;而相比RTX 3080来说提升就非常大了。
02技嘉魔鹰GeForce RTX 3080 Ti GAMING OC
首先来看这款显卡的外观,技嘉魔鹰GeForce RTX 3080 Ti GAMING OC显卡采用银黑配色,整体采用几何线条分割,并且相对于大部分方方正正的显卡来说,魔鹰有些异型设计,左上方有一处缺角,设计感更强。
技嘉魔鹰GeForce RTX 3080 Ti GAMING OC
技嘉魔鹰GeForce RTX 3080 Ti GAMING OC显卡的整体尺寸为320×129×55mm,作为旗舰级游戏卡,卡身整体也显得更厚重。
技嘉魔鹰GeForce RTX 3080 Ti GAMING OC
技嘉魔鹰GeForce RTX 3080 Ti GAMING OC采用了三个刀刃式风扇设计,透过扇叶边缘的三角立体造型以及扇叶叶面的导流沟槽,可在同转速下带来更多进风量。搭配正逆转功能,可大幅提高散热能力。
背板展示
显卡背面的设计非常简洁,背部采用枪灰色的金属喷涂,表面还有些许磨砂质感,具有十分不错观赏性。金属强化背板不仅强化整体结构,防止电路板变形或零件撞落,提供显卡多一层保护。边缘处做了大面积镂空的处理,能够看到显卡的鳍片。
8+8pin供电
虽然作为本代的旗舰级游戏显卡,不过技嘉魔鹰GeForce RTX 3080 Ti GAMING OC的供电接口依然采用了8+8pin,方便老用户直接升级,但需要注意的是,显卡功耗为350W,推荐电源750W及以上。
DP1.4a*2+HDMI 2.1*2 四接口设计
视频输出接口采用DP1.4a*2+HDMI 2.1*2的四接口设计,双HDMI 2.1接口在大部分显卡中都不常见,由于新的HDMI 2.1协议,最高已可支持单线8K的视频输出,所以对于超高分辨率提供了更好的扩展性。
033DMARK理论性能测试
首先介绍一下测试平台,为了保证此次评测能够发挥技嘉魔鹰GeForce RTX 3080 Ti GAMING OC显卡的最佳性能,主板和CPU采用了11代桌面旗舰级配置,具体如下:
在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。
CPU-Z参数
首先看一下GPU-Z的参数,技嘉魔鹰GeForce RTX 3080 Ti GAMING OC采用GA102核心,三星8nm工艺,芯片面积628平方毫米,拥有10240个CUDA,这款显卡的Boost频率为1710MHz,而公版为1665MHz,有小幅提升。采用12GB GDDR6X显存,位宽为384bit,显存带宽达到了912.4 GB/s,光栅单元和纹理单元为112和320。
下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:
3D MARK FS套装测试
在针对显卡DX11性能的3DMARK FS套装测试中,我们选择了上代和本代的4张显卡进行分值对比,以便能更好的反应参测显卡的性能水平。
可以看到由于RTX 3080 Ti和RTX 3090本身的性能差不多,导致这两款显卡的跑分非常相似,对比RTX 3080的提升约为12%左右。
3D MARK TS套装测试
而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,技嘉魔鹰GeForce RTX 3080 Ti GAMING OC相比RTX 3080提升约为7%。
3D MARK 光追测试
PortRoyal是3DMARK中专门针对光追性能的测试项,在这组测试中技嘉魔鹰GeForce RTX 3080 Ti GAMING OC的表现更接近RTX 3090,而对比RTX 3080的分数提升则非常大,约为10%。
04游戏性能测试
在游戏性能测试中,我们选择了《德军总部新血脉》、《刺客信条:英灵殿》、《无主之地》,国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件。
另外在游戏测试中,由于显卡驱动的版本更新和游戏更新非常影响游戏帧数,所有benchmark跑分成绩均以本次成绩为准。
《刺客信条:英灵殿》游戏测试
在《刺客信条:英灵殿》中,可能由于近期经过版本调整,帧数均有叫大幅度提升,相较上一版本大致提升了10帧。技嘉魔鹰GeForce RTX 3080 Ti GAMING OC的帧数非常接近RTX 3090,基本与理论测试成绩相符。
《无主之地3》游戏测试
《无主之地3》是一款采用了卡通渲染风格的游戏,它对于性能要求的下限很低而上限又很高,并且这款游戏的跑分也很符合三款显卡的性能规律,但是在高分辨率下可以看到RTX 3090的优势更明显。
《光明记忆:无限》游戏测试
《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,正式版已经在steam发售只要48元,属于小品级游戏中的大制作。
另外我们在测试的时候由于无法关闭光追选项,故所有测试成绩均为“RTX 最高/DLSS 质量”模式下进行。这个演示demo涵盖了大量光追元素,大部分显卡的跑分成绩都偏低,即使是技嘉魔鹰GeForce RTX 3080 Ti GAMING OC在4K成绩下也只有39帧。
《边境》游戏测试
在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。
05功耗及温度测试
功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。
功耗测试(点击查看大图)
技嘉魔鹰GeForce RTX 3080 Ti GAMING OC经过我们的实测在满载状态下单卡功耗为350W左右,建议搭配750W及以上电源。
温度测试
温度方面,本次的技嘉魔鹰GeForce RTX 3080 Ti GAMING OC经过50分钟左右的拷机,温度稳定为65℃左右,最高达到66℃,散热效果不错;显存温度76℃左右,非常优秀。但从GPU-Z的图中,也能看到风扇已经达到较高转速。
06酣战未来游戏
从产品外观来讲,技嘉魔鹰GeForce RTX 3080 Ti GAMING OC算不得多出众,但在黑色和银色之间巧妙地找到了平衡和设计感。
技嘉魔鹰GeForce RTX 3080 Ti GAMING OC
性能方面,技嘉魔鹰GeForce RTX 3080 Ti GAMING OC属于旗舰游戏卡,所以在低分辨率下会出现较为明显的性能瓶颈,难以发挥其实力,至少在2K及以上分辨率才对得起它的性能。
技嘉魔鹰GeForce RTX 3080 Ti GAMING OC
此外RTX 30系显卡对于内容创作者来说也是极大的福音,更强的光线追踪与AI学习能力,在专业的创作软件中有着更明显的优势。虽然RTX 3090被冠以创作学习显卡,但在全新的NVIDIA Ampere架构下,加上NVIDIA Studio的软件加成,如果你不是要求极致地渲染8K素材,RTX 3080 Ti 12GB的大显存在专业软件使用也是完全没有问题的。
当然最主要的是,在性能差不多的情况下,RTX 3080 Ti可要比RTX 3090便宜将近7000元,双十一的时候可是省出了一张RTX 3080的钱。
07附录1-光追及DLSS效果
上面我们测试了部分游戏的光追和DLSS性能表现,这些效果具体在游戏中是什表现,下边笔者选择了两款游戏给大家展示一下。
《光明记忆:无限》RTX ON(点击查看大图)
《光明记忆:无限》RTX OFF(点击查看大图)
《光明记忆:无限》温泉场景中的光追效果是最为耗费显卡性能的。不难发现,最大的变化来自水中的倒影,而这一组倒影的计算难度非常高,由于并不是平静水面,所以要首先要考虑光线在水面的变化,其次与岸边鹅卵石的光线折射效果,最后则是综合前两种效果,将光线照射在水池底部。
《赛博朋克2077》RTX ON(点击查看大图)
《赛博朋克2077》RTX OFF(点击查看大图)
在《赛博朋克2077》中,光追效果随处可见,而在游戏中也运用到了不同的光追效果,包括最常见的光追反射、阴影,还有环境光遮蔽、漫反射照明以及全局光照等比较高级的效果。
RTX ON(点击图片查看大图)
RTX OFF(点击图片查看大图)
在网游《逆水寒》中,由于光追效果正处于试验阶段,并没有如宣传片一样的水面反射。但画面整体的阴影更加真实,如头顶树木的阴影,以及水面上荷叶的效果。而且由于光追效果较少,在打开该功能后帧数并没有明显下降。
《堡垒之夜》RTX ON(点击查看大图)
《堡垒之夜》RTX OFF(点击查看大图)
堡垒之夜的光追效果还是比较明显的,其中加入了反射、全局照明和路径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在打开光追后更为写实,另外仔细看的话远处建筑物的玻璃同样有光线的反射,整体画质改善非常明显。
《魔兽世界9.0》RTX ON(点击查看大图)
《魔兽世界9.0》RTX OFF(点击查看大图)
《魔兽世界9.0》同样作为一款卡通渲染的网游来说,魔兽的年代更加久远,此次加入光追效果在整体视觉上没有堡垒之夜明显。不过如远处的树木阴影,以及近处石台下方的阴影都比较明显。
《控制》RTX ON(点击查看大图)
(击查看大图)
《控制》这款游戏所采用的引擎物理效果非常出色,同时光追开关的对比也是肉眼可见的明显。包括玻璃上的人物反光,远处地面的植物反光都比较清晰,同时打开光追后屋顶处的明暗对比也更加明显。
DLSS的对比测试中,首先还是《光明记忆:无限》在这一组对比中,在画面差距上,从DLSS关到DLSS性能依旧看不出什么变化,但是在超级性能模式中,墙壁的清晰度以及轮廓都有所下降。
当然总的来说,尽管DLSS贡献了非常大的功劳,但可以看得出《光明记忆:无限》在优化方面下了很大功夫,这对于靠一人主导的游戏来说难能可贵。
《赛博朋克2077》DLSS模式对比
《赛博朋克2077》这款游戏中,以2K/RTX ON/DLSS关闭 原生画质下作为标准,在打开DLSS质量模式后可以看到整体画面几乎没有任何变化,广告牌的字样边缘依然很清晰。在DLSS平衡和DLSS性能模式中依然有着不错的状态,整体相较原生画质并无二致。
《逆水寒》DLSS模式对比
画质说明
在《逆水寒》的DLSS测试中,我们将画面设置为4K分辨率,画质为预设最高。通过关闭、快速、超级性能,3种不同模式来进行帧数以及画面的对比。
首先在关闭DLSS中,游戏帧数为26帧原生画质,打开DLSS快速模式后为41帧,而打开DLSS超级性能模式后为57帧。通过放大图片不难发现原生画质和DLSS快速模式的区别很小,而DLSS超级性能模式中角色背后的装饰会变模糊,以及木条箱的纹理边界会有较明显变化。但帧数提升却非常明显。
《永劫无间》DLSS模式对比
在《永劫无间》的DLSS对比中,原生画质大家可以注意角色发带的编制质感,每一根发丝边缘都较为清晰,同时肩部的服装花纹也有较为明显的凹凸感。在DLSS打开后,由于其工作原理就是缩放后,再由AI算法放大进行边缘重建,所以在质量模式中,发丝就会丢失部分细节,但如果不细看很难发现,同时发带的细节也保留的相当完好。
而在DLSS性能模式中,头发的质感则更差一些,并且发带的编织感有明显下降,另外腰间的配置边缘也会变模糊。最后在DLSS超级性能模式中,角色整体则会较糊,无论是头发还是服饰,所以如果不是非常追求高帧数的玩家,不建议开启DLSS超级性能模式。
08附录2-Ampere新特性
好的硬件没有软件的加持,相当于空有长柄没有枪头,想要发挥十成威力则必须软硬搭配,反之亦然。此次随着发布会共同推出的还有以下几项非常值得大家关注。
NVIDIA Reflex
以往我们关注延迟大多从显示器上了解到几毫秒极速响应,但那只是作为最终端的显示输出效果,你是否想过从系统内部到实际看到的画面有多大延迟?
NVIDIA Reflex
在20系显卡中NVIDIA反复提及的“帧能赢”,在30系显卡中也做了更进一步的突破,除了NVIDIA将推出自己的电竞显示器NVIDIA 360Hz G-SYNC ESPORTS,还有NVIDIA Reflex技术。
以往如果想测量系统延迟需要高速相机以及定制的LED鼠标电路。而使用带有NVIDIA Reflex技术的显示器将内置精确的延迟分析工具,可在CPU和GPU中优化渲染管道,极大减少延迟时间,将系统延迟整体降低至30ms以下。不过就像图中所示,为此你需要一个支持反射延迟分析的鼠标。
NVIDIA Broadcast
NVIDIA Broadcast是一款易用且专业的直播软件,它的强大之处就在于主播不再需要任何的背景布置,只需要一个普通的摄像头和一张GeForce RTX系列的显卡即可。
宠物派对直播
这款软件可以让你杂乱无章的房间立即变成直播间,其内置了音频降噪、背景虚化、虚拟背景、头部追踪等功能。NVIDIA Broadcast的工作原理是利用AI算法通过DGX超级计算机深度学习而来。
NVENC编码
同时RTX 30系显卡拥有目前最好的硬件解码器,大部分用户的电脑在直播时打开OBS推流后CPU占用会直接飙升到50%左右,而基于GPU的NVENC解码可以极大地减轻CPU负担。
NVIDIA Studio
对于内容创作者来说,提到软件可能大部分只会想到内容创作的相关软件,但NVIDIA专为内容创作者推出的NVIDIA Studio驱动则是承担着连接创作软件和显卡功能的关键。
NVIDIA Studio
NVIDIA Studio驱动经过更新与优化,对于最新版本的Adobe系列软件支持更为稳定,同时附带更出彩的创作功能。利用NVIDIA CUDA技术,GPU加速特效可实现更快的实时视频编辑并加速渲染输出,并让原本只能进行软件编码输出的视频轻松得到硬件的支持。另外在AI计算方面的优势,包括自动标记片段、特效追踪和人脸识别等功能,都有显著的速度提升。
以GPU渲染为14.98秒 而CPU渲染为11分钟
当然NVIDIA Studio的加速创作绝不止Adobe一家,DaVinci、Keyshot、Blender、D5等专业软件中都有非常亮眼的表现。不仅能提供强大且稳定的运行环境,更能以GPU加速,有效提升创作效率。
总结:本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注脚本之家的更多内容!