2022年10月上旬,代表着Ada Lovelace架构顶级性能的GeForce RTX 4090 GPU登场亮相发售,宣告了RTX 40系GPU正式进入消费者的视野。不过正如我们测试之后的结论所说,虽然RTX 4090拥有远胜RTX 3090 Ti的强悍性能,而且还有DLSS 3这一神奇黑科技的护航,但万元以上的价格确实不是大众消费者能轻易接受的。时隔一月之后,同样代表了旗舰级性能,但价格却要便宜不少的次旗舰产品GeForce RTX 4080登场了。同样拥有胜过RTX 3090 Ti的性能表现,但价格却要相对亲民一些,会不会让你更加心动?
和RTX 4090一样,同出一脉的GeForce RTX 4080 GPU仍然继承了来自Ada Lovelace架构的全部特色与技术。在GeForce RTX 4090 Founders Edition首发评测时,我们已经对Ada Lovelace架构的核心特色技术与主要特点进行了非常细致的解析,在这里我们就不一一重复了。不过为了帮助大家更好地理解本测试文章,我们还是将Ada Lovelace架构的核心技术要点做了个简单总结,供大家参考。
来自Ada架构的RTX 40系GPU技术创新
RTX 40 系列 GPU 具有一系列新的技术创新,包括TSMC 4N 制造工艺,整体实现高达 2 倍的性能功耗比飞跃。
缓存暴增
Ada架构的改革在缓存部分有了较大改变。每个SM拥有128KB L1缓存,AD102总计拥有18432KB L1缓存,相比GA102的10752KB缓存增加了大约70%。在L2缓存方面,AD102目前拥有98304KB的L2缓存,相比之前GA102所拥有的6144KB大约是后者的16倍。如此巨大的缓存,将为所有GPU相关操作都带来巨大的收益,尤其是光线追踪、路径追踪等复杂的操作收益最为明显。
更强的SM
AAD102的每个SM单元包含128个CUDA内核,1个ADA第三代RT核心以及4个ADA第四代张量(Tensor)核心、4个纹理单元、256KB寄存器、128KB的L1/共享内存,和之前的产品一样,L1/共享内存也可以根据使用情况进行配置。流式多处理器具有高达 83 TFLOPS 的着色能力,吞吐量超过上一代产品 2 倍。
第三代光追核心
第三代 RT Cores 的有效光线追踪计算能力达到 191 TFLOPS,是上一代产品 2.8 倍。
第四代AI核心
新的 Tensor Cores 新增 FP8 引擎,具有高达 1.32 petaflops 的张量处理性能,超过上一代5倍。
Shader Execution Reordering着色器执行重排序
SER可以重新调度着色器的工作排序,从而避免部分着色器在等待中浪费算力和电能,以获得更好的效率和性能。SER 为光线追踪带来最高可达 3 倍的性能提升,整体游戏性能提升可高达 25%。
DLSS 3与OFA光流加速器
基于Ada光流加速器的DLSS 3最高可带来相对于DLSS 2达2 倍的性能提升,使 DLSS 3 能够预测场景中帧和帧之间的运动变化,使神经网络能够在保持图像质量的同时提高帧率。DLSS 3 技术支持 GeForce RTX 40 系列 GPU,它包括 3 个功能:光学帧生成技术、超级分辨率(DLSS 2 的关键创新)和 NVIDIA Reflex。开发者只需整合 DLSS 3,即可默认支持 DLSS 2。
双NVIDIA编码器(NVENC)
基于 Ada 架构的全新显卡配备了支持 AV1 编码的全新第八代 NVIDIA 编码器 (NVENC),可为主播、广播爱好者和视频通话用户带来更多新的尝试和体验。该技术的效率比 H.264 高 40%,这有助于主播在保持直播推流比特率不变的情况下,将画面分辨率从 1080p 提高到 1440p,且画质依然稳定。
更强的Studio性能
除了游戏性能之外,RTX 40系GPU也是用于内容创作的优秀GPU,在加速3D设计创作、视频剪辑处理和AI计算方面,都有非常不错的表现。
同时吗,专用的NVIDIA Studio Driver在顶级创意应用上经过全面测试,能够最大限度地提高可靠性,比如:
●主播可以用支持AV1的全新第八代编码器来提高现场直播质量,利用 NVIDIA Broadcast AI 特效改善麦克风和网络摄像头,并进入AI驱动的 VTubing。
●得益于RTX 40 系列的双编码器和高达2倍的AI工具性能,视频编辑的输出速度最高可提升 2倍。
●得益于第三代RT Core、SER、DLSS 3和NVIDIA Omniverse,3D 设计创作者可以在4K@60fps 下进行创作。
●Modder可以重制经典游戏,并通过RTX Remix开启RTX。
GeForce RTX 4080 Founders Edition鉴赏
复习完理论,来看今天的主角GeForce RTX 4080 Founders Edition。
从核心架构图可以看出,相对于完整的AD-102核心配置的12个GPC模块,代号为AD-103的GeForce RTX 4080 GPU只拥有7个GPC模块,而且在GPC的配置上做了一些减法。全部7个GPC模块中有4个配置了完整的12组SM模块,有两个GPC配置了10组SM,而最后一个GPC只配置了8组SM。这样算下来,完整的AD-103核心总共配置了48+20+8即76组SM单元。Ada核心的每个SM单元配置的CUDA核心为128个,因此RTX 4080 GPU具有9728个CUDA 核心, 可提供 49 TFLOPS的着色器传统光栅渲染能力。同样,这也意味着GeForce RTX 4080 GPU拥有76个第三代Tensor Cores光追核心和304个第四代Tensor Cores AI核心,能够为光追游戏或渲染工作提供113RT-TFLOPS的计算能力,同时能够为DLSS或AI计算提供高达780Tensor-TFLOPS的计算性能。在核心频率上,RTX 4080的GPU核心频率为2205MHz~2505MHz,略低于RTX 4090,但相比RTX 30系旗舰不到2GHz的频率设置,仍然是要高得多,也说明采用TSMC 4N工艺打造的Ada核心在能效比上确实比RTX 30系出色得多。
在显存的配置上,由于NVIDIA最终撤销了12GB显存版的RTX 4080 GPU计划,因此16GB GDDR6X显存的版本就成为了目前RTX 4080的唯一配置。在显存位宽上从RTX 4090的384bit降为256bit,不过频率从RTX 4090的1313MHz提升到了1400MHz,因此带宽虽然为768GB/s要低于RTX 4090,但总速率表现还是达到了22.4Gpbs,高于RTX 4090的21Gbps。
按照NVIDIA给出的官方参考数据,在现代游戏中RTX 4080的性能最高可达 GeForce RTX 3080 Ti 的2倍,而功耗则降低了近10%。具体是不是有这样的性能表现呢?后文我们将进行深度的详细测试。
说个题外话,其实可以看出,RTX 4080和RTX 4090之间在硬件规格参数上相差很大,所以我们一点也不怀疑RTX 4080 Ti这个等级的GPU是一定存在的。而且不妨大胆猜测一下,104或110组SM单元配置的20GB GDDR6X显存版RTX 4080 Ti是不是很有吸引力呢?(个人猜测,仅供参考)。
从外观上来看,RTX 4080 FE与RTX 4090 FE几乎是一模一样,而且在长宽的尺寸上也几乎保持一致。在散热结构上,RTX 4080 FE仍然是采用的双轴流通设计,加厚的散热片也充分保证了散热的性能需求。在风扇部分,和RTX 4090 FE一样,RTX 30系旗舰产品的9叶曲折扇改为了两只大面积的7叶类镰刀风扇,但是在静音效果上反而感觉更优秀。较大扇叶面积的风扇能够提供更高的风压与风量,而风扇部分此次采用的流体动力轴和反方向旋转的设计,则让RTX 4080 FE和RTX 4090 FE一样可以更安静、凉爽地运行。
▲和RTX 4090 FE一样的7叶镰刀风扇,双侧反向旋转带来更高散热效率。
▲主出风口设置在挡板处,大量的镂空设计可以充分保证散热效果。在视频输出接口部分,仍然是传统的1 HDMI+3 DP,支持HDMI 2.1和DP 1.4a。
▲RTX 40系GPU已经全面进化到600W供电的ATX 3.0电源PCIe 5 16Pin 12VHPWR接口,不过RTX 4080 FE的包装盒内也附带了一根3×8pin转16Pin的转接线,方便用户平滑升级。
▲和RTX 4090 FE一样,支撑架安装部位也采用了隐藏式磁吸设计。
▲从NVIDIA的官方PCB渲染图来看(FE公版显卡实在很难拆,而且我们担心拆解容易损坏散热结构,所以就没拆解RTX 4080 FE,用NVIDIA官方资料进行内部设计解析),RTX 4080 FE仍然采用了燕尾PCB的设计模式,18相供电。中间的AD103核心因为是官方渲染图,因此打上了NVIDIA Logo。显存部分则采用了来自美光的8颗GDDR6X颗粒,单颗容量2GB。
NVIDIA GeForce RTX 4080 Founders Edition参数规格
核心架构:Ada Lovelace
核心代号:AD103-300
制程工艺:TSMC 4N(NVIDIA定制工艺)
SM单元:76
CUDA核心数:9728
光追核心数(RT Cores):76
AI核心数(Tensor Cores):304
核心频率:2205MHz~2505MHz
显存容量:16GB GDDR6X
显存速率:22.4Gbps
显存位宽:256bit
显存带宽:716.8GB/s
支持DLSS版本:DLSS 3
TGP:320W
建议电源:700W
首发参考价:9499元
性能实测,比RTX 3090 Ti还强20%多!
步入大家最期待的实际应用测试。想必所有玩家心里都有这样一个疑问:作为首发价格达9499元的RTX 4080 FE,其实际性能表现能否匹配这样的价格定位呢?
整体的测试我们大致分为三个部分:第一部分是游戏性能的体验,包括传统光追游戏+DLSS 2的性能表现检测以及DLSS 3性能的专项测试,这是本次评测的最重要的核心部分;第二部分则是与设计创作相关的Studio性能评测,考察RTX 4080在设计创作应用方面的优势;第三部分则是功耗相关的评测,这部分我们不再用传统的单一Furmark烤机来检测RTX 4080 Founders Edition的能耗,而是分别在1440p游戏、4K游戏和8K游戏环境下考察RTX 4080的实际功耗表现,并且根据这些成绩和性能表现来简略计算RTX 4080的每瓦性能(仅供参考)。同时,我们还将RTX 4090 FE、RTX 3090 Ti FE和RTX 3080 Ti FE纳入了对比参考测试。
下面,就让我们逐步深入解析RTX 4080 Founders Edition的性能世界吧!
测试平台概览
GPU:NVIDIA RTX 4080 FE、RTX 4090 FE、RTX 3090 Ti FE、RTX 3080 Ti FE
主板:技嘉AORUS Z790 MASTER
内存:技嘉AORUS DDR5 6000 64GB
显示器:戴尔UP3218K(7680×4320@60Hz)
电源:鑫谷昆仑KL-1250G冰山版ATX 3.0(额定1250W)
操作系统:Windows 11 Pro 21H2
驱动程序:Game Ready Driver 526.72
▲截至发稿时,GPU-Z未更新,因此尚不能完全识别RTX 4080 GPU。
3DMark理论性能测试
在3DMark的理论性能测试部分,我们可以看到RTX 4080 FE与RTX 4090 FE的平均理论3D性能差距约在30%上下,PortRoyal光追性能测试部分的差距超过了40%。毕竟RTX 4080 FE与RTX 4090 FE在规格上确实相差了一大截,有这样的性能差距也算正常,而且也为可能出现的RTX 4080 Ti埋下了伏笔。
在与上一代旗舰级和次旗舰产品的比较上,RTX 4080 FE的表现还是非常抢眼的。在与RTX 3080 Ti FE的较量上,RTX 4080 FE几乎领先后者整整40%的性能,即使与RTX 3090 Ti这款前一代的顶级旗舰产品相比,所有测试项目的平均领先幅度也达到了25%左右,堪称表现不俗。
游戏性能测试,轻松驾驭4K全特效光追
在游戏测试部分,出于对RTX 4080 FE的定位思考,我们将整体测试重点放在了4K分辨率下,但考虑到少部分玩家的特殊需求,我们也在部分游戏中加入了8K分辨率的体验评测。同时,目前的实际情况是,绝大部分玩家都还在使用1440p甚至1080p显示器,因此我们也将一部分1440p游戏的体验测试加入了本次的体验之旅中,以期望得到一个相对完整的体验测试报告。在所有游戏的测试中,我们都开启了最高画质与最高光追效果设置(《刺客信条:英灵殿》设置为高画质),DLSS模式统一开启为:8K超级性能、4K/1440p为平衡(《暗影火炬城》《生死轮回》《光明记忆:无限》三款游戏DLSS设置为自动,特此说明)。
传统光追游戏+DLSS 2性能体验
在8K光追游戏测试部分,RTX 4080 FE的表现还是比较抢眼的。在DLSS开启之后,基本都能够在60fps左右或更高的帧率运行8K游戏。与RTX 3090 Ti FE相比,RTX 4080 FE的8K游戏整体性能领先约30%,与RTX 3080 Ti FE相比,8K游戏性能更是达到了接近90%的领先程度。不过与RTX 4090 FE相比,仍然还有40%~45%的性能差距。
4K分辨率下的游戏性能表现是我们的测试重点,这部分我们一共选择26款当下的热点游戏进行了详细的测试(《Unity:Enemies》这款游戏RTX 40系GPU自动开启DLSS 3,RTX 30系及更老的GPU自动开启DLSS 2。)。从整体的测试情况来看,RTX 4080 FE在性能上的表现仍然不俗,相比RTX 3080 Ti而言,整体性能平均领先都达到了50%,在部分游戏中的领先幅度高达80%以上。相比RTX 3090 Ti,RTX 4080 FE的性能平均也达到了25%左右的领先幅度。不过相比RTX 4090 FE,RTX 4080 FE在4K分辨率下性能还是落后约35%。
1440p分辨率理论上不是RTX 4080的主战场,不过考虑到很多玩家目前都还在1440p显示器上奋战,因此我们也将这部分成绩纳入了测试之中。在1440p分辨率下,随着游戏对GPU性能需求的降低,RTX 4080 FE和RTX 4090 FE、RTX 3090 Ti FE和RTX 3080 Ti FE的正负性能差距都有缩小的趋势。在这一分辨率下,RTX 4080 FE平均性能领先RTX 3080 Ti约40%,GPU负荷越高,RTX 4080 FE的优势越明显。与RTX 3090 Ti FE相比,在1440p分辨率下RTX 4080 FE的性能领先幅度缩小到了20%左右,同时相比RTX 4090的性能落后也缩小到了20%左右。
DLSS 2/3对比测试
在这部分中,我们和当初测试RTX 4090 FE时一样,对DLSS 3进行了专项的测试。我们分别对比了同一代产品(RTX 4080)在 DLSS 2和DLSS 3设置下的不同游戏性能表现,同时也对比了不同代产品在两代DLSS设置下的不同表现(RTX 30系+DLSS 2对比RTX 40系+DLSS 3),以观察在新一代DLSS技术的支持下,RTX 40系GPU相对上一代产品的有怎样的迅猛提升。
先来看3DMark的DLSS TEST测试项目。很明显,DLSS 3同比DLSS 2在性能上有50%以上的性能提升,相比Native原生帧率,更是最高提升幅度达到了400%左右。
来看同代产品间DLSS 2/3在实际游戏表现中的性能差距。我们用RTX 4080在11款支持DLSS 3的游戏中测试了两代DLSS技术的性能比较。从测试数据来看,RTX 4080在同等级设置的DLSS模式下,DLSS 3下的帧率相对DLSS 2要强40%~70%,平均领先程度约为哦45%左右。如果同比Native原生帧率,DLSS 3模式下大约能达到原生帧率的2.5~4.5倍,平均下来也达到了Native原生帧率的3倍左右。可见DLSS 3确实在帧率提升方面确实令人喜出望外。
再来看跨代GPU搭配跨代DLSS模式的性能比较。这部分测试中我们选择了RTX 3080 Ti和RTX 3090 Ti在DLSS 2设置下的帧率表现,对比RTX 4080在DLSS 3设置下的帧率表现。从测试结果来看,DLSS 3模式下的RTX 4080 FE相对于RTX 3090 Ti平均达到了1.6倍左右的性能,而相对于RTX 3080 Ti来说,RTX 4080 FE在DLSS 3模式下对比DLSS 2模式的RTX 3080 Ti更是达到了平均1.75倍左右的性能,最高甚至达到了2.2~2.5倍的性能。DLSS 3的加持下,进一步巩固了RTX 4080 FE的性能优势。
DLSS 3及PCL测试
NVIDIA在DLSS 3中囊括了NVIDIA Reflex低延迟技术,能够极大地改善游戏体验的流畅性,尤其是对FPS游戏来说更是意义重大,毕竟更低的延迟也就意味了更快速的反应操作。另外随着FrameView 1.4版本的更新,现在FrameView已经能够在支持的游戏中监测、记录游戏的PCL系统延迟时间与1%L fps低帧,这两个指标都是关系到游戏流畅与否的主要因素。因此,我们也选择了包括《瘟疫传说:安魂曲》《赛博朋克2077》《幻塔》等在内的11款支持DLSS 3的游戏进行了测试。
从测试结果来看,DLSS 3的帧率提升功能作用显露无余。不只是在帧率表现上相对于Native原生帧率有100%~400%的提升,而且在1%L fps和PCL系统延迟上也有惊艳的表现。比如在4K分辨率设置的《生死轮回》游戏中,尽管在DLSS关闭的情况下能达到60fps以上的游戏帧率,但游戏的1%L fps仅为28fps左右,说明游戏仍然会时不时产生卡顿的情况,而且PCL系统延迟在DLSS关闭时也高达85ms。在开启DLSS 3平衡模式之后,游戏帧率飙升到立刻150fps以上,达到了绝对流畅水准。同时1%L fps也提升到了127fps,说明已经不会在任何情况下影响到游戏的流畅运行。另一方面系统延迟也在开启DLSS 3之后从85ms下降到了27ms,让游戏更加丝滑顺畅。在其余几款测试游戏中,DLSS 3也有着同样的表现,请大家自行阅览分析。
在RTX 4090 FE的首发评测时,我们已经详细地对比过DLSS 3、DLSS 2和Native原生之间的画质差异。即使在4K分辨率的DLSS性能模式的设置下,无论是DLSS 2还是DLSS 3,最终呈现的游戏画面相对于原生画质几乎看不出损失,与原生画质相差不大。对比DLSS 3和DLSS 2的性能模式,也可以看出二者基本没有差别,甚至DLSS 3模式下的画质还略微清晰一些。这足以说明DLSS 3对游戏画质的影响几乎可以忽略不计,至少多绝大多数玩家来说,完全不用担心开启DLSS 3之后在游戏中看到明显的画质损失。为了让大家有更直观的认识,我们又在本次测试过程中截取了不同DLSS 3设置下的游戏画面,并与原生画质进行对比,结果仍然是没有太大差别,甚至更好。
▲4K分辨率,《赛博朋克2077》
▲1440p,《赛博朋克2077》
▲1440p,《F1 22》
我们在两款不同游戏中分别截取了同一场景下的原生(图中)、DLSS 2平衡(图左)和DLSS 3平衡(图右)的游戏画面。从三个不同场景的截图可以明显看出,在DLSS 3设置下的游戏画面相比DLSS 2和原生画质没有任何的损耗,甚至在放大到300%左右可以发现,DLSS 3模式下的画面锯齿感相比原生画质更小,相比DLSS 2都还要更清晰一些。
2022年,11月15日,DLSS 3游戏库新增如下:
《逆水寒》:已正式支持DLSS 3
《微软模拟飞行》:已推出抢先体验版,已于 11 月 11 日与《微软模拟飞行》(Microsoft Flight Simulator )Sim Update 11 和全新《微软模拟飞行》40 周年纪念版(Microsoft Flight Simulator 40th Anniversary Edition)同时发布。
《WRC Generations》:FIA WRC 官方游戏,11月16日推出,支持DLSS 3。
《极品飞车:不羁》:11月29日推出,支持DLSS 3。
《战锤40K:暗潮》:11月30日推出,支持DLSS 3和光线追踪技术。
下列两款游戏将更新支持DLSS 3:
《毁灭全人类 2:重新探测》:11 月 15 日推出,帧率最高可提升至 2 倍。
《漫威蜘蛛侠:迈尔斯・莫拉莱斯》:11月18日发布,支持DLSS 3。
因此,当今天GeForce RTX 4080正式发布时,将已有10款DLSS 3游戏发布上线,它们是《瘟疫传说:安魂曲》《光明记忆:无限》《毁灭全人类2:重新探测》《暗影火炬城》《F1 22》《逆水寒》《生死轮回》《漫威蜘蛛侠:重制版》《微软模拟飞行》和《超级人类》。
《WRC Generations》《极品飞车:不羁》和 《战锤40K:暗潮》在RTX 4080推出后不久就会发布,圣诞节前玩家就可畅玩这些DLSS 3游戏。
Studio性能测试
RTX 4080的设计创作性能如何?我们从视频剪辑、3D建模渲染以及图片处理三个方面对RTX 4080 FE进行了考察。
在Davinci Resolve Studio 18的视频剪辑转码处理测试中,相比RTX 3080 Ti,RTX 4080在各项测试中平均性能领先约30%,相比RTX 3090 Ti平均领先约20%。
在Blender模型渲染测试中,无论是Opendata benchmark还是Bledner 3.1模型渲染,RTX 4080相对于RTX 3080 Ti都有50%左右的性能提升,相对于RTX 3090 Ti,性能领先幅度也达到了35%或更高的程度。
在ON1 Resize AI 2022的图片缩放处理测试中,RTX 4080和RTX 3090 Ti的性能差距极其有限,在5%左右,但相对于RTX 3080 Ti,还是有40%的性能领先幅度。
从整体测试结果来看,虽然RTX 4080在Studio设计创作性能上相比RTX 4090仍有一定差距,但确实已经明显胜过了RTX 3090 Ti和RTX 3080 Ti,尤其是相对于RTX 3080 Ti来说,RTX 4080的设计创作性能几乎达到了后者的1.5倍甚至更高。
功耗测试
在RTX 4080 FE的功耗测试部分,我们想做点不一样的。
一直以来我们都是用Furmark全满载烤机的成绩来作为显卡功耗的基础指标,其实这样还是有一些不妥——因为它没有代表玩家使用显卡的真实情况。我们通常用TGP来表示GPU运行功耗的上限限制,对于高功耗的应用,GPU的功耗可能会达到TGP的功耗上限,而GPU Boost的时钟频率将在功耗和散热限制范围内被优化。而在GPU受到CPU瓶颈限制的情况下,或GPU正在运行轻度工作负载的情况下,GPU的功耗可能远远低于TGP。在这些情况下,GPU Boost频率仍可能达到设定的最大值,因此GPU的执行效率将达到最大化。在大多数工作条件下,包括许多游戏在内,都只能使RTX 40系列GPU的功耗大大低于TGP。那么在玩家平时进行典型应用时,RTX 4080 FE的功耗会达到多少呢?在这样的功耗条件下达到对应的性能表现,谁的能耗比更高?谁的每瓦性能表现更好呢?我们用NVIDIA PCAT功耗测试套件对典型应用状况进行了测试。
在1440p分辨率、最高画质、最高光追特效、DLSS 平衡设置的《赛博朋克2077》游戏中,RTX 4080 FE的实际游戏运行功耗约为250W左右,同比相同状态下,RTX 4090的运行功耗约为290W、RTX 3090 Ti接近400W,RTX 3080 Ti约为350W。在更低的功耗下,RTX 4080 FE实现了更高的性能,其能耗比明显超越RTX 3090 Ti和RTX 3080 Ti许多。
4K分辨率下的情况大致相当,在4K分辨率下进行《赛博朋克2077》游戏时,RTX 4080 FE的功耗大约达到了280W左右,相比1440p游戏有一定上涨。
8K分辨率下的游戏对GPU带来了较大的负荷。在这一分辨率下进行《赛博朋克2077》游戏时,RTX 4080 FE的功耗达到了290W以上,但平均功耗仍然低于300W。反观RTX 3090 Ti,此时的功耗已经达到了450W以上,即使RTX 3080 Ti的功耗也保持在380W左右。
Furmark烤机时,各款显卡基本都能达到TGP设定的上限甚至更高。
最后,我们把各个状态下的功耗表现做了一个总结,来一起看看。
如果我们把3DMark TimeSpy Extreme的测试分数,除以运这一程序时的GPU平均功耗,是不是就能得到一个每瓦分数的答案?这个可以近似地用来表示GPU在进行DX12游戏时的每瓦性能。同样,我们把3DMark PortRoyal的测试分数除以运行它时的平均功耗,是不是就能近似地得到光追游戏时的每瓦性能(非绝对正确的每瓦性能,但具有较大参考意义)?
非常直观,在代表DX12游戏性能的3DMark TimeSpy Extreme测试中,RTX 4080 FE的每瓦性能参考指数约为123.38,是RTX 3080 Ti的1.7倍,是RTX 3090 Ti的2.1倍,换句话说,近似地可以看作RTX 4080 FE在DX 12非光追游戏中的每瓦性能相对于RTX 3090 Ti达到了翻倍,而相对于RTX 3080 Ti则在每瓦游戏性能上提升了70%以上。
再来看光追环境的情况。在3DMark PortRoyal的测试中,RTX 4080 FE相对于RTX 3080 Ti的每瓦光追游戏性能提升了75%,而相对于RTX 3090 Ti更是提升达到了90%以上。很明显可以看出,得益于优秀的Ada Lovelace架构和TSMC 4N NVIDIA定制工艺的应用,RTX 40系GPU的每瓦光追游戏性能有了迅猛的增长,增长幅度也远超过了50%。
哦,最后还有GPU温度控制。在室温26℃的环境下,我们用Furmark对RTX 4080 FE进行了持续25分钟的烤机测试,最后RTX 4080 FE的核心温度稳定在了62℃上下,由此也足以说明RTX 4080 FE的散热结构设计非常优秀,这样的温度控制也着实让人惊喜。
高性能,低功耗,这才是高端游戏显卡应有的样子
说实话,最开始的时候我们是有想过首发价格9499元的RTX 4080 FE应该是能够拥有匹敌RTX 3090 Ti这种前一代顶级旗舰的降维打击能力的,不过最后测试中发现RTX 4080 FE在一般游戏中都有着超越RTX 3090 Ti 25%以上的性能表现还是多少有那么一丁点意外。所以在测试了RTX 3090 Ti对比之后,我们果断放弃了原本的上一代对位对比显卡RTX 3080,因为这就根本不是同一个层级的东西了,而且价格上也确实相差太远。所以最后选定了价格定位相对靠近的RTX 3080 Ti与旗舰顶级RTX 3090 Ti作为对比。
从整体的成绩表现来看,我觉得RTX 4080 FE的定位还是比较清晰且准确的。作为搭配了76组SM单元,9728个CUDA核心的AD103核心其定位显然是RTX 40系GPU旗舰族群中的守门员,因此其价格也达到了9499元起的地步。从性能测试的成绩来看,RTX 4080 FE的表现也是完全合格的,在各项测试中均表现出了超过RTX 3080 Ti 40%以上的性能,相对于RTX 3090 Ti的性能领先幅度也在25%左右,实现了大步伐的全面超越。特别要提的是,在DLSS 3的辅助下,RTX 4080 FE的性能甚至相对于RTX 3080 Ti达到了100%以上的提升,而且在每瓦性能表现上相对于RTX 3090 Ti和RTX 3080 Ti都有50%以上的提升。所以对目前还嫌RTX 4090的价格太高而难以接受的话,RTX 4080倒是一个比较合适的顶级性能选择,至少它已经将RTX 3090 Ti都甩得远远的,成为了这个性能段的高性价比选择。当然,还得希望上市之后不要溢价太多,如果能保持在万元左右,那么RTX 4080对不差钱的玩家来说,毫无疑问将成为顶级旗舰性能显卡市场上的最热门选择。当然,如果预算还是受限只能眼馋RTX 4080,那就再等等吧!等明年的RTX 4070和RTX 4060,或许又能带来一波新的惊喜。
编辑:黄飞
评论
查看更多