一、前言:比想象中性能更强的RTX 4070显卡
GeForce RTX 4070解禁发布之前,不少人对它有点迷惑。
首先,它的CUDA核心(流处理器)与上代RTX 3070完全相同,都是5888个。另外一点就是它的显存位宽只有192Bit,RTX 3070则是256Bit。
有鉴于此,很多玩家预测RTX 4070的性能不会比RTX 3070强多少,大概也就是RTX 3070 Ti的水准。
RTX 4070真的如此不堪吗?当然不是!
RTX 4070使用了与RTX 4070 Ti相同的AD104核心,完整的AD104核心共有7680个CUDA核心(分为5组GPC/30组TPC/60组SM)、240个第四代Tensor Core张量核心、60个第三代RT Core光追核心、240个纹理单元、80个ROP单元、3MB一级缓存、48MB二级缓存。
完整的AD104核心
AD104-250核心(RTX 4070)
RTX 4070做了部分精简,拥有4组GPC共5888个流处理器、184个Tensor Core、46个RT Core和5888个流处理器单元、64个ROP单元、36MB二级缓存。
这其中很多参数与RTX 3070相同,比如流处理器、Tensor Core、RT Core,2款显卡一模一样,而ROP单元数量和显存位宽甚至还不如RTX 3070。
不过不要忘了,RTX 4070采用的是第四代Tensor Core和第三代RT Core,相比RTX 3070都领先了一代。
另外在台积电4N制程工艺加持下,RTX 4070的加速频率高达2475MHz,实际游戏频率更是高达2800MHz,相比RTX 3070提升了接近50%。
如此巨大的频率自然也会带来更强的游戏性能。
AD104的晶体管数量2倍于GA104,而流处理器数量却并没有翻倍,这是因为大量的晶体管用在了二级缓存上。
RTX 4070二级缓存容量高达36MB,9倍于RTX 3070,更大容量的二级缓存可以降低GPU对于显存带宽的需求。
另外,虽然显存位宽只有192Bit,但是由于采用了频率高达21Gbps的GDDR6x显存,位宽达到了504GB/s,而256Bit的RTX 3070位宽只有448GB/s。
更大容量的二级缓存再加上更高的显存带宽,RTX 4070的性能到底会比RTX 3070强多少呢?
二、图赏:可以看作是迷你版的RTX 4090
和巨大的包装盒比起来,RTX 4070显得十分小巧。
送来一条2x8Pin转16Pin的电源线,RTX 4080是3x8Pin、RTX 4090上是4×8Pin。
看起来就像是RTX 4080的缩小版。
背面。
依然是16Pin供电接口,不过功耗很低,完全不可能出现烧化接口的情况。
3个DP1.4和1个HDMI 2.1接口。
拆掉外框。
铜底+热管的散热设计。
非常mini的PCB板,改造成ITX版型也不难。
5+3相供电电路设计,虽然简单,但也足够应付200W的TGP。
背面空空如也。
RTX 4070采用的是AD104核心,芯片面积295mm2,拥有358亿晶体管。
GPU旁边是6颗美光GDDR6X显存,单颗2GB,总容量12GB,等效频率21GHz,带宽504GB/s。
RTX 4070就是迷你版的RTX 4090/4080。
三、理论性能测试:3DMark运行频率可达2800MHz
测试平台如下:
1、3DMark Time Spy
在2K分辨率3DMark Time Spy测试中,RTX 4070图形分数达到了17924分,核心温度最高68℃,热点温度最高86℃,核心运行最高频率为2820MHz,最高风扇转速1709PM,最高功耗173W。
在4K分辨率3DMark Time Spy Extreme测试中,RTX 4070图形分数达到了8587分,核心温度最高69℃,核心运行最高频率为2805MHz,最高风扇转速1700RPM,最高功耗173W。
2、3DMark Fire Strike
在2K分辨率3DMark Fire Strike Extreme测试中,RTX 4070图形分数达到了21351分,核心温度最高63℃,核心运行最高频率为2835Hz,最高风扇转速1409RPM,最高功耗169W。
在4K分辨率3DMark Fire Strike Ultra测试中,RTX 4070图形分数达到了10095分,核心温度最高64℃,核心运行最高频率为2835Hz,最高风扇转速1410RPM,最高功耗168W。
四、1080P与2K游戏测试:都比RTX 3080强
1、刺客信条:英灵殿
2、德军总部:新血脉
3、地平线:零之曙光
4、孤岛惊魂5
5、孤岛惊魂6
6、古墓丽影:暗影
7、极限竞速:地平线5
8、赛博朋克2077
9、巫师3
10、无主之地3
11、战争机器5
1080P分辨率测试数据汇总如下:
2K分辨率测试数据汇总如下:
1080P分辨率下,RTX 4070要比RTX 3080强了5%,到了2K分辨率下仍有1%的性能优势。
和RTX 3070相比,在2K分辨率侠下RTX 4070都能领先30%左右。
至于RTX 2070 Super,RTX 4070要比它强68%。
五、4K游戏测试:稍弱于RTX 3080
1、刺客信条:英灵殿
2、德军总部:新血脉
3、地平线:零之曙光
4、孤岛惊魂5
5、孤岛惊魂6
6、古墓丽影:暗影
7、极限竞速:地平线5
8、赛博朋克2077
9、巫师3
10、无主之地3
11、战争机器5
测试数据汇总如下:
4K分辨率下,RTX 4070相比RTX 3070 Ti的领先优势降到了13%,比起RTX 3070快了25%,但被RTX 3080反超,落后后者5%。
六、DLSS 3游戏测试之一: 3款无光追DLSS 3游戏
此次我们一共测试了8款游戏,包括4款支持DLSS 3但无光追的:《3DMark》、《超级突破》、《毁灭全人类》。
另外还有4款同时支持DLSS与光追的游戏:《暗影火炬城》、《光明记忆》:《无限、生死轮回》、《赛博朋克2077》。
所有DLSS 3以及光追测试都是在2K分辨率下进行。
1、3DMark
DLSS 2模式下帧率为121FPS,比默认的65FPS提升了133%。
DLSS 3的成绩为132FPS,相比默认提升了156%。
2、超级人类
这是默认最高画质,RTX 4070的帧率为158FPS。
DLSS 3的画质与原生画质相比有那么一点差别,不过不仔细看到话,很难发现差异。
3、毁灭全人类2:重新探测
最高画质下,RTX 4070的帧率为114FPS。
开启DLSS 3之后,帧率来到了222FPS,近乎翻倍。
七、DLSS 3游戏测试之二:4款支持DLSS 3的光追游戏
1、暗影火炬城
开启光追时,帧率为127FPS。
2、光明记忆:无限
开启RTX时,游戏的帧率为105FPS。
开启DLSS 3之后,帧率提升到了225FPS,提升了114%。
3、生死轮回
开启光追之后,游戏的帧率仅有56FPS。
打开DLSS 3之后,帧率提升到了180FPS,提升幅度搞到221%。
4、赛博朋克2077
开启光追之后,游戏的帧率仅有38FPS。
打开DLSS 3之后,帧率提升到了136FPS。
测试数据汇总如下:
八、功耗测试:烤机仅67度、能效比二倍于RTX 3070 Ti
1)、烤机测试
使用Furmark来对RTX 4070进行烤机测试,测试是室温为28度。
将Furmark的参数设定为1920*1200分辨率、0AA。
运行14分钟之后,RTX 4080的温度稳定在67度附近,功耗稳定在196W,烤机时GPU频率为2460MHz,CPU风扇转速只有1794RPM,基本上听不到风扇的噪音。
2)、真实游戏功耗测试
1、GTA V
1080P分辨率下,RTX 4070的功耗为117W,而RTX 3070 Ti则高达202W。
2K分辨率下,RTX 4070功耗是165W,运行频率2805MHz,温度56度。
RTX 3070 Ti的功耗为262W,运行频率1905MHz,温度73度。
2、绝地求生
这是1080P分辨率。
左边是RTX 4070,功耗186W,温度65度。
右边是RTX 3070 Ti,功耗285W,温度80度。
2K分辨率下,RTX 4070功耗190W,RTX 370 Ti功耗是288W。
3、古墓丽影:暗影
1080P分辨率下,RTX 4070功耗183W,温度59度,运行频率2805MHz。
2K分辨率下,RTX 4070功耗188W,RTX 3070 Ti则是282W。
测试数据汇总如下:
在1080P分辨率下,RTX 4070在3A游戏中的平均功耗只有171W,2K分辨率也只有186W;就算是到了4K分辨率,平均功耗也不到190W,这个功耗不到RTX 3070 Ti的2/3。
虽然RTX 4070的TGP是200W,但实际上基本上没有游戏可以跑到这个数字。相比之下,RTX 3070 Ti可以轻松跑满290W的TGP。
九、Stable Diffusion与RTX VSR体验
1、Stable Diffusion出图速度测试
如今已是AI时代,ChatGPT是最火的聊天机器人,而当前最火的AI作图工具则是Stable Diffusion,只需要输入一句话、或者特定的关键词,就能生成一幅你想要的图像。
只不过Stable Diffusion也是有要求的,你需要一张显存容量6GB以上的NVIDIA显卡。
下面我们来看看RTX 4070的出图速度。
生成图像宽度864、高度1264,采样迭代步数70。
实测RTX 4070出图耗时82秒,显存占用5GB,功耗168W。
RTX 2070 Super耗时122秒,功耗210W。
RTX 3070 Ti耗时86秒,GPU功耗277W,温度76度。
RTX 3070出图耗时95秒,GPU功耗210W。
小结:4张显卡中,RTX 4070不仅出图速度最快,功耗也是最低的,比RTX 3070 Ti低了110W。
另外我们这里只是出一张图,如果是大量出图,从中筛选优质图片,耗时会更久,这个时候高端显卡可以节约大量时间。
2、RTX VSR效果体验
其实很早之前就有AI图片画质增强工具,但是视频超分辨率技术一直是空白,主要是处理视频需要极高的算力。近期NVIDIA上线了RTX VSR 视频超分辨率技术,可以利用Tenser Core张量核心硬件单元,智能锐化和强化特征和边缘,同时消除恼人的压缩伪影。
想使用RTX VSR 视频超分辨率技术,只需要下载最新版本的GeForce显卡驱动和Chrome浏览器即可。
驱动安装完成之后,在NVIDIA控制面板中会出现RTX 视频增强选项,一共有4档可供选择,1档画质最低,4档画质最好。
左边是360P分辨率视频,右边是RTX VSR 4x画面,可以增强后的画面已经达到了1080P的画质水准,线条更加清晰、背景也纯净了很多。
就算是1080P视频,经过RTX VSR 4x增强后,画面中的噪点、锯齿都减轻了很多,细节更为丰富。
十一、总结:不仅仅只是一款游戏显卡
2022年12月上市的AMD次旗舰RX 7900 XT,其性能能媲美RTX 4080,价格仅售7499元,比对手足足便宜了2000元。
然而4个月过去了,如今许多非公RX 7900 XT已经降到了6000元以下,比RTX 4070 Ti还便宜不少,但依旧无人问津,真是让人唏嘘不已。
原因很简单,显卡只是单纯的游戏性能强是远远不够的,能效比、生产力、光线追踪等等这些综合起来,重要性上远远超过GPU的传统游戏性能。在这些方面,AMD显卡落后的已不是一点半点。
就拿目前大受欢迎的AI作图工具Stable Diffusion来说,A卡直接就无法识别……
以下是本次测试小结:
1、性能
RTX 4070最适合1080P和2K分辨率。我们测试了11款游戏,在2K分辨率下,除了《赛博朋克2077》“只有”92帧之后,其他10款游戏的帧率都超过了100FPS,平均帧率比RTX 3080还要强1%。
如果和RTX 3070 Ti相比,RTX 4070在1080P和2K分辨率下的优势接近20%,和RTX 3070相比,领先优势则接近30%。
我们也测试了图灵时代的RTX 2070 Super,这款显卡已经根本上时代,RTX 4070比它快了近70%。
2、功耗
RTX 4070的TGP为200W,不过根据我们的测试,这块显卡在游戏中的功耗实际上是很难触及到200W的。
我们测试了6款3A大作的真实游戏功耗,在1080P分辨率下RTX 4070的平均功耗是171W,而RTX 3070 Ti是264W,RTX 3080则是300W。
2K分辨率下,RTX 4070在6款游戏中的平均功耗是186W,RTX 3070 Ti和RTX 3080则分别是279W、313W。
4K分辨率下,RTX 4070在6款游戏中的平均功耗为188W,RTX 3070 Ti是286W,而RTX 3080已经跑到了320W的TGP上限。
三款显卡中,RTX 4070在1080P和2K分辨率下的性能最强,但功耗还不到3080的60%。
3、DLSS 3和光追
目前能玩的DLSS 3游戏多达数十款,我们测试了7款。
在开启DLSS 2之后,游戏帧率提升幅度为95%。打开DLSS 3,游戏帧率提升幅度达到了136%。
而与RTX 3070 Ti相比,RTX 4070在开启DLSS 3之后领先前者超过50%。
4、附加价值
此次我们还体验了Stable Diffusion与RTX VSR技术。
和RTX 3070 Ti相比,RTX 4070在Stable Diffusion中的出图速度不仅更快,同时功耗也低了110W。如果要生成大量图片,RTX 4070仅仅160W的功耗对于机箱内部的散热也不会造成太大影响。
至于RTX VSR,这是一个实打实的视频画质增强技术,实测360P视频通过RTX VSR 4x增强,最终画面效果甚至可以媲美1080P视频。1080P视频经过增强后,画面观感与4K分辨率已相差无几。
但是笔者感觉RTX VSR技术其实用在大屏电视上效果更好,如今86寸甚至100寸电视已经开始普及,这么大的屏幕,如果视频分辨率1080P,锯齿感会非常明显。
5、价格
NVIDIA GeForce RTX 4070建议零售价4799元起,此次NVIDIA备足了库存,首批商家的非公版将会有一半以上以建议零售价进行销售,甚至第三方渠道首发特惠低于4799元的也会有一些。
也许这会是第一块大家都买得起的RTX 40系显卡!
编辑:黄飞
评论
查看更多