3070和2080ti,3070和2080ti性能差距?
距离NVIDIA GeForce RTX 30系显卡的发布会已经过去了将近两个月的时间,各个品牌的非公版显卡纷至沓来,RTX 3080/3090的喧嚣刚刚过去,现在RTX 3070也正式和大家见面了。
70这个型号对于玩家来说有着非常大的魔力,乃至发布会中黄仁勋都亲口说道“70一直以来都是最受欢迎的型号,不管是970、1070还是2070”。
而这并不是毫无根据,以此次的RTX 3070为例,相比旗舰级产品RTX 3080的5499元售价,RTX 3070只要3899元,价格便宜1600元,但性能属于中高端行列,根据NVIDIA官方的描述,RTX 3070的性能甚至要比RTX 2080Ti还要强上一点。
NVIDIA GeForce RTX 3070
通过NVIDIA Ampere架构所带来的性能暴涨,究竟能不能让昔日的万元卡皇黯然失色,下面为大家带来NVIDIA GeForce RTX 3070 Founders Edition版显卡的首发评测。
01NVIDIA GeForce RTX 3070 外观
首先来看GeForce RTX 3070显卡的外观,相比一同发布的另外两兄弟,RTX 3070要小巧不少,长宽比给人非常舒服的感觉。
在外包装上,一向是NV的极简风格,方方正正的硬纸盒子,主色调以黑色为主,辅以玫瑰金色纹路,与RTX 3080相同。
NVIDIA GeForce RTX 3070
RTX 3070的整体外观相较RTX 3080的差别还是比较大的,在之前的评测中我们讲过RTX 3080采用了一前一后的风扇散热设计,显卡尾部的风扇主动将热气排至上方再由整体的散热系统排出。
NVIDIA GeForce RTX 3070背板外露的散热鳍片
虽然RTX 3070正面的设计与上一代相同,但背面其实另有玄机。这款显卡依旧采用了超高密度的PCB板设计。
NVIDIA GeForce RTX 3070
相比RTX 3080的推拉式散热,RTX 3070采用推式风扇设计,显卡前端的风扇将热空气从机箱背部支架排出;显卡尾部直接由正面导流罩和大量的外露散热鳍片组成,形成中空状态,风扇依旧会将热气通过散热鳍片向上排出。根据官方的说法,与公版的RTX 2070相比,RTX 3070流式系统的静音提高16dBA,散热性能提升44%。
NVIDIA GeForce RTX 3070供电接口
NVIDIA GeForce RTX 3070电源转接线
除此之外的一些细节部分,侧面的GeForce RTX logo取消了LED灯,改为喷涂印刷。供电接口还是熟悉的单12pin,不过转接线却有些许不同,由于RTX 3070的功耗更小,采用了12pin转8pin。所以对于大部分玩家来说,意味着可以不用大动干戈换电源,直接升级显卡。
NVIDIA GeForce RTX 3070视频输出接口
在视频输出接口上,RTX 3070采用DP1.4a*3 + HDMI 2.1的4接口,同样可支持单线8K的视频输出。
NVIDIA GeForce RTX 3070
单从外观来讲,个人认为RTX 3070没有RTX 3080好看,但整体工艺同样精致,只有电源的转接线依然略有瑕疵,由于线材比较硬,从“双马尾”成了现在的“一柱擎天”,不过RTX 3070侧面的logo并不发光,所以倒也不是很显眼。
02NVIDIA Ampere下的RTX 3070
NVIDIA GeForce RTX 3070同样采用了NVIDIA Ampere架构,我们首先来看一下RTX 3070的提升。
第一代RTX架构 Turing下的2070
第二代RTX架构 Ampere下的3070
相较于初代的Turing RTX架构,NVIDIAAmpere架构在算力上有着成倍的增长,这一点在RTX 3070中依旧有体现,每个时钟执行2次着色器运算,而Turing为1次,RTX 3070的着色器性能达到20.3 TFLOPS单精度性能,而Turing为7.9 TFLOPS。
NVIDIAAmpere架构翻倍了光线与三角形的相交吞吐量,RT Core达到39.7 RTTFLOPS,而Turing为23.8 RT TFLOPS。
全新的Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达162.6 TensorTFLOPS,而Turing为60.3 TensorTFLOPS。
NVIDIA GeForce RTX 3070的GPU核心拥有174亿个晶体管,392平方毫米的面积,基于三星的8nm NVIDIA定制工艺,另外在RTX 3070中我们都知道仍然采用了GDDR6显存,不过不同于RTX 3080的Micron,RTX 3070采用了三星的GDDR6显存。
我们在发布会中经常听到性能翻倍的说法,其实是因为本次NVIDIAAmpere的SM在Turing基础上增加了一倍的FP32运算单元,这就使得每个SM的FP32运算单元数量提高了一倍,同时吞吐量也就变为了一倍。
而通常我们计算显卡的CUDA数量,并不是把SM中的所有单元加起来计数,而是只统计FP32单元的数量,所以这样一来,SM中的【FP32 : INT32】 从 1:1 变为 2:1。
RTX 3070共有5888个CUDA,其实它只有2944个INT32单元,但由于内部的FP32数量翻了一倍,所以最终实现了5888这个惊人的数字。
而这样粗暴的提升CUDA数量对于游戏有帮助吗?答案是有,不仅有提升还很大。其实通常在游戏中浮点运算相比整数计算要常用的多,图形、算法以及各种计算操作中着色器工作负载通常需要混合使用FP32算数指令,而FP32的加速也有助于光线追踪降噪着色器。
光追工作原理示意
在此次的NVIDIAAmpere架构中,NVIDIA官方宣布为第二代RT Core,它和第一代有什么不同呢。首先要知道RT Core的工作原理是,着色器发出光线追踪的请求,交给RT Core来处理,它将进行两种测试,分别为边界交叉测试(Box Intersection testing)和三角形交叉测试(Triangle Intersectiontesting)。基于BVH算法来判断,如果是方形,那么就返回缩小范围继续测试,如果是三角形,则反馈结果进行渲染。
而光线追踪最耗时的正是求交计算,因此,要提升光线追踪性能,主要是对两种求交(BVH/三角形求交)进行加速。
RT Core的变化
在Turing的RT Core中,可以每个周期完成5次BVH遍历、4次BVH求交以及一次三角形求交,在第二代RT Core 里,NVIDIA增加了一个新的三角形位置插值模块以及一个的额外的三角形求交模块,这样做的目的是为了提升诸如运动模糊特效时候的光线追踪性能。
运动模糊渲染原理
第二代RT Core可以让光线追踪与着色同时进行,进行的光线追踪越多,加速就越快,它将光线相交的处理性能提升了一倍,在渲染有动态模糊的影像时,按照NVIDIA自己的实测,比Turing快8倍。
稀疏深度学习
除了光线追踪的强化,Ampere架构的Tensor Core也得到了极大地加强,在第三代Tensor Core中,NVIDIA引入了稀疏化加速,可自动识别并消除不太重要的DNN(深度神经网络)权重,同时依然能保持不错的精度。
首先原始的密集矩阵会经过训练,删除掉稀疏矩阵,再经过训练稀疏矩阵,从而实现稀疏优化,进而提高Tensor Core的性能。
与此次RTX 30系显卡一同发布的还有一项新技术——RTX IO。目前很多游戏动辄几十G甚至百G的安装空间,对于存储空间的负担暂且不提,但存放在硬盘中的数据,如果显卡想要读取到,需要先由CPU从硬盘中读取压缩过的数据,经过解压缩再发送到显存中。
虽然随着NVMe SSD的推出,读取速度相较机械硬盘能够快20倍,但受制于传统I/O限制,NVMe高达7GB/秒的高速读写对于CPU是极大的负担。
传统的数据交换
在这个过程中,会占用多个CPU核心,压力急剧增大,占用较多的内存,而此时其实GPU是处于闲置状态的。RTX IO的作用就是越过CPU解压再传输数据这一步,直接从PCIE总线读取硬盘上经过压缩的数据,并且完成无损GPU解压,降低CPU占用,变向提升了性能。
RTX IO可以极大解放CPU负担
当然这项技术作为系统底层的运行方式改变,还需要借助微软发布的DirectStorage来实现,对于目前容量的游戏来说,RTX IO的改善效果有限,但假以时日等游戏容量上百G成为常态的时候,这项技术将会发挥巨大的功效。
同时搭配新增的HDMI2.1接口,可以支持单线8K的视频输出,而上一代HDMI2.0仅支持4K 98Hz的视频输出,如果想要连接8K电视,则需要更多的线缆支持。
033DMARK 理论性能测试
首先介绍一下测试平台,为了保证此次评测能够发挥RTX 3070显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,具体如下。
在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。
GPU-Z参数
首先看一下GPU-Z的参数,RTX 3070采用了GA104核心,三星8nm,芯片面积达到了392平方毫米,相比RTX 3080的628小了236平方毫米,拥有5888个CUDA,频率为1500-1725MHz,采用8GB GDDR6显存,位宽为256bit,显存带宽达到了448GB/s,光栅单元和纹理单元分别为96和184。
下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:
3D MARK FS套装测试
在针对显卡DX11性能的3DMARK FS套装测试中,RTX 3070和RTX 2080Ti互有胜负;但是相比RTX 2070的提升非常大,在FS中分数高45%,在FSE中分数高50%,在FSU中分数高56%。而RTX 3070与RTX 3080的差值比较稳定,均在28-29%之间。
3D MARK TS套装测试
在针对DX12环境下的Time Spy和Time Spy Extreme测试中,RTX 3070和RTX 2080Ti同样互有胜负,另外不难发现RTX 3070获胜的测试项均为4K分辨率下的成绩。
RTX 3070相比RTX 2070的TS分数高52%,TSE中分数高60%。而相比RTX 3080的差值为31-33%。
3D MARK 光追测试
PortRoyal是3DMARK中专门针对光追性能的测试项,RTX 3070的测试结果要优于RTX 2080Ti;相比RTX 2070提升53%。
在理论测试中,RTX 3070可以说和RTX 2080Ti的成绩不分伯仲,下面进行游戏测试环节。不过遗憾的是我们手头没有公版RTX 2080Ti,无法进行对比测试。上面理论测试的环节我们也是使用之前的测试成绩进行对比。
04游戏性能测试
在游戏性能测试中,我们选择了、《古墓丽影:暗影》、《德军总部新血脉》《孤岛惊魂5》、《刺客信条:奥德赛》、国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件。
《古墓丽影:暗影》游戏测试
在《古墓丽影:暗影》中,由于加入了光追和DLSS效果,所以我们也分为2组6测,为了照顾以前没有DLSS时的测试分数,第一组为预设最高画质下,RTX OFF/DLSS OFF;第二组为预设最高画质下,RTX 超高/DLSS ON。
其中RTX 3070比RTX 2080的分数提升比较稳定为10%左右;对比RTX 2070在1080P分辨率下,高36%和37%;2K分辨率下高40%和39%;4K分辨率下高37%和42%,整体提升幅度在30-40%之间;而RTX3080相比RTX 3070的提升幅度在40%左右,可见作为旗舰卡,RTX 3080相当暴力。
《德军总部新血脉》游戏测试
在《德军总部新血脉》中,由于自带两个benchmark,所以我们的数据取跑分均值。其中RTX 3070比RTX 2080在1080P分辨率下的分数高16%,2K分辨率下高30%;4K分辨率下高25%。
《刺客信条:奥德赛》游戏测试
接下来是《刺客信条:奥德赛》,其中RTX 3070比RTX 2080在1080P分辨率下分数高18%;2K分辨率下高19%;4K分辨率下高23%。
《孤岛惊魂5》游戏测试
《孤岛惊魂5》同样算是优化比较到位的3A大作,RTX 3070比RTX 2080在1080P分辨率下分数高14%;2K分辨率下高36%;4K分辨率下高41%。
《光明记忆:无限》游戏测试
《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,目前还没有游戏提供试玩,不过benchmark的跑分软件官方已经提供,玩家可以在steam上自行下载。另外我们在测试的时候由于无法关闭光追选项,故所有测试成绩均为“RTX 最高/DLSS 质量”模式下进行。
在1080P分辨率下,RTX 3070比RTX 2080分数高17%,2K分辨率下高38%,4K分辨率下高41%。
《边境》游戏测试
《边境》同样是一款来自柳叶刀工作室的国产3A大作,具体发售日期不明,目前仅提供了benchmark跑分软件。同样的目前跑分软件不支持关闭光追选项,所以在测试时我们选择“RTX 最高/DLSS 质量”下进行。
在1080P分辨率下,RTX 3070比RTX 2080分数高29%,2K分辨率下高34%,4K分辨率下高31%。整体看下来,RTX 3070相比RTX 2080的游戏分数提升为30%左右。
05温度与功耗测试
在温度功耗测试方面,室温24℃,我们并没有采用全封闭式的机箱,而是采用测试平台的方法,这样做可以最大限度的保证显卡除了自身散热外将风道等外因减小到最低。
功耗测试(点击查看大图)
功耗测试中,我们选择FurMark软件进行拷机测试,功耗仅计算显卡自身。相比旗舰级的RTX 3080,RTX 3070的功耗要小得多,在峰值情况下整体平均在210W-220W之间。
温度方面,本次的RTX 3070依然控制在75℃左右,在官方数据中RTX 3080采用的双轴流式设计空气流量相较于之前的设计增加55%,散热效率提升30%,而RTX 3070采用了传统的正面双风扇设计,其中的散热效率会有一定区别,但就RTX 3070本身而言,更高的频率,发热量也会有所提升。
06软硬兼施 铸就Ampere
好的硬件没有软件的加持,相当于空有长柄没有枪头,想要发挥十成威力则必须软硬搭配,反之亦然。此次随着发布会共同推出的还有以下几项非常值得大家关注。
NVIDIA Reflex
以往我们关注延迟大多从显示器上了解到几毫秒极速响应,但那只是作为最终端的显示输出效果,你是否想过从系统内部到实际看到的画面有多大延迟?
NVIDIA Reflex
在20系显卡中NVIDIA反复提及的“帧能赢”,在30系显卡中也做了更进一步的突破,除了NVIDIA将推出自己的电竞显示器NVIDIA 360Hz G-SYNC ESPORTS,还有NVIDIA Reflex技术。
以往如果想测量系统延迟需要高速相机以及定制的LED鼠标电路。而使用带有NVIDIA Reflex技术的显示器将内置精确的延迟分析工具,可在CPU和GPU中优化渲染管道,极大减少延迟时间,将系统延迟整体降低至30ms以下。不过就像图中所示,为此你需要一个支持反射延迟分析的鼠标。
NVIDIA Broadcast
NVIDIA Broadcast是一款易用且专业的直播软件,它的强大之处就在于主播不再需要任何的背景布置,只需要一个普通的摄像头和一张GeForce RTX系列的显卡即可。
它戳我脸!
这款软件可以让你杂乱无章的房间立即变成直播间,其内置了音频降噪、背景虚化、虚拟背景、头部追踪等功能。NVIDIA Broadcast的工作原理是利用AI算法通过DGX超级计算机深度学习而来。
NVENC编码
同时RTX 30系显卡拥有目前最好的硬件解码器,大部分用户的电脑在直播时打开OBS推流后CPU占用会直接飙升到50%左右,而基于GPU的NVENC解码可以极大地减轻CPU负担。
NVIDIA Studio
对于内容创作者来说,提到软件可能大部分只会想到内容创作的相关软件,但NVIDIA专为内容创作者推出的NVIDIA Studio驱动则是承担着连接创作软件和显卡功能的关键。
NVIDIA Studio
NVIDIA Studio驱动经过更新与优化,对于最新版本的Adobe系列软件支持更为稳定,同时附带更出彩的创作功能。利用NVIDIA CUDA技术,GPU加速特效可实现更快的实时视频编辑并加速渲染输出,并让原本只能进行软件编码输出的视频轻松得到硬件的支持。另外在AI计算方面的优势,包括自动标记片段、特效追踪和人脸识别等功能,都有显著的速度提升。
以GPU渲染为14.98秒 而CPU渲染为11分钟
当然NVIDIA Studio的加速创作绝不止Adobe一家,DaVinci、Keyshot、Blender、D5等专业软件中都有非常亮眼的表现。不仅能提供强大且稳定的运行环境,更能以GPU加速,有效提升创作效率。
07销量冠军预定
NVIDIA GeForce RTX 3070从性能来说,与RTX 2080Ti不分伯仲,但是售价只有3899元,用中端卡的价格体验上一代旗舰级的性能,这笔买卖简直不能用划算来形容,而是捡到了。
NVIDIA GeForce RTX 3070
另外在规格上,RTX 3070虽然依然采用12pin接口供电,不过里面只有6针的接口,也就是说在非公版显卡中有可能会使用单8pin的供电接口。而从功耗上来说,RTX 3070的默频功耗为220W,比RTX 2080 SUPER还要低,建议电源为650W,可以搭配大部分现役电源继续使用。这对于想用新显卡又不想整套换配件的玩家来说无疑是最大的福音。
20系与30系显卡参数对比
在游戏表现上,RTX 3070可以说相当惊艳,目前市面上大部分游戏都可以在4K分辨率下获得60FPS的高帧率体验,并且在评测中我们都是以预设最高画质下测试,很多不必要的特效在真正游戏时大可以关掉,来获得更高的帧率。
NVIDIA GeForce RTX 3070
个人认为,如果你想体验全新的30系显卡所带来的性能暴涨,但又不想花上中千的价格,那么RTX 3070是最合适的。尽管在不久的将来还会有入门级的RTX 3060,性能估计也会在RTX 2070之上,但体验到的依然是20系显卡中高端的水准。
总的来说,NVIDIA GeForce RTX 3070做到了性能与价格兼顾,比肩RTX 2080Ti的性能,看齐RTX 2070的价格,1.6倍于RTX 2070的性能让20系显卡,正在以飞快的速度谢幕。如果你想升级显卡,体验4K游戏的超清画质,又不想“大动干戈”,这样一款低功耗高性能的显卡最适合你。
NVIDIA GeForce RTX 3070
目前非公版显卡的解禁时间为2天之后,也就是10月29日21:00,届时各个渠道的售卖也会一同开启,另外有爆料称RTX 3070的供货量将会大很多,是时候去试试手气抢一块了。
(7545771)
以上就是小编关于【3070和2080ti哪个好】的分享,希望对你有用。
网友提问:
3070和2080ti,3070和2080ti哪个好?
3080显卡比2080TI还要强,价格还比2080TI便宜这么多,你怎么看?
优质回答:
等等党的一次巨大胜利!下一个目标ddr5英特尔10nm!!!期待又一次胜利!
其他网友观点
同样的价格下,性能更强,显卡正常的更新换代就该如此,所以RTX3080在699美元的价格下实现远超1000多美元2080ti显卡的性能实属正常,毕竟2080ti已经是两年前的旗舰显卡,而且就常规图形性能来说的话,2080ti相比1080ti提升的就不算多,所以这次架构、工艺同时升级的3080自然就实现了远超2080ti的性能。
由于显卡属于消费电子产品,主要靠庞大的走量来实现更高的利润,买显卡的用户也主要是游戏玩家为主,然而这类用户群的消费能力总归是有限的,如果新显卡一出卖的价格很贵,那么销量自然会受影响,RTX20系列显卡因为在架构上实现了巨大突破,耗费了大量研发成本,所以卖的价格比上一代显卡高了不少,而到了RTX30系列,架构总体上已经走向成熟,如果再度涨价的话,那么消费者显然是不会买账的。
在RTX30系列显卡上市以前,市面上仍然在使用GTX10系显卡的用户仍然很多,就连steam平台上也是GTX1060显卡长期占据第一名的位置,说明很多人不认可RTX20系列的性能和价格,所以NVIDIA在RTX30系列显卡上的首要目标就是大幅提升性能,并且保持价格稳定,然而RTX3080确实达到了这个目的。
虽说客观来讲,物价在涨,显卡的研发成本也在涨,但是PC游戏玩家数量还是比较稳定的,何况这几年还加入了很多内容创作者和游戏主播加入了购置显卡的行列,这些算起来其实是有助于显卡销量的提升的,所以RTX30系列这一代即使性能提升再大也不能涨价了。
其他网友观点
香是真香,但是3080在某种意义上来说不值得买。
问题出在老黄几乎没提到的一个参数:显存
作为理论性能超过2080ti两倍的新卡,显存竟然比2080ti还要低,只有10G。这次发布的高端卡对标8k,3080对标的是4k流畅运行。
2080ti跑4k画质的荒野大表哥2大概需要8G的显存显存占用,看起来3080的10G也够用,但是随着新的游戏引擎的广泛应用,未来的游戏如果要用3080跑全特效4k,10G的内存就很可能成为一个拉胯的点。
记得经典显卡1060的两个版本1063和1066现在的区别吗?当时大家可能也觉得3G够用,现在呢?
所以如果想要畅玩2k,3070足够,3080浪费。如果挑战8k,请选择3090。现在选择3080,明年必然眼馋3080的高显存版本。甚至可能性价比不如3070ti。
总结:价格很香,参数抢眼,但是是一张定位尴尬的过度卡,而不会成为1066那样的常青树和经典。如果想玩爽4k,不差钱就上3090,省钱又不想折腾就再等几个月的3080ti吧
其他网友观点
虽然我买不起这么贵的显卡,但是我同样感觉非常激动。
这里给想要购买高端显卡的朋友提一个醒,30系显卡性能更加强大,最好搭配2K/4K显示器才能有比较好的体验。而且处理器的性能一定要跟上,很多朋友的配置都是中等CPU+高端显卡,这种情况无法发挥出显卡的全部性能,记得好马配好鞍,CPU屏幕内存之类的统统安排一下!
其他网友观点
要说RTX3080显卡,价格确实比RTX2080Ti低很多!而且性能更强!
RTX3080价格优势明显
虽然还没有正式解禁发售,但是官方定价699美元,这是什么概念?要知道当初2080Ti的官方价格达到了1000美元,两者相差了非常多。
按照一般的规则,国内定价应该在5499左右,当然不同OEM厂商的价格也有不同,像华硕的败家之眼肯定会贵不少!
而2080Ti呢?目前售价仍然在万元以上,相比之下显得太贵了!这也就导致了目前2080ti直接滞销,大家都不傻,这档口谁还会再去买它呢?
RTX3080性能更强
目前没有实物可以测试,但是英伟达有官方的测试视频,可以找来看一下。
测试内容是一款名为毁灭战士:永恒的游戏,根据视频来看,3080对比2080ti的优势不是一点点,而是很多点。
在游戏的复杂场景中,3080仍然能保持120帧左右的表现,但是2080ti就只有80帧左右。
总体来看老黄这次的刀法十分凌厉,3080厉害得很。
我的看法
我也没有什么异想天开的看法,显卡厂商对新一代核心进行升级,是很常见的做法。
唯一的不同是这次的升级幅度比较大,无论是对于英伟达,还是用户,这都是一个利好消息。
就在前几天,英伟达的市值成功超越intel,很是牛x。
不过对于那些已经购买了20系列显卡的用户来说,这可不是什么好消息。另外,大量囤货20系列显卡的商家,可能要血亏一波,没办法,市场有时候就是很残忍。
总结
英伟达这次发布的新显卡的确很亮眼,让人不禁拍手称赞。不过作为一个不玩游戏的吃瓜群众,我还是打算让我的GTX1050再战几年!
希望我的回答能够帮到你,喜欢的话请给我点赞和关注吧,谢谢大家!