RTX3090 双卡对比测评

会员服务 ·

RTX3090 双卡对比测评

2020 年 10 月 3 日 极市平台

↑ 点击蓝字关注极市平台

作者丨Theellyence

来源丨https://zhuanlan.zhihu.com/p/256371885

编辑丨极市平台

前言

本次要评测的两张RTX3090是 GAMING OC 24G 与 STRIX GAMING O24G，分别定位技嘉风冷中高端与华硕风冷旗舰。显卡来源：路边捡的。

既然是路边捡到而不是NV官方或者AIC厂商送测，就没有利益相关，想骂想夸都随意，不用被限制。

本次只是简单放点用采集卡抓出来的基准测试，以及少部分游戏游玩实况，玩游戏的时候不管帧数高低，我都秉承一个原则：4K分辨率、特效拉满、光追拉满，我认为这样才能把这种显卡的游戏潜力发掘完全。

更新：增加了大量视频后期三维特效软件的标准化比对测试。

外观

因为是路边捡来所以没有包装盒，也没有专业影视设备，就算有也不太会用，就尽量拍得稳点。

GAMING OC（上）与STRIX GAMING O24G（下）

GAMING OC 24G 侧视

STRIX GAMING O24G 侧视

我或者知乎很多玩家一向对STRIX的印象并不是很好，具体原因就不多说了懂得都懂，但STRIX OC这个型号的性能，确实从RTX20系开始就已经配得上ROG这三个字母。外观方面，ROG罕有地审美在线了，实现了板卡"ONE ROG"的审美，STRIX OC的背板与ROG的纯血Z490，也就是MAXIMUS XII系列的APEX和EXTREME的外观都非常契合，这很棒。

GAMING OC在本代虽然贵为“魔鹰”，但似乎霸气的只是名字以及不错的散热，外观是现代金属切割风格，没感觉出“魔”在哪里。真论外观以及起名艺术，还得看A卡非公们。

拆解与分析

STRIX GAMING O24G PCB 正面

简单分析：

共22路供电；
11+4+3三组共18路给了核心，控制器是两颗MPS的PM2888A，别看着芯源就急眼，这颗玩意是NV认可的，Power Stage是不错的，用了Ti的CSD95481RWJ，大致60A能力。
1+1+1+1四组给了显存，控制器是UPI的uP9512Q，刚好4路分4组，背面同理，整合MOS型号同上。
其实我不是很想吹ASUS，但这片PCB上确实有不少方便超频的设计，越肩非公一般代表着性能，毕竟能容纳更大规模的供电模组与更宽的散热模组，这规律在近两年简直是屡试不爽。此外一些标明了的电压量测点也很方便用来超频。

STRIX GAMING O24G PCB 反面

听说某视频站还有个知名媒体忘记检查显卡背面，看见正面有12颗美光的GDDR6X，就说RTX3090上的D8BGW是2GiB/颗的，这......（当然后来他们发现改正了，这是好事）

STRIX GAMING O24G 显存

与RTX3080一样，这两张RTX3090也使用了GDDR6X的美光显存，但不同于RTX3080的D8GBW，RTX3090使用的颗粒标识为D8BGX。

美光目前有两种GDDR6X颗粒，但需要去翻阅产品目录并下载Datasheet，美光官网的FBGA Decoder没有收录它们的信息，这里给出Datasheet附带的型号解读方法，自行参考即可：

MT61K256M32JE-19 与 MT61K256M32JE-21，分别对应RTX3080与RTX3090的 D8BGW / D8BGX，前者传输速率为19Gb/s，后者则是21Gb/s。

注意传输速率并不等同于带宽，这是两个概念，有兴趣了解或复习的朋友可以自行搜索Data Rate与Bandwidth的区别，这里不做赘述。

STRIX GAMING O24G 背板反面

STRIX GAMING O24G 结构架

STRIX GAMING O24G 散热模组

散热模组由7根6mm全镀镍热管、镜面抛光底座，以及3把9.5mm风扇构成。

STRIX GAMING O24G 散热器压力扣具

GAMING OC 24G PCB 正面

简单分析：

共18路供电；
9+4+2三组共15路给了核心，控制器分出来三颗，两颗是UPI的uP9521R，一颗uP9511R。Power Stage是来自万国的ON19，能力暂时不详。
1+1+1三组给了显存，控制器是UPI的uS5650Q，刚好3路分3组，背面同理，整合MOS型号同上。
这是一片普普通通的AIC公版方案PCB。

GAMING OC 24G PCB 反面

GAMING OC 24G 背板反面

GAMING OC 24G 散热模组

散热模组由7根6mm热管、铜质底座，以及2把8.5mm、1把8mm风扇构成。

思路简述

这次仍然偷懒，主要用3DMARK的一些项目来测试性能_（不够严谨，别学）_，这回两张RTX3090的对手，是上篇文章的那张微星RTX3080 Gaming X Trio，俗称魔龙。

三张显卡在测试时的预设都是ALL AUTO，什么都不动。

测试平台：

主板：微星 MEG X570 Unify
CPU：AMD Ryzen 9 3900X
内存：芝奇皇家戟 F4-4000C18D-16GTRS
散热：EK AIO 360 D-RGB
电源：海韵 PRIME FANLESS TX-700
固态：铠侠 TC10 240G / WD Black SN750-EK 1T
机箱：STERACOM BC1

各项配置的选择原因前文讲过了：

https://zhuanlan.zhihu.com/p/228238504

总之，多走动、勤锻炼有益身心健康，各位如果在家的话，看到这里不如放下手机，趴在地上单手做平板支撑，另一只手继续翻阅本文，说不定转头一看，就会发现柜子底下藏着你的女朋友/男朋友或者你的猫送给你的RTX3090。

测试环节

RTX3090与次旗舰RTX3080之间的对比；
RTX3090在PCIe 3.0与4.0两种环境下是否有区别；
两个支持光追和DLSS的游戏实测；
RTX3090与次旗舰RTX3080在一些视频后期生产力软件中的差距。

《Death Stranding（死亡搁浅）》

《Call of Duty: Modern Warfare（使命召唤16）》

RTX3080 vs RTX3090 游戏基准测试

第一项，Time Spy Extreme（用于代表新世代大作）
第二项，Fire Strike Ultra（用于代表依旧比较吃配置的老游戏）
第三项，Port Royal（用于初步检验光追性能）

在上一篇文章中我提到了关于MSI Afterburner这个软件的事情，抱怨其中的OC Scanner功能失效，似乎并不适用于功耗尚未解放的新架构游戏卡：

连1%差距都拉不开真就离谱，离谱到我用Afterburner做个OC Scan都能跑出Error Code 3来。

时至如今，这个问题在新版Afterburner中似乎得到了底层技术上的解决，据朋友提示，在新版本中，OC Scanner似乎不再独立行动去试探功耗、电压、温度之间的平衡点，转而寻求底层驱动去主导判定，这十分有趣。

在新版Afterburner的加持与前段时间的摸索经验积累下，我使用前文的那张MSI RTX3080 GAMING X TRIO，通过超频（风冷）提升了约8%的性能（Time Spy Extreme Graphics Score: 9000/9698≈7.75%），在这里想问一句：由此，RTX30是否算作灰烬？或者只是“超频潜力不高”而已？

基准测试仍然会使用ALL AUTO的硬软件设置，以保证公平。

参与测试的型号是MSI RTX3080 Gaming X Trio与ROG RTX3090 STRIX OC。

Time Spy Extreme

Fire Strike Ultra

Port Royal

数据总结：

RTX3080
TSE: 9139 FSU: 11133 PR: 11639
RTX3090
TSE: 10806 FSU: 13095 PR: 13759

在DX12环境下的Time Spy Extreme项目中，RTX3090领先RTX3080约18%；
在DX11环境下的Fire Strike Ultra项目中，RTX3090领先RTX3080约18%；
在光线追踪能力专项测试中，RTX3090领先RTX3080约18%。

巧妙的领先优势，不是吗？

当然，默认归默认，跑分归跑分，这张猛禽最高跑到了TSE图形分11532的成绩，让我短暂地登上了 3DMARK Time Spy Extreme 图形分世界第一的宝座。当然，享受了十几个小时的虚荣就被某位大神送到第二去了，就像跑到TSE 9698图形分的那次RTX3080魔龙一般，接下来当然会被更多专业选手越送越远，就当体验一把了，哈哈。

此外，RTX3090支持SLI模式的NV-LINK双卡互联，但手中暂时没有对应槽位的NVL桥_（一张2.7槽一张2.9槽实在是太厚了）_，而且STRIX OC的PCB比GAMING OC更宽，物理上太难实现NVL。

PCIe 3.0 vs PCIe 4.0

在上篇文章里，测试结果表明RTX3080并不需要PCIe 4.0×16的加持，PCIe 3.0×16就足以使其完整发挥性能，RTX3090应亦如是？

以下是测试项目：

第一项，AIDA64 GPGPU Benchmark (PCIe 3.0×16) vs (PCIe 4.0×16)
第二项，Time Spy Extreme (PCIe 3.0×16) vs (PCIe 4.0×16)
第三项，Fire Strike Ultra (PCIe 3.0×16) vs (PCIe 4.0×16)
第四项，Port Royal (PCIe 3.0×16) vs (PCIe 4.0×16)
第五项，PCI Express feature test (PCIe 3.0×16) vs (PCIe 4.0×16)

其中，PCI Express feature test 这个项目是我上篇文章忘记做的，这次补上。在我看来虽然这种直接读写显存的测试并作为游戏场景的代表，但仍不失为一种“看数据”的好手段。

AIDA64 GPGPU Benchmark (PCIe 3.0×16) vs (PCIe 4.0×16)

因为测试存在误差，所以GPGPU Bench测了两遍，左侧是3.0，右侧是4.0。

Time Spy Extreme (PCIe 3.0×16) vs (PCIe 4.0×16)

DX12下的TSE，RTX3090用PCIe 3.0或4.0并没有区别。

Fire Strike Ultra (PCIe 3.0×16) vs (PCIe 4.0×16)

Fire Strike Ultra同样没什么区别。

Port Royal (PCIe 3.0×16) vs (PCIe 4.0×16)

Port Royal还是没什么区别......这种程度的差距只能被算作合理误差。

PCI Express feature tese (PCIe 3.0×16) vs (PCIe 4.0×16)

终于，在3DMARK专门的PCI Express带宽测试，终于体现出了区别，但这只是测试带宽，并不能直接与游戏性能联系，况且上边专门代表各种游戏情景的测试已经证明了很多。

游戏实测

4K DLSS 全特效死亡搁浅
https://video.zhihu.com/video/1291800871983513600?

4K 全特效光线追踪使命召唤现代战争
https://video.zhihu.com/video/1291802490871554048?

生产力软件测试

显然24G GDDR6X这种规模的显存，以及RTX3090本身的定价，看起来就不只是一张单纯的游戏卡，有几个跑工程软件的小伙伴见此直呼过瘾，并寻找或制作了一些demo，邀请我用TRX40平台对RTX3090进行测试。

由于我自己不够了解这方面，操作全程在朋友的远程技术支持下完成，所以耽搁了很长时间，也占用了他们很多时间，在此对读者们讲句抱歉，也对朋友们的鼎力相助表示感谢！

首先是在Houdini的5个物理模拟demo：

Houdini×RTX3090 物理测试：粒子模拟：

Houdini×RTX3090 物理测试：流体模拟：

Houdini×RTX3090 物理测试：粘性流体模拟：

（由于一篇文章只支持添加3个视频，因此部分视频需通过链接观看）

Houdini×RTX3090 物理测试：布料模拟：

https://video.zhihu.com/video/1293997798896353280?

Houdini×RTX3090 物理测试：烟雾模拟：

https://video.zhihu.com/video/1293998006523121664?

篇幅所限，就不把其他显卡的测试录屏也放上来了，在Houdini分别使用了

RTX2080Super/RTX2080Ti/RTX3080/RTX3090

这四张显卡测试渲染这几个demo，多次测试后取平均时间（越短越好）：

接着是常用渲染器的理论性能测试，设计的测试项目如下:

Arnold Benchmark
OCtane Benchmark
Vray Benchmark
Blender Cycles (CUDA/OptiX)
D5 Render
Redshift Benchmark

这里不再一一放视频，直接做数据汇集：

demo渲染用时（越短越好）：

内建Benchmark得分（越高越好）：

最后测试了一下达芬奇内建的创作性能测试（越高越好）：

DaVinci Resolve
RTX2080Super: 625
RTX2080Ti: 988
RTX3080: 1279
RTX3090: 1731

测试总结

RTX3090相比RTX3080强得“有限”，这可能会在许多人预料之中，毕竟同代同工艺同尺寸的GPU总不可能差距大到离谱——不太科学。

在反复测试不同类别的多款网游与单机大作后，从游戏帧率角度计算，RTX3090：

比RTX3080强17%；
比RTX2080Ti强47%；
比RTX2080Super强66%。

在测试过多款生产力软件后，从工作效率角度计算，RTX3090：

比RTX3080强21%；
比RTX2080Ti强58%；
比RTX2080Super强118%。

这就是我最终得出的结论。

（数据更新完毕）

末尾闲话

像STRIX OC这种初期就能软拉23%功耗墙的高端旗舰放在Z490平台里，配合OC 5.3GHz的10900K进行双烤，最终电源端测到全平台功耗840-850W，高端非公RTX3090用户上个1000W高端电源真的不浪费。入手了高端非公还跟着NVIDIA的750W指引去买电源的，甚至还想超频使用的，偶尔给你来两下断电重启可别觉得冤枉。
RTX3090的功耗远不止于此，低端非公的350W与中端的400W显然不是上限，还能继续解开，最终旗舰非公们的功耗墙我预测都会从500W起步。
关于生产力软件提升百分比，这里在更新前提前说一下。我有测PR AE的导出速度，但这里并没有放出，也没有纳入最终的计算，因为它们的结果实在是太相近了，反过来说就是显卡对于PR AE导出速度的影响并不大——它跟本不怎么工作！如果实在想比对，这里就直接放出数据：PR导出：【2080S 00:00:54】【2080Ti 00:00:50】【3080 00:00:39】【3090 00:00:25】，AE导出：【2080S 00:05:03】【2080Ti 00:05:11】【3080 00:05:03】【3090 00:05:01】。看了结果各位也想必明白了，意义真不大。
关于RTX30系的电容选料问题、AIC的PCB设计问题、GPU Bin Down问题，本文不会更新对它们的看法。也许将来在这段事情告一段落后，我会单独开一篇谈谈自己对于本次诸事的浅薄看法，目前我认为还需要观察一段时间，没法很快定论。

推荐阅读

ACCV 2020国际细粒度网络图像识别竞赛即将开赛！

添加极市小助手微信（ID : cvmart2），备注：姓名-学校/公司-研究方向-城市（如：小极-北大-目标检测-深圳），即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群：每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~

△长按添加极市小助手

△长按关注极市平台，获取 最新CV干货

觉得有用麻烦给个在看啦~

登录查看更多

相关内容

4G LTE

关注 3

LTE，长期演进技术（英语：Long Term Evolution，常简写为 LTE），商业宣传上通常被称作 4G LTE，但事实上是 3.5G 下 HSDPA 迈向 4G 的过度版本。也曾经被俗称为 3.9G，直到 2010 年 12 月 6 日国际电信联盟把 LTE Advanced 正式定义为4G。 LTE 是应用于手机及数据卡终端的高速无线通讯标准，该标准基于旧有的 GSM/EDGE 和 UMTS/HSPA 网络技术，并使用调制技术提升网络容量及速度。该标准由3GPP（第三代合作伙伴计划）于 2008 年第四季度于 Release 8 版本中首次提出，并在 Release 9 版本中进行少许改良。

【LinkedIn工程总监洪亮劼】浅谈工业级推荐系统，附36页ppt与视频

专知会员服务

31+阅读 · 2020年10月6日

【NeurIPS2020】通过最大编码率降低原理学习多样和有判别性的表示

专知会员服务

15+阅读 · 2020年9月30日

【CIKM2020-阿里】在线序列广告的用户隐藏状态推断

专知会员服务

25+阅读 · 2020年9月5日

【ICML2020】对比多视角表示学习

专知会员服务

53+阅读 · 2020年6月28日