RTX 4090将机器学习速度提高3倍?黄仁勋:摩尔定律已死!

2022 年 9 月 25 日 新智元



  新智元报道  

编辑:武穆
【新智元导读】英伟达正式发布RTX40系列显卡后,知乎上,「如何评价RTX40系列显卡」成为热议话题。从讨论内容看,网友对细节的讨论,还是很专业的。

老黄终于在今年的GTC(GPU技术大会)2022上,公布了RTX 40系列GPU的配置。

很快,在知乎上,RTX40系显卡就成了热议话题。


性能高了,功耗也大了


从网友的讨论方向看,对于RTX40系显卡,大家关心的主要就两点: 性能和价格。

对于RTX40系显卡的性能,大家基本买账。

下面这张RTX40 系显卡性能图,一直为网友津津乐道。


一位网友认为,RTX40 系列显卡,从架构和工艺上说,这是NVIDIA自Pascal,也就是10代以来各方面都提升最大的一代。


其他网友对RTX40系列性能的看法,也差不多。

比如,知乎上的一个名为「MebiuW」的科技博主认为,英伟达在这一代消费级显卡Ada Lovelace上用上了台积电的N4工艺,终于不像之前Ampere一样用着落后当时一代的工艺了。

不过,他觉得Ada Lovelace的首发的卡,虽然在理论性能上都是超过3090。但也就4090的提升比较大一些,4080系列无论对比3080还是对比3080Ti,提升都不足2倍。

从核心规格上,12GB的4080更像是3070的替代版本(3070 20T),16GB版本的4080更像是3070Ti的替代版本(22T)。

还有人干脆只放一张图,来表达他对40系显卡性能的看法:


总而言之,尽管在一些细节上,大家的看法有差别,但在一件事上,大家达成了共识:旗舰RTX 4090性价比最高。


也许是RTX 4090的性能实在让人印象深刻,外网Reddit甚至有人在讨论,RTX 4090的cuda内核增加了50%,时钟速度提高了50%,如果再考虑到RTX 4090其他方面的优化,有了RTX 4090的加持,能不能将机器学习速度提高2-3倍?


从下面留言看,外国网友显然没这么乐观。

一位叫「Michael_Aut」的网友评论道:「考虑到Roofline 模型(屋顶线模型),很多事情都受到内存吞吐量的约束,RTX 4090对机器学习没有那么大的推动作用。」

他特意用参数来做进一步说明。


最后,这位网友总结道:「是的,我不会期望新芯片能在任务中有更好的表现。实际上,从3080切换到12GB 4080时,性能说不定会出现一些退步。」

另一个取名「pommedeterresautee」的网友说:

「GPU编程中的大多数低效率都与从全局内存(DRAM)访问数据有关。对于e2e性能而言,速度快2倍的HBM3肯定与更快的计算速度一样重要。更大的l2缓存也会有所帮助。

只有像matmul和conv这样的张量收缩运算才能从DL中更快的计算中受益。

此外,如果使用新的fp8格式IRL,它可能会产生差异。Int8 quant很难使用,很少有人能够在prod等中部署它。」

当然,RTX40系列显卡的性能虽然总体上差强人意,但并非各方面都让人满意。

比如,RTX40系列显卡的功耗,就遭到了很多人的吐槽。

RTX 4090、RTX 4080(16G)、RTX 4080(12G)这三款显卡的功耗,分别为450W、320W和285W,系统电源功率要求分别为850W、750W和 700W。

考虑到RTX30系列显卡的功耗已经不低了,升级后的RTX40系列显卡功耗还在增加, 难怪一位叫「老冯数码」的知乎网友戏称英伟达是「国家电网合作伙伴」。

不过,在另一大槽点面前,功耗什么的都是浮云。

在价格面前,一切都显得不重要


同性能相比,知乎上,大家对显卡价格的讨论要多得多。

啊,不,更准确地说,是吐槽要多得多。

一个网友说,对于英伟达的RTX 40系显卡,他只想说三点,定价离谱,定价离谱,定价离谱。


而一个叫「星话大白」的知乎网友,则站在游戏玩家的角度说,黄老板把原本的4070改成4080,价格提升84%,哪个玩家还买?至于30系新卡,他是不打算帮英伟达清库存了。

还有人专门做了一张表,让这次涨价变得更加醒目:


除了吐槽,有人对40系显卡的价格,还没有完全悲观。

一个叫「誓约胜利之剑」的网友说,「30系当初虽然定的低,但是发售后到今年以前,也从没按照原价卖过,定价只是官方觉得值这个价,具体卖多少取决于用户觉得值多少,至少30系目前矿卡存量如此巨大的情况,40系破发速度应该不会慢」。

看完网友们的吐槽,再看看老黄是怎么说的。

在公布RTX 40系列显卡后,针对显卡太贵,英伟达CEO黄仁勋回应道:

「一块12英寸的(硅)晶圆现在比昨天贵得多,而且不是贵了一点点,而是贵了很多。摩尔定律已死。根据摩尔定律,在相同的成本下,性能翻倍或者在相同的性能下,成本减半,这种能力已经不复存在。它完全结束了,因此芯片的成本会随着时间的推移而下降的想法,已是过去的事了。」


也许,老黄涨价真是迫不得已吧。

参考资料:

https://www.zhihu.com/question/554597854
https://www.reddit.com/r/MachineLearning/comments/xjt129/d_can_we_expect_rtx_4090_to_have_23x_machine/



登录查看更多
0

相关内容

知乎是中文互联网最大的知识社交平台,拥有认真、专业和友善的独特氛围,连接各行各业的精英。用户分享着彼此的专业知识、经验和见解,为中文互联网源源不断地提供高质量的信息。

唐杉博士:人工智能芯片发展及挑战
专知会员服务
48+阅读 · 2021年12月4日
模型压缩究竟在做什么?我们真的需要模型压缩么?
专知会员服务
28+阅读 · 2020年1月16日
【Google论文】ALBERT:自我监督学习语言表达的精简BERT
专知会员服务
24+阅读 · 2019年11月4日
深度神经网络模型压缩与加速综述
专知会员服务
129+阅读 · 2019年10月12日
AI训练的效率正在超越摩尔定律
AI前线
0+阅读 · 2022年2月23日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年11月22日
Arxiv
0+阅读 · 2022年11月21日
Arxiv
13+阅读 · 2021年3月3日
Arxiv
20+阅读 · 2019年11月23日
Arxiv
23+阅读 · 2017年3月9日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员