突发！英伟达、AMD恐断供高端GPU，中国AI计算或需另起炉灶

会员服务 ·

突发！英伟达、AMD恐断供高端GPU，中国AI计算或需另起炉灶

2022 年 9 月 1 日 新智元

新智元报道

编辑：编辑部

【新智元导读】近日，AMD和英伟达接到消息，美国政府要求其对中国区断供高端GPU。

8月31日晚，集微网突然发布消息称，AMD和英伟达中国区已相继接到总部通知，要对中国区客户断供用于人工智能和数据中心的顶级计算芯片。

AMD方面：

暂停对中国区所有MI100和MI200发货；
统计中国区Ml100已发货量；
统计中国区MI200已发货客户清单和发货明细。

英伟达方面：

暂停对中国区所有客户所有代理商的A100和H100的发货，其它GPU卡不受影响；
各服务器OEM库存的A100可以对各自的行业客户继续交付，英伟达中国区目前没有对OEM发任何Letter。

目前，英伟达H100在今年GTC大会上刚刚发布还未出货。但已经出货2年的A100在最新MLPerf中，打破16项性能记录领跑。

可见，仅英伟达这两款高端GPU的断供，直接打击了智能计算以及AI大模型的训练。

截至发稿前，AMD和英伟达都未予置评。

美国再次加大力度！

遗憾的是，这个消息似乎并不是空穴来风。

根据英伟达向美国证券交易委员会提交的一份文件，美国政府已于8月26日对英伟达下发了通知，对现有的A100和即将推出的H100提出了新的出口管制许可，并立即生效。

此外，DGX或任何其他采用A100或H100和A100X的系统，以及未来任何能够在峰值性能和I/O性能达到或高于A100的，都在新的许可证要求范围之内。

文件显示，该禁令针对的地区为中国大陆、中国香港和俄罗斯。不过，英伟达在俄罗斯并没有付费客户。

英伟达表示，此举可能会影响到H100的开发，以及支持A100现有客户的能力，并可能进一步要求公司将某些业务从中国转移出去。

2022CTC大会H100发布

目前，英伟达正与美国政府接触，试图为公司的内部开发和支持活动寻求豁免。

英伟达发言人也表示，「我们正在与中国客户商讨对策，以满足他们计划或未来购买替代产品的需求。如果客户需要的替代产品不足，我们会为客户寻求豁免或许可证，但不能保证美国政府会批准，或及时回应。」

受该禁令的影响，英伟达股价开盘后下跌近6.6%。

在8月24日英伟达曾预计，第三财季销售额约为59亿美元，然而禁令一出，英伟达第三季度在中国的潜在销售额可能会损失4亿美元，如果客户不想购买替（旧）代（的）产品，而美国政府不及时或拒绝向重要客户发放许可证的话。

此外，据AMD的一位发言人称，美国政府也已经通知他们说要停止向中国出口顶级的人工智能芯片。

AMD表示，新的许可要求将阻止MI250芯片运往中国，但MI100芯片应该不会受到影响。

AMD认为，新规并不会对其业务产生实质性影响。但股价仍在开盘后下跌了。

对国内影响有多大？

近年来，美国不仅针对中国不断地加强芯片的出口限制，并且还试图将制造业带回本土。

拜登已经正式签署《芯片与科学法案》，美国商务部向中国断供了可用于14nm以下先进制程芯片制造的设备，实施了对EDA软件工具的出口管制，且美国正在促成与其他国家的结盟。

而美国此次对英伟达和AMD实施芯片的出口禁令，除了阻碍英伟达在中国高达4亿美元的业务以外，还会影响国内AI领域的研究。

不过目前来看，对消费电子领域的影响并不严重。除了这两家的芯片，还有像高通、联发科、三星等芯片可用。

智能计算

但是，大多数国内服务器离不开这两家都芯片。显然，美国的这番断供就是冲着算力去的，目的就是阻碍中国在人工智能领域领先世界。

建设强大的智算中心就需要高端GPU，如果没有智算，智慧交通、智慧城市、工业互联等众多领域都会受到影响。

因此，芯片断供将会直接影响国内的云计算产业及人工智能产业的发展。

根据6月份最新全球超算TOP500榜单，排在前十的超算中基本上都用到了AMD、英伟达、英特尔的处理器或技术。

其中，中国神威·太湖之光超级计算机用的是我们自主研发的神威26010众核处理器。天河二号超级计算机则是使用基于英特尔集成众核架构的Xeon Phi 31S1P协处理器。

因此，断供AMD和英伟达对我国最有影响力的两大超算并未造成影响。

然而，对于国内提供服务器的企业来讲，就不那么幸运了。服务器都是企业用得多，比如数据中心、云计算。

目前，国内像阿里等公司都在开始自研云原生处理器，这是值得肯定的。

元宇宙

要知道，GPU是元宇宙核心计算资源的底座。未来，元宇宙市场规模或超4700亿美元。

元宇宙中有大量的程序需要计算，构成元宇宙的虚拟内容、区块链网络、人工智能技术都离不开算力的支撑。

没有强大的算力支撑，元宇宙就如同空中楼阁。

因此，元宇宙中更加真实的建模与交互需要更强的算力作为前提，更加说明我们自研GPU的重要性。

AI大模型

另外，如果没有英伟达和AMD等公司的芯片，国内在图像、语音识别以及其他机器学习方面的任务也将受到严重的影响。

2020年大火的GPT-3参数规模达到1750亿，而且，其训练数据集规模也超过500GB。

训练这么大的AI模型，必然会吃很大的算力，仅GPT-3就消耗了10000块GPU，花了30天才完成。

那么，断供高端GPU将如何影响国内AI模型的训练呢？

拿英伟达A100来举例，它的深度学习性能在2021年的实测中可达V100的3.5倍。而在最新的AI芯片跑分大赛结果中，A100打破了16项性能纪录。

相比于「只有」540亿个晶体管的前辈A100，英伟达在H100中装入了800亿个晶体管，并采用了定制的台积电4nm工艺。

在算力上，H100的FP16、TF32以及FP64的性能都是A100的3倍，分别为2000 TFLOPS、1000 TFLOPS和60 TFLOPS。此外，H100还增加了对FP8的支持，算力高达4000 TFLOPS，比A100快6倍。

在AI训练中，如果采用H100来训练GPT-3的话，就可以将速度提升6.3倍，如果结合新的精度、芯片互联技术和软件，则可以提升至9倍。

此外，在新的Hopper架构加持下，大型模型的训练可以在数天甚至数小时内完成。

其中，Transformer Engine可以用2倍于FP16的速度打包和处理FP8数据，于是模型的每一层可以用FP8处理的数据都可以提升2倍的速度。

如果美国真的对高端GPU断供，国产GPU是否有可行的替代方案呢？

国产GPU准备好了吗？

「芯智讯」在一篇较为详尽的总结中表示，从整体来看，目前国产GPU仍处在一个发展的初期。

在图形显卡领域，只有景嘉微取得了一些成绩，但与英伟达和AMD还有较大的差距。

而对于此次断供影响到的高性能计算领域，文章分析称，仅天数智芯、壁仞科技和芯动科技有推出相应的产品。

其中，根据壁仞科技官方公布的数据，BR100在AI算力方面已经超过了英伟达的A100。不过，由于该产品才刚刚推出，所以仍需要市场来检验。

一直以来美国对国内不断打压，国产GPU厂商也在加速自身研发，就是为了在紧要关头能够实现自给自足。

现在，这条自研路仍任重道远。

参考资料：

https://mp.weixin.qq.com/s/V7X2gRVZchHVg9WTrI_P-g

https://laoyaoba.com/n/831077

https://www.reuters.com/technology/nvidia-says-us-has-imposed-new-license-requirement-future-exports-china-2022-08-31/

https://www.reuters.com/technology/amd-says-us-told-it-stop-shipping-top-ai-chip-china-2022-08-31/

登录查看更多

相关内容

英伟达（NVIDIA）

关注 25

NVIDIA（全称NVIDIA Corporation，NASDAQ：NVDA，发音：IPA：/ɛnvɪdɪə/，台湾官方中文名为輝達），创立于1993年4月，是一家以设计显示芯片和芯片组为主的半导体公司。NVIDIA亦会设计游戏机核心，例如Xbox和PlayStation 3。NVIDIA最出名的产品线是为个人与游戏玩家所设计的GeForce系列，为专业工作站而设计的Quadro系列，以及为服务器和高效运算而设计的Tesla系列。 NVIDIA的总部设在美国加利福尼亚州的圣克拉拉。是一家无晶圆（Fabless）IC半导体设计公司。"NVIDIA"的读音与英文"video"相似，亦与西班牙文evidia（英文"envy"）相似。现任总裁为黄仁勋。

《美海军轻型两栖战舰 (LAW) 计划》29页最新报告（2022），美国国会服务处

专知会员服务

45+阅读 · 2022年11月13日

中国“芯科技”新锐企业 50 强

专知会员服务

14+阅读 · 2022年11月12日

《俄罗斯军事预测与分析：战略规划中的军事政治形势和军事潜力》2022最新兰德181页报告

专知会员服务

53+阅读 · 2022年11月11日

2022汽车芯片行业研究报告（附报告）

专知会员服务

47+阅读 · 2022年11月1日