MLPerf权威发榜！英伟达「史上最强GPU」H100，被这个12nm芯片碾压

会员服务 ·

MLPerf权威发榜！英伟达「史上最强GPU」H100，被这个12nm芯片碾压

2022 年 9 月 9 日 新智元

新智元报道

编辑：好困

【新智元导读】MLPerf Inference v2.1榜单正式公布！中国AI芯片企业首次超越英伟达「史上最强GPU」H100，以95784 FPS的单卡算力，夺得ResNet-50模型算力全球第一。

9月9日，全球权威AI基准评测MLPerf Inference v2.1榜单公布结果。

中国AI芯片企业首次超越英伟达「史上最强GPU」、未来4nm产品——H100：中国AI芯片明星创业公司——墨芯人工智能（以下简称「墨芯」）S30计算卡以95784 FPS的单卡算力，夺得ResNet-50模型算力全球第一。

MLPerf是业内公认的国际权威AI性能基准评测，由图灵奖得主大卫·帕特森（David Patterson）联合谷歌、英伟达、英特尔、Facebook、浪潮等全球AI领军企业，以及来自哈佛大学、斯坦福大学等学术机构的研究人员创立。

该测评以其标准严格、测评严谨而著称，英伟达、高通等国际AI芯片企业均携最强产品参加测评，竞争十分激烈，各赛道均有数百项产品提交成绩。

以上数据摘自MLCommons官网MLPerf Inference v2.1测试结果

墨芯首次参赛，单卡算力全球第一

众所周知，「单卡算力」是检验AI计算产品的「真标准」。

墨芯夺冠项目是数据中心最常用主流模型ResNet-50，该赛道竞争尤为激烈，竞争者包括H100、A100。

S30以ResNet-50 95784 FPS的单卡算力夺得第一，是英伟达未来4nm产品——H100的1.2倍，是A100的2倍。

同时，墨芯S30运行BERT-Large是A100的2倍，仅次于H100，在Bert-large高精度模型（99.9%），单卡算力达3,837 SPS。

值得强调的是此次是「12nm」战胜「4nm」。

从竞争者角度看，墨芯参与的ResNet-50和BERT-Large都是数据中心最常用主流模型，因此竞争尤为激烈。

特别是竞争者包括H100，是英伟达迄今推出的最强大的GPU，据悉使用台积电最新的4nm工艺，可谓「最强王者」。而战胜「最强王者」，足以体现墨芯S30采用12nm，性能已经站在世界顶尖水平。

精度要求99%以上，经受严格检验

更值得一提的是，MLPerf的测试要求非常严格：不仅考验各产品算力，同时设置精度要求在99%以上，主要为了考察AI推理精度的高要求对计算性能的影响。

换句话说，参赛厂商无法以牺牲精度的方式换取算力提升，在这种严要求下夺冠，充分表明了墨芯的硬核技术实力。

参考资料：

https://mlcommons.org/en/inference-datacenter-21/

元宇宙新月圆

中秋佳节好书相赠

转眼又是一个中秋，愿所有人中秋快乐，团圆美满！

为感谢大家一直以来对新智元的关注，我们精选了一批AI好书，作为福利放送给大家~

【领取流程】

关注公众号并在本文留言，前30名获赞者将获得价值68元的《智能革命》一本，截止到9月13日，快来评论吧！

登录查看更多

相关内容

英伟达（NVIDIA）

关注 0

NVIDIA（全称NVIDIA Corporation，NASDAQ：NVDA，发音：IPA：/ɛnvɪdɪə/，台湾官方中文名为輝達），创立于1993年4月，是一家以设计显示芯片和芯片组为主的半导体公司。NVIDIA亦会设计游戏机核心，例如Xbox和PlayStation 3。NVIDIA最出名的产品线是为个人与游戏玩家所设计的GeForce系列，为专业工作站而设计的Quadro系列，以及为服务器和高效运算而设计的Tesla系列。 NVIDIA的总部设在美国加利福尼亚州的圣克拉拉。是一家无晶圆（Fabless）IC半导体设计公司。"NVIDIA"的读音与英文"video"相似，亦与西班牙文evidia（英文"envy"）相似。现任总裁为黄仁勋。

「分布式机器学习系统网络性能优化」研究进展

专知会员服务

28+阅读 · 2022年10月1日

哈佛肯尼迪学院：中美技术争锋-从AI到芯片（附52页报告）

专知会员服务

44+阅读 · 2022年8月12日

NAACL 2022论文奖项公布：5篇论文斩获最佳

专知会员服务

24+阅读 · 2022年7月1日

《人工智能是战争的未来（但并非是你想的那样）》，美国军事学院陆军网络研究所

专知会员服务

106+阅读 · 2022年5月5日