【新智元导读】MLPerf Inference v2.1榜单正式公布!中国AI芯片企业首次超越英伟达「史上最强GPU」H100,以95784 FPS的单卡算力,夺得ResNet-50模型算力全球第一。
9月9日,全球权威AI基准评测MLPerf Inference v2.1榜单公布结果。
中国AI芯片企业首次超越英伟达「史上最强GPU」、未来4nm产品——H100:中国AI芯片明星创业公司——墨芯人工智能(以下简称「墨芯」)S30计算卡以95784 FPS的单卡算力,夺得ResNet-50模型算力全球第一。
MLPerf是业内公认的国际权威AI性能基准评测,由图灵奖得主大卫·帕特森(David Patterson)联合谷歌、英伟达 、英特尔、Facebook、浪潮等全球AI领军企业,以及来自哈佛大学、斯坦福大学等学术机构的研究人员创立。
该测评以其标准严格、测评严谨而著称,英伟达、高通等国际AI芯片企业均携最强产品参加测评,竞争十分激烈,各赛道均有数百项产品提交成绩。
以上数据摘自MLCommons官网MLPerf Inference v2.1测试结果
众所周知,「单卡算力」是检验AI计算产品的「真标准」。
墨芯夺冠项目是数据中心最常用主流模型ResNet-50,该赛道竞争尤为激烈,竞争者包括H100、A100。
S30以ResNet-50 95784 FPS的单卡算力夺得第一,是英伟达未来4nm产品——H100的1.2倍,是A100的2倍。
同时,墨芯S30运行BERT-Large是A100的2倍,仅次于H100,在Bert-large高精度模型(99.9%),单卡算力达3,837 SPS。
从竞争者角度看,墨芯参与的ResNet-50和BERT-Large都是数据中心最常用主流模型,因此竞争尤为激烈。
特别是竞争者包括H100,是英伟达迄今推出的最强大的GPU,据悉使用台积电最新的4nm工艺,可谓「最强王者」。而战胜「最强王者」,足以体现墨芯S30采用12nm,性能已经站在世界顶尖水平。
更值得一提的是,MLPerf的测试要求非常严格:不仅考验各产品算力,同时设置精度要求在99%以上,主要为了考察AI推理精度的高要求对计算性能的影响。
换句话说,参赛厂商无法以牺牲精度的方式换取算力提升,在这种严要求下夺冠,充分表明了墨芯的硬核技术实力。
https://mlcommons.org/en/inference-datacenter-21/
中秋佳节 好书相赠
转眼又是一个中秋,愿所有人中秋快乐,团圆美满!
为感谢大家一直以来对新智元的关注,我们精选了一批AI好书,作为福利放送给大家~
【领取流程】
关注公众号并在本文留言,前30名获赞者将获得价值68元的《智能革命》一本,截止到9月13日,快来评论吧!