成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
0
比A100性能高4.5倍!英伟达H100横扫AI推理基准测试
2022 年 9 月 10 日
新智元
新智元报道
编辑:武穆
【新智元导读】
NVIDIA H100 Tensor Core GPU在MLPerf行业
标准
AI基准测试中首次亮相,创下了所有工作负载推理的世界纪录,提供的性能比上一代GPU高4.5 倍。
不久前,英伟达公布了旗下的芯片,在MLPerf行业标准AI基准测试的结果。
根据英伟达的说法,H100(又名 Hopper),提高了所有六个神经网络在每个加速器上的表现标准,比上一代的A100,性能高了4.5倍,创造了所有工作负载推断的世界纪录。
所谓的推理,不同于机器学习 (ML)。
机器学习是创建训练模型并让系统「学习」的,而推理是用于在一系列数据点上运行学习模型,并获得结果。
英伟达认为,这个测试结果确立了H100在单独服务器和离线场景下的吞吐量和速度方面的领先地位,如果用户想要最高性能的高级AI模型,H100是首选。
英伟达为何看重MLPerf测试的结果
MLPerf
是一个行业标准基准系列,由图灵奖得主大卫·帕特森(David Patterson)联合谷歌、英伟达 、英特尔、Meta、浪潮等全球AI领军企业,以及来自哈佛大学、斯坦福大学等学术机构的研究人员创立。
MLPerf可为各种工作负载建模,包括自然语言处理、语音识别、图像分类、医学成像和物体检测等项目。
该基准测试很有用,因为它可以跨越从高端数据中心和云的机器到小规模的边缘计算系统,并且可以为各个供应商的产品提供一致的基准测试,哪怕并非所有子测试中的基准测试都由所有测试人员运行。
它还可以创建用于运行离线、单流或多流测试的场景,这些测试创建一系列 AI 功能来模拟完整工作流管道的真实示例(例如,语音识别、自然语言处理、搜索和推荐、文本转语音等)。
虽然许多厂商认为只运行部分测试(ResNet是最常见的)的结果,是芯片性能的有效指标,比完整的MLPerf更适用。
比如,在上面的图表中也能看到,许多被比较的芯片在MLPerf的其他组件中没有测试结果,因为厂商根本不打算测。
但MLPerf测试依然被业界广泛接受,如果能在MLPerf测试中取得不错的成绩,很少有人会质疑结果的准确性和权威性。
英伟达在市场上还处于领先地位吗?
此次,对于在MLPerf测试中取得的结果,英伟达还是比较满意的。
这意味着,很可能在今年年底之前,英伟达就会首次公开演示H100 GPU。
而且,H100 GPU将参与未来的MLPerf轮次进行训练。
H100能取得如此不俗的表现,部分要归功于英伟达的Transformer Engine。
Transformer Engine使用软件和定制的NVIDIA Hopper Tensor Core技术,旨在加速对由流行的AI模型构建块变压器构建的模型的训练。
这些张量核心可以应用混合的FP8和FP16格式,以显著加速Transformer的AI计算,这种加速有时是数量级的提升,从而最适合手头的任务。
Transformer Engine这样的工具,带来的优势是显而易见的:开发人员能够专注于解决方案,而不是试图为没有相应平台的系统进行低级硬件和相关代码优化。
更重要的是,Transformer Engine这样的工具,体现了英伟达的真正优势——平台方法。
英伟达的许多竞争对手,虽然能为市场提供芯片或系统,但英伟达已经建立了一个强大的生态系统,包括芯片,相关硬件以及针对其芯片和系统优化的完全稳定的软件和开发系统。
用英伟达方面的话说,本轮MLPerf测试上,有70多份参赛作品在NVIDIA平台上运行,例如,Microsoft Azure提交了在其云服务上运行NVIDIA AI的结果。
这表明,NVIDIA AI得到了业界最广泛的机器学习生态系统的支持。
事实上,英伟达的竞争对手英特尔以及高通都强调了平台方法。
而初创公司通常只支持开源选项,这些选项可能与主要供应商提供的功能水平不同。
此外,英伟达还针对特定细分市场优化了框架,为解决方案提供商提供了一个有价值的起点,使解决方案提供商能够以更少的工作量实现更快的上市时间。
而初创AI芯片供应商无法提供这种级别的资源。
当然,英伟达并非没有弱点。
比如,虽然英伟达展示了其芯片与标准英特尔x86处理器的比较,但它没有与英特尔新的Habana Gaudi 2芯片进行比较。
而Habana Gaudi 2芯片可能会显示出高水平的人工智能计算能力,可以接近或超过一些英伟达产品。
另外,英伟达可能不是所有细分市场的NO.1,特别是在低功耗细分市场,像高通这样的公司可能具有优势。
不过,尽管如此,由于英伟达仍然提供最广泛的产品系列,其对完整平台生态系统的重视,使其在人工智能竞赛中处于领先地位,并且竞争对手很难轻易取代。
参考资料:
https://venturebeat.com/ai/what-nvidias-new-mlperf-ai-benchmark-results-really-mean/
https://blogs.nvidia.com/blog/2022/09/08/hopper-mlperf-inference/
登录查看更多
点赞并收藏
0
暂时没有读者
0
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
英伟达(NVIDIA)
关注
25
NVIDIA(全称NVIDIA Corporation,NASDAQ:NVDA,发音:IPA:/ɛnvɪdɪə/,台湾官方中文名为輝達),创立于1993年4月,是一家以设计显示芯片和芯片组为主的半导体公司。NVIDIA亦会设计游戏机核心,例如Xbox和PlayStation 3。NVIDIA最出名的产品线是为个人与游戏玩家所设计的GeForce系列,为专业工作站而设计的Quadro系列,以及为服务器和高效运算而设计的Tesla系列。 NVIDIA的总部设在美国加利福尼亚州的圣克拉拉。是一家无晶圆(Fabless)IC半导体设计公司。"NVIDIA"的读音与英文"video"相似,亦与西班牙文evidia(英文"envy")相似。现任总裁为黄仁勋。
MIT发布《人工智能加速器》2022年度综述论文,详解80+类AI芯片性能优劣
专知会员服务
78+阅读 · 2022年10月12日
《人工智能是战争的未来(但并非是你想的那样)》,美国军事学院陆军网络研究所
专知会员服务
105+阅读 · 2022年5月5日
【AI/ML+6G】22页pdf为你解读AI/ML如何助力6G发展?(附报告)
专知会员服务
38+阅读 · 2022年3月15日
谷歌教你学 AI -机器学习的7步骤
专知会员服务
28+阅读 · 2022年3月13日
非深度学习!普林斯顿、英特尔提出ParNet,速度和准确性显著优于ResNet
专知会员服务
23+阅读 · 2021年11月9日
MIT发布《人工智能加速器》2021年度综述论文,详解80+类AI芯片性能优劣
专知会员服务
65+阅读 · 2021年9月21日
【ACL2020-Facebook AI】大规模无监督跨语言表示学习
专知会员服务
34+阅读 · 2020年4月5日
【阿里巴巴达摩院】TResNet: 高性能的GPU专用架构,GPU-Dedicated Architecture
专知会员服务
33+阅读 · 2020年4月1日
【2020新书】企业级机器学习: Spark XGBoost LightGBM, NLP, Keras深度学习, 367页pdf
专知会员服务
114+阅读 · 2020年2月24日
如何加速NVIDIA gpu上的训练、推理和ML应用?108页ppt,Accelerating training, inference, and ML applications on NVIDIA GPUs
专知会员服务
61+阅读 · 2019年12月29日
登顶全球最权威AI性能基准评测,百度飞桨给分布式训练创造了标杆
机器之心
0+阅读 · 2022年11月18日
推理速度数倍提升,大幅简化多GPU后端部署:Meta发布全新推理引擎AITemplate
机器之心
0+阅读 · 2022年10月4日
PyTorch创始人:Transformer太火很不好,AI易撞墙
机器之心
1+阅读 · 2022年10月3日
急抢A100/H100?传英伟达向台积电下「超级急件」订单
新智元
0+阅读 · 2022年9月20日
MLPerf权威发榜!英伟达「史上最强GPU」H100,被这个12nm芯片碾压
新智元
0+阅读 · 2022年9月9日
参数量1/50,Meta发布110亿参数模型,击败谷歌PaLM
机器之心
0+阅读 · 2022年8月18日
双芯片四芯粒互联,寒武纪发布AI训练卡MLU370-X8:性能超越RTX
机器之心
1+阅读 · 2022年3月21日
AI训练的效率正在超越摩尔定律
AI前线
0+阅读 · 2022年2月23日
只需几个小操作,就能让transformer模型推理速度加3.5倍
机器之心
0+阅读 · 2021年12月30日
英伟达「核弹级」GPU A100不敌AMD?比起算力,CUDA才是核心武器
新智元
0+阅读 · 2021年11月14日
基于逆动力学的汽车最速操纵性能评价与优化
国家自然科学基金
0+阅读 · 2015年12月31日
基于全脸统计学模型和回归器的对遮挡鲁棒的三维人脸特征点定位方法研究
国家自然科学基金
0+阅读 · 2013年12月31日
基于证据推理算法的建筑用能行为理论模型研究
国家自然科学基金
0+阅读 · 2013年12月31日
基于光线追踪机制的三维集成图形处理器体系结构研究
国家自然科学基金
0+阅读 · 2012年12月31日
面向高性能计算应用的双总线型聚合物波导阵列研究
国家自然科学基金
0+阅读 · 2012年12月31日
基于事件曝光模型的云服务测试与调试研究
国家自然科学基金
0+阅读 · 2012年12月31日
面向下一代移动终端的高性能低功耗主存系统结构
国家自然科学基金
0+阅读 · 2012年12月31日
基于机器学习的线程级推测模型和编译优化方法研究
国家自然科学基金
0+阅读 · 2011年12月31日
面向蛋白质结构预测的支持向量机的研究
国家自然科学基金
0+阅读 · 2009年12月31日
基于图形处理器的高性能计算
国家自然科学基金
0+阅读 · 2009年12月31日
A Dynamic Weighted Federated Learning for Android Malware Classification
Arxiv
0+阅读 · 2022年11月23日
Choose your witnesses wisely
Arxiv
0+阅读 · 2022年11月22日
TLP: A Deep Learning-based Cost Model for Tensor Program Tuning
Arxiv
0+阅读 · 2022年11月22日
Explaining YOLO: Leveraging Grad-CAM to Explain Object Detections
Arxiv
0+阅读 · 2022年11月22日
AI Accelerator Survey and Trends
Arxiv
28+阅读 · 2021年9月18日
Domain Generalization in Vision: A Survey
Arxiv
16+阅读 · 2021年7月18日
Graph Learning: A Survey
Arxiv
57+阅读 · 2021年5月3日
Your "Labrador" is My "Dog": Fine-Grained, or Not
Arxiv
27+阅读 · 2021年2月17日
The Book of Why: Review
Arxiv
15+阅读 · 2019年9月30日
KG-BERT: BERT for Knowledge Graph Completion
Arxiv
15+阅读 · 2019年9月11日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
英伟达(NVIDIA)
基准测试
基准
负载
AI
芯片
相关VIP内容
MIT发布《人工智能加速器》2022年度综述论文,详解80+类AI芯片性能优劣
专知会员服务
78+阅读 · 2022年10月12日
《人工智能是战争的未来(但并非是你想的那样)》,美国军事学院陆军网络研究所
专知会员服务
105+阅读 · 2022年5月5日
【AI/ML+6G】22页pdf为你解读AI/ML如何助力6G发展?(附报告)
专知会员服务
38+阅读 · 2022年3月15日
谷歌教你学 AI -机器学习的7步骤
专知会员服务
28+阅读 · 2022年3月13日
非深度学习!普林斯顿、英特尔提出ParNet,速度和准确性显著优于ResNet
专知会员服务
23+阅读 · 2021年11月9日
MIT发布《人工智能加速器》2021年度综述论文,详解80+类AI芯片性能优劣
专知会员服务
65+阅读 · 2021年9月21日
【ACL2020-Facebook AI】大规模无监督跨语言表示学习
专知会员服务
34+阅读 · 2020年4月5日
【阿里巴巴达摩院】TResNet: 高性能的GPU专用架构,GPU-Dedicated Architecture
专知会员服务
33+阅读 · 2020年4月1日
【2020新书】企业级机器学习: Spark XGBoost LightGBM, NLP, Keras深度学习, 367页pdf
专知会员服务
114+阅读 · 2020年2月24日
如何加速NVIDIA gpu上的训练、推理和ML应用?108页ppt,Accelerating training, inference, and ML applications on NVIDIA GPUs
专知会员服务
61+阅读 · 2019年12月29日
热门VIP内容
开通专知VIP会员 享更多权益服务
《人工智能——智能艺术?人机交互与创作实践》最新293页书籍
《生成人工智能对抗性使用对国土安全的影响》美国土安全部最新99页报告
JADC2 如何转变军事行动
《自主武器与未来战争》481页书籍
相关资讯
登顶全球最权威AI性能基准评测,百度飞桨给分布式训练创造了标杆
机器之心
0+阅读 · 2022年11月18日
推理速度数倍提升,大幅简化多GPU后端部署:Meta发布全新推理引擎AITemplate
机器之心
0+阅读 · 2022年10月4日
PyTorch创始人:Transformer太火很不好,AI易撞墙
机器之心
1+阅读 · 2022年10月3日
急抢A100/H100?传英伟达向台积电下「超级急件」订单
新智元
0+阅读 · 2022年9月20日
MLPerf权威发榜!英伟达「史上最强GPU」H100,被这个12nm芯片碾压
新智元
0+阅读 · 2022年9月9日
参数量1/50,Meta发布110亿参数模型,击败谷歌PaLM
机器之心
0+阅读 · 2022年8月18日
双芯片四芯粒互联,寒武纪发布AI训练卡MLU370-X8:性能超越RTX
机器之心
1+阅读 · 2022年3月21日
AI训练的效率正在超越摩尔定律
AI前线
0+阅读 · 2022年2月23日
只需几个小操作,就能让transformer模型推理速度加3.5倍
机器之心
0+阅读 · 2021年12月30日
英伟达「核弹级」GPU A100不敌AMD?比起算力,CUDA才是核心武器
新智元
0+阅读 · 2021年11月14日
相关基金
基于逆动力学的汽车最速操纵性能评价与优化
国家自然科学基金
0+阅读 · 2015年12月31日
基于全脸统计学模型和回归器的对遮挡鲁棒的三维人脸特征点定位方法研究
国家自然科学基金
0+阅读 · 2013年12月31日
基于证据推理算法的建筑用能行为理论模型研究
国家自然科学基金
0+阅读 · 2013年12月31日
基于光线追踪机制的三维集成图形处理器体系结构研究
国家自然科学基金
0+阅读 · 2012年12月31日
面向高性能计算应用的双总线型聚合物波导阵列研究
国家自然科学基金
0+阅读 · 2012年12月31日
基于事件曝光模型的云服务测试与调试研究
国家自然科学基金
0+阅读 · 2012年12月31日
面向下一代移动终端的高性能低功耗主存系统结构
国家自然科学基金
0+阅读 · 2012年12月31日
基于机器学习的线程级推测模型和编译优化方法研究
国家自然科学基金
0+阅读 · 2011年12月31日
面向蛋白质结构预测的支持向量机的研究
国家自然科学基金
0+阅读 · 2009年12月31日
基于图形处理器的高性能计算
国家自然科学基金
0+阅读 · 2009年12月31日
相关论文
A Dynamic Weighted Federated Learning for Android Malware Classification
Arxiv
0+阅读 · 2022年11月23日
Choose your witnesses wisely
Arxiv
0+阅读 · 2022年11月22日
TLP: A Deep Learning-based Cost Model for Tensor Program Tuning
Arxiv
0+阅读 · 2022年11月22日
Explaining YOLO: Leveraging Grad-CAM to Explain Object Detections
Arxiv
0+阅读 · 2022年11月22日
AI Accelerator Survey and Trends
Arxiv
28+阅读 · 2021年9月18日
Domain Generalization in Vision: A Survey
Arxiv
16+阅读 · 2021年7月18日
Graph Learning: A Survey
Arxiv
57+阅读 · 2021年5月3日
Your "Labrador" is My "Dog": Fine-Grained, or Not
Arxiv
27+阅读 · 2021年2月17日
The Book of Why: Review
Arxiv
15+阅读 · 2019年9月30日
KG-BERT: BERT for Knowledge Graph Completion
Arxiv
15+阅读 · 2019年9月11日
大家都在搜
洛克菲勒
自主可控
大规模语言模型
研究报告
基础模型
量化交易
深绿
类脑
主题知识树
GANLab 将GA
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top