AI芯片评测如何与时俱进?地平线提出全新MAPS评测方法,帮助用户理解AI芯片性能

2020 年 8 月 11 日 量子位
允中 发自 凹非寺
量子位 编辑 | 公众号 QbitAI

AI芯片性能该如何评估?目前业界内有两种:

一是峰值算力,它反映AI芯片理论上的最大算力,但却不能反映其在实际场景中的处理能力;

二是目前行业知名的基准测试组织MLPerf,用传统AI模型的运算时间来衡量芯片的速度,但是其采用的模型难以跟上当今快速演进的算法。

那么,业界有没有一个与时俱进的,能够有效衡量芯片AI性能的评测方法呢?

在中国计算机学会(CCF)主办的2020全球人工智能和机器人峰会上,地平线联合创始人兼技术副总裁黄畅提出了一个全新的概念——MAPS (Mean Accuracy-guaranteed Processing Speed),即“在精度有保障范围内的平均处理速度”。

它的意思是在精度有保障的范围测试平均效能如何,得到一个全面、完整、客观、真实的评估。以此来作为评估芯片AI真实性能的标准。

历史上有很多常用的芯片性能评估指标。

传统上,CPU有MIPS,GPU有Textur和Pixel。在高性能计算上,GPU开始使用TFLOPS,即每秒浮点运算次数。进入到NPU,也就是用于支持AI计算的时代,大家普遍使用TOPS。

这是常规的性能评估方式,无一例外的它都能反映出这颗处理器、芯片所处的应用场景中的特点、需求。

但是TOPS是不是能够真实的反映芯片的AI性能?

在下面这张图中有两颗比较主流的AI芯片,一颗主流芯片有11.4TOPS的算力,另外一颗芯片有4TOPS的AI算力,都是它们的峰值算力。

但在实际使用过程中,二者的利用率差异是非常大的。11.4TOPS算力的芯片在多数情况下,甚至还不及4TOPS算力的芯片。

这里面有很多原因,有算法本身的特点,比如说数据的重复性比较差导致。但是往往根因是在于这些芯片的计算架构,它的设计特点不能够很好地反映这些算法发展的趋势。

比如AlphaGo,它的训练的量从2012年到2019年提升了7个数量级。还有ImageNet,近年来,这项测试的精度基础趋近饱和,业界开始关注计算的效率,提出了很多轻量级模型。

与此同时,摩尔定律已经逐渐失效,如果还用传统的算力指标,就无法跟上时代,更不能反映算法提升在AI芯片中的作用。

所以如何评估芯片的AI性能,黄畅认为应该换一个角度,从准、快、省这三个维度来看。

准是反映实际需求任务上的算法精度,比如说图像分类里面用Top-1或者Top-5的精度判断它是不是准,还有COCO里面可以用mAP指标描述它,不同的任务里面,在学术界已经有比较多共识

快通常有两个维度,一个是延迟,一个是吞吐率。前者更侧重于处理单个任务的最快反应时间,后者应用于你可以在服务器层面上用最大的处理方式处理它的吞吐率。

省就是看它的成本和功耗。

前面提到的MLPerf就只看芯片的“快”,它只选取少数模型,在精度相同的条件下比谁的速度快,但是它采用的模型都是三年前的经典模型,无法体现高效能算法的进步。

如果我们放下所有的成见,包容所有的模型选择,只关注芯片跑得多准以及跑得多快。那是不是一个更有包容性、更开放的评测方法呢?

为了打破传统性能评估的困境,地平线提出了MAPS。

黄畅认为,相比传统的测试标准,MAPS有六大创新点:

  1. 能够可视化芯片的Benchmark,通过可视化的图形更精确的表达;

  2. 关注真实、面向结果的需求,只在乎精度和速度,不在乎中间任何关于算法的取舍和选择;

  3. 可以统一表示精度与速度,关注主流精度区间。

  4. 隐藏与最终结果无关的中间变量,包括模型、输入大小、批处理的量是多大;

  5. 通过这种方法可以在算力之外帮助用户理解这个芯片到底能跑多快以及多好;

  6. 可以引导客户如何用最优的方式使用芯片。

长期致力于AI芯片的软硬件研发和商业落地的地平线,此次提出MAPS芯片AI性能评测方法,为行业提供一个能帮助用户更好理解芯片AI性能的角度。

地平线认为,这个评测方法最重要的意义,是鼓励行业树立对正确目标的统一认知,形成合力,更好地协同推动AI芯片产业发展。

地平线希望未来能有更多的软件、算法工作者,在MAPS评估指导体系的启发下,从自己最擅长的能力上持续推动AI芯片能力的发挥。

每天5分钟,抓住行业发展机遇

如何关注、学习、用好人工智能? 

每个工作日,量子位AI内参精选全球科技和研究最新动态,汇总新技术、新产品和新应用,梳理当日最热行业趋势和政策,搜索有价值的论文、教程、研究等。

同时,AI内参群为大家提供了交流和分享的平台,更好地满足大家获取AI资讯、学习AI技术的需求。扫码即可订阅:

加入AI社群,与优秀的人交流


量子位 QbitAI · 头条号签约作者


վ'ᴗ' ի 追踪AI技术和产品新动态


喜欢就点「在看」吧 !


登录查看更多
0

相关内容

机器学习的可解释性
专知会员服务
176+阅读 · 2020年8月27日
专知会员服务
46+阅读 · 2020年8月20日
鲁棒模式识别研究进展
专知会员服务
41+阅读 · 2020年8月9日
【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型
专知会员服务
26+阅读 · 2020年5月7日
轻量级神经网络架构综述
专知会员服务
97+阅读 · 2020年4月29日
【天津大学】知识图谱划分算法研究综述
专知会员服务
110+阅读 · 2020年4月27日
专知会员服务
45+阅读 · 2020年3月6日
【Google】利用AUTOML实现加速感知神经网络设计
专知会员服务
30+阅读 · 2020年3月5日
社区分享|如何让模型在生产环境上推理得更快
ECCV2018|ShuffleNetV2:轻量级CNN网络中的桂冠
极市平台
7+阅读 · 2018年11月5日
周志华与「深度森林」
网易智能菌
7+阅读 · 2018年8月2日
业界 | 华为推出新型HiSR:移动端的超分辨率算法
机器之心
7+阅读 · 2017年11月24日
Arxiv
3+阅读 · 2018年8月17日
VIP会员
相关VIP内容
机器学习的可解释性
专知会员服务
176+阅读 · 2020年8月27日
专知会员服务
46+阅读 · 2020年8月20日
鲁棒模式识别研究进展
专知会员服务
41+阅读 · 2020年8月9日
【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型
专知会员服务
26+阅读 · 2020年5月7日
轻量级神经网络架构综述
专知会员服务
97+阅读 · 2020年4月29日
【天津大学】知识图谱划分算法研究综述
专知会员服务
110+阅读 · 2020年4月27日
专知会员服务
45+阅读 · 2020年3月6日
【Google】利用AUTOML实现加速感知神经网络设计
专知会员服务
30+阅读 · 2020年3月5日
Top
微信扫码咨询专知VIP会员