浅析图像视频类AI芯片的灵活度

2018 年 1 月 12 日 机器学习研究会

兼容性和灵活度是芯片快速杀入新市场、扩大市场范围、快速适应客户需求,减少开发周期的关键特性。目前深度学习的网络结构已走向了多样化,出现了大量的算法变种、更多的算子和复杂层次结构,这对芯片的支撑灵活度能力提出了挑战。本文通过列举目前图像视频类的典型算法、典型网络结构、典型平台和接口等方面来分析AI芯片的灵活度范围。


目前,DNN加速器会收敛于三类形态,第一类是支持通用运算的DSP或者GPU,它既可以实现神经网络运算,也可以实现其他数学运算或者通用程序,例如图像处理和语音处理,其典型特征是具有通用指令集和支持类C编程,如OpenCL;第二类是适用于通用数学运算的可编程架构,控制流程往往收敛于图计算表达或者数据流图,其特点是可以支持通用数学计算算子,也称作计算原语;第三类是针对若干典型神经网络结构设计的专用处理器或加速器,具有很高的能效,但没有考虑处理其他类型的运算。要了解神经网络的基本算子,可以参考“从NNVM和ONNX看AI芯片的基础运算算子”。第一类和第三类往往具有一个数量级甚至两个数量级的性能差异。而一般做到第二类才能更容易的支持灵活的训练算法(而不仅仅是推理或单一训练算法)。各个类别的典型代表如表所示。


表: 由最灵活到最不灵活的三类加速器

在此不区分芯片还是IP

注1: 具体可以参考唐博士的“AI/ML/DL ICs and IPs”列表中“Traditional IP Vendors”部分。

注2: 由GraphCore公开资料推测。


值得注意的是,三者没有明显的界限,厂商产品可能迅速更新,扩充灵活度后,第三类也会扩展成前两类。另外,国内厂商的设计第三类较多,但也有前两类设计出现,此处未列出国内的设计。

由于篇幅受限,本文仅讨论灵活度最低的一个类别,即仅用于神经网络的加速器。另外本文只考虑推理(Inference)而不考虑训练,主要关注视频(图像)类应用。此处,我们将结合现今CNN的各种网络拓扑结构和参数使用情况,提供一个灵活度参考表。

1. 卷积算子的参数覆盖需求

二维卷积操作是深度学习中最重要的操作,具有平移不变性,且相比MLP而言具有很少的参数量而不易训练过拟合。这使得深度学习之所以取得图像处理性能的飞跃提升的关键。卷积网的参数较多,总结起来如下表所示。


转自:StarryHeavensAbove


完整内容请点击“阅读原文”

登录查看更多
1

相关内容

基于小样本学习的图像分类技术综述
专知会员服务
148+阅读 · 2020年5月6日
生物数据挖掘中的深度学习,诺丁汉特伦特大学
专知会员服务
67+阅读 · 2020年3月5日
MIT公开课-Vivienne Sze教授《深度学习硬件加速器》,86页ppt
深度神经网络模型压缩与加速综述
专知会员服务
128+阅读 · 2019年10月12日
SFFAI分享 | 常建龙:基于关系的深度学习【附PPT与视频资料】
人工智能前沿讲习班
6+阅读 · 2019年7月1日
HAN:基于双层注意力机制的异质图深度神经网络
黑龙江大学自然语言处理实验室
19+阅读 · 2019年5月7日
大数据安全技术浅析
计算机与网络安全
14+阅读 · 2019年4月24日
深度学习之视频图像压缩
论智
13+阅读 · 2018年6月15日
深度学习背景下的神经网络架构演变
极市平台
6+阅读 · 2018年1月25日
10个深度学习软件的安装指南(附代码)
数据派THU
17+阅读 · 2017年11月18日
手把手教你安装深度学习软件环境(附代码)
数据派THU
4+阅读 · 2017年10月4日
从零开始:深度学习软件环境安装指南
机器之心
6+阅读 · 2017年10月2日
解析京东大数据下高效图像特征提取方案
京东大数据
4+阅读 · 2017年9月29日
从Face ID说起,浅析人脸识别之刷脸技术
互联网架构师
6+阅读 · 2017年9月25日
TResNet: High Performance GPU-Dedicated Architecture
Arxiv
8+阅读 · 2020年3月30日
Neural Response Generation with Meta-Words
Arxiv
6+阅读 · 2019年6月14日
Neural Approaches to Conversational AI
Arxiv
8+阅读 · 2018年12月13日
Arxiv
4+阅读 · 2018年11月7日
Arxiv
4+阅读 · 2018年5月4日
Arxiv
3+阅读 · 2017年12月14日
VIP会员
相关资讯
SFFAI分享 | 常建龙:基于关系的深度学习【附PPT与视频资料】
人工智能前沿讲习班
6+阅读 · 2019年7月1日
HAN:基于双层注意力机制的异质图深度神经网络
黑龙江大学自然语言处理实验室
19+阅读 · 2019年5月7日
大数据安全技术浅析
计算机与网络安全
14+阅读 · 2019年4月24日
深度学习之视频图像压缩
论智
13+阅读 · 2018年6月15日
深度学习背景下的神经网络架构演变
极市平台
6+阅读 · 2018年1月25日
10个深度学习软件的安装指南(附代码)
数据派THU
17+阅读 · 2017年11月18日
手把手教你安装深度学习软件环境(附代码)
数据派THU
4+阅读 · 2017年10月4日
从零开始:深度学习软件环境安装指南
机器之心
6+阅读 · 2017年10月2日
解析京东大数据下高效图像特征提取方案
京东大数据
4+阅读 · 2017年9月29日
从Face ID说起,浅析人脸识别之刷脸技术
互联网架构师
6+阅读 · 2017年9月25日
相关论文
TResNet: High Performance GPU-Dedicated Architecture
Arxiv
8+阅读 · 2020年3月30日
Neural Response Generation with Meta-Words
Arxiv
6+阅读 · 2019年6月14日
Neural Approaches to Conversational AI
Arxiv
8+阅读 · 2018年12月13日
Arxiv
4+阅读 · 2018年11月7日
Arxiv
4+阅读 · 2018年5月4日
Arxiv
3+阅读 · 2017年12月14日
Top
微信扫码咨询专知VIP会员