【紫冬声音】量化神经处理芯片是边缘计算的答案吗?

2019 年 5 月 6 日 中国自动化学会

【紫冬观点】如何结合各企业实际及产品的特性,与客户协同创新,探索具体的解决方案,最终为企业、为社会创造价值,才是边缘计算的答案。中科院自动化所程健研究员认为定点量化计算方式是关键的一步。

边缘计算随着人工智能和物联网的高速发展,已经成为科技界、学术界、商界竞相追捧的热门领域。特别是随着智能驾驶、智能安防、智慧商业等行业对终端AI技术能力的要求越来越高,就更需要背后的深度神经网络在算法层面、应用层面不断创新。

0 1
边缘计算是大趋势

深度神经网络的训练与应用只能在高性能的计算机集群上进行,为此各大科技巨头们都搭建了高性能深度学习平台来处理海量数据。所以最初人们对人工智能和物联网的规划是,大量的数据在云端的数据中心被分析并决策后,再将结果发还给终端。也就是说,云端负责人工智能的部分,边缘端负责数据采集及执行。


但在实际应用中,在云端做智能处理的设想遇到很多问题。

首先,数据传输成本高。随着数据量激增,传输带宽压力也不断增加,边缘端的无线传输模块必须支持高速无线传输,这就需要更大的功耗,这与边缘端低功耗的需求是冲突的。

其次,无法接受网络延时。许多终端应用场景对延时非常敏感,比如自动驾驶、智能安防等场景下的网络传输带来的延时(几十毫秒、几秒甚至掉线)是无法被接受的。

还有,工业物联网中对于安全和隐私的需求,也使得云计算在物联网时代的发展受限。边缘计算可以保护隐私,并且做到自主操作,无需依赖网络连接情况。

边缘计算可以很好地解决这些问题,根据实际应用需求,边缘端既可以独立作为智能处理模块,也可以和云端配合(边缘端做一些分析处理和过滤,再交给云端)。这样的解决方案在延时、带宽和功耗等方面都有明显优势。因此,边缘计算是智能化发展的必经之路。

0 2
边缘计算的挑战和应对措施

边缘计算在实际应用终端需要深度神经网络满足存储占用小、网络精度高、计算速度快、电量消耗低、低延时等诸多条件才能真正发挥作用,因此,边缘计算的技术核心是高算力、低成本、体积小、低功耗、低延时

高算力容易理解,随着深度神经网络模型变得越来越复杂,其参数和运行时间也相应增加(以AlexNet为例,该神经网络包含超过六千万个参数,对于单幅图像进行分类的过程就涉及到多达7.3亿次浮点运算)。出于成本和体积的考虑,边缘端不宜加DRAM(动态随机存储);要实现低功耗、低延时,则需要考虑内存内计算——这样既可减少DRAM,也可以节省内存存取的额外开销,但同样首先需要减少网络计算量。

由此可知,如何解决深度神经网络的加速与压缩,是边缘计算实现落地的核心问题之一

同时,如何在网络精度保持不变或略有下降的前提下减少网络的计算量和存储,从而实现更加有效的加速压缩,也存在着许多困难和挑战

有些压缩方法,虽然能降低存储,但由于其特殊存储方式,需要解码操作后才能用于网络计算,该类压缩方法只能降低网络对磁盘的占用,不能减少网络对内存的消耗,因此不能降低功耗,也没有真正做到加速。

对于目前基于CPU的计算平台,许多加速方法虽然能达到很高理论加速比,但实际加速效果远低于理论。以网络稀疏的加速方法为例,由于大部分元素为零,因此理论上有效计算量小,但由于无规则稀疏,非零元素在内存不连续,因此仍然需要频繁访问内存。

除此之外,内存内计算面临的挑战是,目前内存内计算的实现方案本质上是做模拟计算,因此计算精度有限,浮点32位的高精度(神经网络普遍使用全精度)是无法实现的。

0 3
定点量化计算方式的明显优势

面对以上挑战,定点量化的方式表现出明显优势,体现在三个方面。一、网络在训练好后,实际应用中并不需要全精度,而量化恰是用更低的数值精度实现神经网络的加速压缩;二、量化的方式有多种,但由于定点量化在硬件如FPGA上能够取得很高的运行效率,因此更为有效;三、使用比特位数越低,加速效果越明显。

然而,目前常用的定点量化方法,尤其是当量化比特数非常低的时候,如1比特或者2比特量化,很难达到与全精度(FP32)相近的性能,这也是量化技术发展过程中所面临的挑战。

那么,中国科学院自动化研究所南京人工智能芯片创新研究院(AiRiA研究院)的量化神经处理芯片是如何解决以上问题的?

中科院自动化研究所基于十几年对量化处理技术的积累,形成了独具优势的量化模型压缩处理技术,可以极大简化整个计算过程,且与全精度性能结果对比,几乎没有精度损失。

基于中科院自动化所的量化处理技术,AiRiA研究院开发出量化神经处理器QNPU架构,并实现了支持4比特、2比特甚至任意1比特的量化处理技术,达到国际领先水平。基于QNPU架构,AiRiA研究院的芯片团队自主开发了适合多种应用场景的量化神经处理芯片Watt-A1, 将QNPU的优势发挥到极致。

在QNPU架构下,大规模神经网络可实现在片上计算,从而减少甚至无需访问外部存储器,解决了需要极大功耗、带宽和体积成本的"内存墙"难题,使得QNPU可以满足多种边缘计算场景的需求,在满足低成本、低功耗、低延时的条件下,仍然可以保持高算力,且精度几乎没有损失。

边缘计算是未来的重要趋势,能很好地应对这些技术挑战,是关键的第一步。而如何结合各企业实际及产品的特性,与客户协同创新,探索具体的解决方案,最终为企业、为社会创造价值,才是边缘计算的答案。

来源:中国科学院自动化研究所

往期文章推荐

🔗【重要通知】关于开展2019年度中国自动化学会会士候选人提名工作的通知

🔗【CAA通知】中国自动化学会华东六省一市学术年会报名开始!

🔗【重要通知】关于2019年度CAA科学技术奖励推荐工作的通知

🔗【重要通知】关于开展第六届杨嘉墀科技奖评奖活动的通知

🔗【CAA预告】“智能物联网”讲习班活动预通知

🔗【重要通知】关于开展第五届中国自动化学会青年科学家奖推荐工作的通知

🔗【会议预告】关于中国光谷人工智能大会暨企业家高峰论坛活动开始的通知(内附征文及其他详情)

🔗【重要通知】关于2019年度CAA高等教育教学成果奖推荐工作的通知

🔗【重要通知】关于面向各分支机构、期刊编辑部征集2019中国自动化大会专题研讨会(Workshop)的预通知

🔗【重要通知】关于开展2019年CAA优秀博士学位论文奖励及推荐工作的通知

🔗【CAC 2019】2019中国自动化大会征文通知

🔗【CAA】中国自动化学会选举产生第十一届理事会领导机构(内附名单)

“阅读原文” 了解更多资讯
登录查看更多
0

相关内容

边缘计算(英语:Edge computing),又译为边缘计算,是一种分散式运算的架构,将应用程序、数据资料与服务的运算,由网络中心节点,移往网络逻辑上的边缘节点来处理[1]。边缘运算将原本完全由中心节点处理大型服务加以分解,切割成更小与更容易管理的部分,分散到边缘节点去处理。边缘节点更接近于用户终端装置,可以加快资料的处理与传送速度,减少延迟。在这种架构下,资料的分析与知识的产生,更接近于数据资料的来源,因此更适合处理大数据。
【Google】利用AUTOML实现加速感知神经网络设计
专知会员服务
30+阅读 · 2020年3月5日
【经典书】Python计算机视觉编程,中文版,363页pdf
专知会员服务
140+阅读 · 2020年2月16日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
107+阅读 · 2020年1月2日
【文献综述】边缘计算与深度学习的融合综述论文
专知会员服务
166+阅读 · 2019年12月26日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
138+阅读 · 2019年12月12日
【BAAI|2019】类脑神经网络技术及其应用,鲁华祥(附pdf)
专知会员服务
30+阅读 · 2019年11月21日
深度神经网络模型压缩与加速综述
专知会员服务
129+阅读 · 2019年10月12日
【边缘计算】边缘计算面临的问题
产业智能官
17+阅读 · 2019年5月31日
2018年边缘计算行业研究报告
行业研究报告
12+阅读 · 2019年4月15日
边缘计算(一)——边缘计算的兴起
大数据和云计算技术
12+阅读 · 2018年12月25日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
19+阅读 · 2018年11月27日
已删除
将门创投
7+阅读 · 2018年11月5日
【物联网】5G时代的智能边缘计算AI-EC平台
产业智能官
6+阅读 · 2017年10月9日
解析京东大数据下高效图像特征提取方案
京东大数据
4+阅读 · 2017年9月29日
边缘计算:万物互联时代新型计算模型
计算机研究与发展
14+阅读 · 2017年5月19日
Arxiv
5+阅读 · 2020年3月16日
Arxiv
3+阅读 · 2018年6月1日
Arxiv
6+阅读 · 2018年2月28日
VIP会员
相关VIP内容
【Google】利用AUTOML实现加速感知神经网络设计
专知会员服务
30+阅读 · 2020年3月5日
【经典书】Python计算机视觉编程,中文版,363页pdf
专知会员服务
140+阅读 · 2020年2月16日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
107+阅读 · 2020年1月2日
【文献综述】边缘计算与深度学习的融合综述论文
专知会员服务
166+阅读 · 2019年12月26日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
138+阅读 · 2019年12月12日
【BAAI|2019】类脑神经网络技术及其应用,鲁华祥(附pdf)
专知会员服务
30+阅读 · 2019年11月21日
深度神经网络模型压缩与加速综述
专知会员服务
129+阅读 · 2019年10月12日
相关资讯
【边缘计算】边缘计算面临的问题
产业智能官
17+阅读 · 2019年5月31日
2018年边缘计算行业研究报告
行业研究报告
12+阅读 · 2019年4月15日
边缘计算(一)——边缘计算的兴起
大数据和云计算技术
12+阅读 · 2018年12月25日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
19+阅读 · 2018年11月27日
已删除
将门创投
7+阅读 · 2018年11月5日
【物联网】5G时代的智能边缘计算AI-EC平台
产业智能官
6+阅读 · 2017年10月9日
解析京东大数据下高效图像特征提取方案
京东大数据
4+阅读 · 2017年9月29日
边缘计算:万物互联时代新型计算模型
计算机研究与发展
14+阅读 · 2017年5月19日
Top
微信扫码咨询专知VIP会员