Spiking Neural Networks (SNNs) are a promising alternative to traditional deep learning methods since they perform event-driven information processing. However, a major drawback of SNNs is high inference latency. The efficiency of SNNs could be enhanced using compression methods such as pruning and quantization. Notably, SNNs, unlike their non-spiking counterparts, consist of a temporal dimension, the compression of which can lead to latency reduction. In this paper, we propose spatial and temporal pruning of SNNs. First, structured spatial pruning is performed by determining the layer-wise significant dimensions using principal component analysis of the average accumulated membrane potential of the neurons. This step leads to 10-14X model compression. Additionally, it enables inference with lower latency and decreases the spike count per inference. To further reduce latency, temporal pruning is performed by gradually reducing the timesteps while training. The networks are trained using surrogate gradient descent based backpropagation and we validate the results on CIFAR10 and CIFAR100, using VGG architectures. The spatiotemporally pruned SNNs achieve 89.04% and 66.4% accuracy on CIFAR10 and CIFAR100, respectively, while performing inference with 3-30X reduced latency compared to state-of-the-art SNNs. Moreover, they require 8-14X lesser compute energy compared to their unpruned standard deep learning counterparts. The energy numbers are obtained by multiplying the number of operations with energy per operation. These SNNs also provide 1-4% higher robustness against Gaussian noise corrupted inputs. Furthermore, we perform weight quantization and find that performance remains reasonably stable up to 5-bit quantization.


翻译:Spik Neural Networks(SNN)是传统深层学习方法的一个很有希望的替代方法,因为它们进行事件驱动的信息处理。然而,SNNS的一大缺点是高推力延缓。 SNNS的效率可以用压缩方法提高,例如修剪和量化。值得注意的是,SNNS不同于其非喷射的对应方,它的压缩可以导致延缓。在本文中,我们提议对SNNS进行空间和时间修剪。首先,通过对神经神经平均积累的膜潜力进行主要的精度分析,确定层际的重大尺寸。这一步骤可以提高SNNNNNP的效率。此外,SNNNNP可以推断低调,降低指数值。为了进一步降低拉伸缩,通过在培训中逐步缩短时间段来进行时间缩放。网络使用基于回流的直线梯度下降,我们通过直径直调的直径直径直径直线操作来验证CRFAR10和CIFAR100的结果。我们用VGNFAR10和SNFOR的相对精确度进行对比的推算,同时用SNFER IM IM IM IM IM 和SL IML IM IM 继续使用SL IM IML IML IM IM IML IML IML IM IM 继续使用S IML IML IML IML 继续使用S IML IML IM IM IM IM IM IM IM IM IML IML IML IML IM 继续使用S IMS 继续使用 IM IML IML IMS IMS IMS IMS IMS IMS IS IM IM IM IM IM IM IM IM IM IM IM IM IM IS IS IS IS IS 继续 AL IS IS IS IML IML IS IS IS IS IS IS IS IS IS IS AL IS IS IS IS IS IS IS IS IS IS IS IS IS AL IS AL 继续 AL

0
下载
关闭预览

相关内容

【ACML2020】张量网络机器学习:最近的进展和前沿,109页ppt
专知会员服务
54+阅读 · 2020年12月15日
专知会员服务
60+阅读 · 2020年3月19日
BERT 瘦身之路:Distillation,Quantization,Pruning
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
神经网络学习率设置
机器学习研究会
4+阅读 · 2018年3月3日
NIPS 2017:贝叶斯深度学习与深度贝叶斯学习(讲义+视频)
机器学习研究会
36+阅读 · 2017年12月10日
可解释的CNN
CreateAMind
17+阅读 · 2017年10月5日
Highway Networks For Sentence Classification
哈工大SCIR
4+阅读 · 2017年9月30日
Arxiv
0+阅读 · 2021年6月17日
Arxiv
0+阅读 · 2021年6月16日
Arxiv
6+阅读 · 2020年10月8日
VIP会员
相关VIP内容
相关资讯
BERT 瘦身之路:Distillation,Quantization,Pruning
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
神经网络学习率设置
机器学习研究会
4+阅读 · 2018年3月3日
NIPS 2017:贝叶斯深度学习与深度贝叶斯学习(讲义+视频)
机器学习研究会
36+阅读 · 2017年12月10日
可解释的CNN
CreateAMind
17+阅读 · 2017年10月5日
Highway Networks For Sentence Classification
哈工大SCIR
4+阅读 · 2017年9月30日
Top
微信扫码咨询专知VIP会员