Channel pruning is one of the major compression approaches for deep neural networks. While previous pruning methods have mostly focused on identifying unimportant channels, channel pruning is considered as a special case of neural architecture search in recent years. However, existing methods are either complicated or prone to sub-optimal pruning. In this paper, we propose a pruning framework that adaptively determines the number of each layer's channels as well as the wights inheritance criteria for sub-network. Firstly, evaluate the importance of each block in the network based on the mean of the scaling parameters of the BN layers. Secondly, use the bisection method to quickly find the compact sub-network satisfying the budget. Finally, adaptively and efficiently choose the weight inheritance criterion that fits the current architecture and fine-tune the pruned network to recover performance. AdaPruner allows to obtain pruned network quickly, accurately and efficiently, taking into account both the structure and initialization weights. We prune the currently popular CNN models (VGG, ResNet, MobileNetV2) on different image classification datasets, and the experimental results demonstrate the effectiveness of our proposed method. On ImageNet, we reduce 32.8% FLOPs of MobileNetV2 with only 0.62% decrease for top-1 accuracy, which exceeds all previous state-of-the-art channel pruning methods. The code will be released.


翻译:频道运行是深层神经网络的主要压缩方法之一。 虽然先前的运行方法主要侧重于识别不重要的频道, 但近年来, 频道运行被视为神经结构搜索的一个特殊案例。 但是, 现有的方法要么复杂, 要么容易进行亚最佳的运行。 在本文中, 我们提议了一个运行框架, 适应性地决定每个层的频道数量以及子网络的Wights继承标准。 首先, 根据 BN 层缩放参数的平均值评估网络中每个街区的重要性。 其次, 使用双部分方法快速找到符合预算的紧凑子网络。 最后, 适应性地和高效地选择符合当前结构并微调经调整网络以恢复性能的重置标准。 AdaPruner允许快速、准确和高效地获得运行网络的连接网络数量以及子网络的初始化重量。 我们根据当前流行的CNN模型( VG、 ResNet、 MoveNetVV2 ), 将快速地找到符合预算的精度。 最后, 以实验性的结果将显示我们先前的 0.2 V 版本系统 的精确度, 将缩小了我们先前的方法。

0
下载
关闭预览

相关内容

专知会员服务
23+阅读 · 2021年3月18日
剑桥大学《数据科学: 原理与实践》课程,附PPT下载
专知会员服务
47+阅读 · 2021年1月20日
最新《Transformers模型》教程,64页ppt
专知会员服务
298+阅读 · 2020年11月26日
专知会员服务
60+阅读 · 2020年3月19日
《DeepGCNs: Making GCNs Go as Deep as CNNs》
专知会员服务
30+阅读 · 2019年10月17日
Hierarchically Structured Meta-learning
CreateAMind
24+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
Deep Compression/Acceleration:模型压缩加速论文汇总
极市平台
14+阅读 · 2019年5月15日
深度自进化聚类:Deep Self-Evolution Clustering
我爱读PAMI
15+阅读 · 2019年4月13日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
下载 | 114页自监督学习指南【PPT By Yann Lecun】
机器学习算法与Python学习
4+阅读 · 2018年12月24日
【推荐】全卷积语义分割综述
机器学习研究会
19+阅读 · 2017年8月31日
Arxiv
11+阅读 · 2019年4月15日
Arxiv
24+阅读 · 2018年10月24日
VIP会员
相关VIP内容
专知会员服务
23+阅读 · 2021年3月18日
剑桥大学《数据科学: 原理与实践》课程,附PPT下载
专知会员服务
47+阅读 · 2021年1月20日
最新《Transformers模型》教程,64页ppt
专知会员服务
298+阅读 · 2020年11月26日
专知会员服务
60+阅读 · 2020年3月19日
《DeepGCNs: Making GCNs Go as Deep as CNNs》
专知会员服务
30+阅读 · 2019年10月17日
Top
微信扫码咨询专知VIP会员