We present joint multi-dimension pruning (abbreviated as JointPruning), an effective method of pruning a network on three crucial aspects: spatial, depth and channel simultaneously. To tackle these three naturally different dimensions, we proposed a general framework by defining pruning as seeking the best pruning vector (i.e., the numerical value of layer-wise channel number, spacial size, depth) and construct a unique mapping from the pruning vector to the pruned network structures. Then we optimize the pruning vector with gradient update and model joint pruning as a numerical gradient optimization process. To overcome the challenge that there is no explicit function between the loss and the pruning vectors, we proposed self-adapted stochastic gradient estimation to construct a gradient path through network loss to pruning vectors and enable efficient gradient update. We show that the joint strategy discovers a better status than previous studies that focused on individual dimensions solely, as our method is optimized collaboratively across the three dimensions in a single end-to-end training and it is more efficient than the previous exhaustive methods. Extensive experiments on large-scale ImageNet dataset across a variety of network architectures MobileNet V1&V2&V3 and ResNet demonstrate the effectiveness of our proposed method. For instance, we achieve significant margins of 2.5% and 2.6% improvement over the state-of-the-art approach on the already compact MobileNet V1&V2 under an extremely large compression ratio.


翻译:我们展示了联合多维运行的运行量( 以联合运行方式显示), 这是在三个关键方面同时运行网络的有效方法 : 空间、 深度和信道。 为了同时处理这三个自然不同的维度, 我们建议了一个总体框架, 将运行量定义为寻找最佳的运行矢量( 即, 以层为源数的数值、 平滑大小、 深度), 并构建一个独特的绘图, 从细线矢量到小线网络结构。 然后, 我们优化双向矢量的运行量, 使用梯度更新和模型联合运行, 作为数字梯度优化进程。 为了克服损失和正线矢量矢量之间没有明确功能的挑战, 我们建议了一种自我调整的梯度估计, 通过网络损失来构建一个梯度路径, 以运行矢量的矢量为矢量, 以及 构建一个比以往仅侧重于单个维度的研究更好的状态。 我们的方法已经在单一端至终端培训中以协作方式在三个维度上优化了运行矢量的矢量矢量, 而且它比先前的甚端端端端端端端端端端端端度1 模型模型模型模型模型的模型模型模型模型模型的大规模模型模型模型模型模型的大规模测试模型模型模型模型的大规模测试系统和甚大模型的模型模型模型的模型的模型的大规模实验 。

0
下载
关闭预览

相关内容

【干货书】数值Python计算,Numerical Python,709页pdf
专知会员服务
113+阅读 · 2021年5月30日
【干货书】面向计算科学和工程的Python导论,167页pdf
专知会员服务
42+阅读 · 2021年4月7日
剑桥大学《数据科学: 原理与实践》课程,附PPT下载
专知会员服务
51+阅读 · 2021年1月20日
数据科学导论,54页ppt,Introduction to Data Science
专知会员服务
42+阅读 · 2020年7月27日
【新书】Pro 机器学习算法Python实现,379页pdf
专知会员服务
204+阅读 · 2020年2月11日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
154+阅读 · 2019年10月12日
已删除
将门创投
4+阅读 · 2018年11月20日
VIP会员
相关资讯
已删除
将门创投
4+阅读 · 2018年11月20日
Top
微信扫码咨询专知VIP会员