深度神经网络模型压缩与加速综述

A Survey of Model Compression and Acceleration for Deep Neural Networks 深度卷积神经网络(CNNs)最近在许多视觉识别任务中取得了巨大的成功。然而，现有的深度神经网络模型在计算上是昂贵的和内存密集型的，这阻碍了它们在低内存资源的设备或有严格时间延迟要求的应用程序中的部署。因此，在不显著降低模型性能的情况下，在深度网络中进行模型压缩和加速是一种自然的思路。在过去几年中，这方面取得了巨大的进展。本文综述了近年来发展起来的压缩和加速CNNs模型的先进技术。这些技术大致分为四种方案: 参数剪枝和共享、低秩因子分解、传输/紧凑卷积过滤器和知识蒸馏。首先介绍参数修剪和共享的方法，然后介绍其他技术。对于每种方案，我们都提供了关于性能、相关应用程序、优点和缺点等方面的详细分析。然后我们将讨论一些最近比较成功的方法，例如，动态容量网络和随机深度网络。然后，我们调查评估矩阵、用于评估模型性能的主要数据集和最近的基准测试工作。最后，对全文进行总结，并对今后的研究方向进行了展望。

成为VIP会员查看完整内容

129

相关内容

压缩感知

关注 275

压缩感知是近年来极为热门的研究前沿，在若干应用领域中都引起瞩目。 compressive sensing（CS）又称 compressived sensing ，compressived sample，大意是在采集信号的时候（模拟到数字），同时完成对信号压缩之意。与稀疏表示不同，压缩感知关注的是如何利用信号本身所具有的稀疏性，从部分观测样本中恢复原信号。

最新《知识蒸馏》2020综述论文，20页pdf，悉尼大学

专知会员服务

158+阅读 · 2020年6月14日

紧凑的神经网络模型设计研究综述

专知会员服务

74+阅读 · 2020年5月21日

【ICASSP2020】分布式与高效深度学习，140页ppt详述深度学习压缩与联邦学习训练进展

专知会员服务

126+阅读 · 2020年5月6日

最新《智能交通系统的深度强化学习》综述论文，22页pdf

专知会员服务

188+阅读 · 2020年5月5日