【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率 - 专知VIP

会员服务 ·

8

ICML 2022 · DepthShrinker · 紧凑神经网络 ·

2022 年 6 月 5 日

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

配备紧凑算子(如深度卷积)的高效深度神经网络(DNN)模型在降低DNN的理论复杂性(如权重/操作的总数)同时保持良好的模型精度方面显示出了巨大的潜力。然而，现有的高效DNN在提高实际硬件效率方面仍然有限，原因是其通常采用的紧凑算子的硬件利用率较低。在这项工作中，我们为开发真正硬件高效的DNN开辟了一种新的压缩范式，从而在保持模型准确性的同时提高硬件效率。有趣的是，我们观察到，虽然一些DNN层的激活函数有助于DNN的训练优化和达到精度，但训练后可以适当地去除它们，而不影响模型的精度。受此启发，提出了一种深度收缩框架DepthShrinker，通过将现有高效且具有不规则计算模式的深度神经网络的基本模块收缩为密集的基本模块，开发硬件友好的紧凑网络，大大提高了硬件利用率，从而提高了硬件效率。令人兴奋的是，我们的DepthShrinker框架提供了硬件友好的紧凑网络，性能优于最先进的高效DNN和压缩技术，例如，在特斯拉V100上比SOTA通道修剪方法MetaPruning更高3.06%的精度和1.53×吞吐量。我们的代码可以在https://github.com/RICEEIC/DepthShrinker上找到。

成为VIP会员查看完整内容

11

相关内容

ICML 2022

国际机器学习大会(International Conference on Machine Learning，简称ICML ) 是由国际机器学习学会（IMLS）主办的机器学习国际顶级会议，也是CCF-A类学术会议。ICML 2022 共收到5630 投稿，接收1117 篇 short oral，118篇 long oral，录用率为21.94%。

【ICML2022】闭式同构变换的时间序列对齐

【ICML2022】闭式同构变换的时间序列对齐

专知会员服务

12+阅读 · 2022年6月20日

【ICML2022】张量卷积神经网络的统一权值初始化范式

【ICML2022】张量卷积神经网络的统一权值初始化范式

专知会员服务

18+阅读 · 2022年6月8日

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

专知会员服务

10+阅读 · 2022年5月28日

【ICML2022】鲁棒强化学习的策略梯度法

【ICML2022】鲁棒强化学习的策略梯度法

专知会员服务

38+阅读 · 2022年5月21日

【AAAI2022】基于对比学习的预训练语言模型剪枝压缩

【AAAI2022】基于对比学习的预训练语言模型剪枝压缩

专知会员服务

29+阅读 · 2022年1月24日

【ICML2021】深度隐式图匹配

专知会员服务

25+阅读 · 2021年9月22日

【ICML2021】无训练神经架构搜索

专知会员服务

20+阅读 · 2021年9月16日

【ICML2021】有向图网络

专知会员服务

82+阅读 · 2021年5月10日

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

专知会员服务

70+阅读 · 2020年7月1日

【ICASSP2020】分布式与高效深度学习，140页ppt详述深度学习压缩与联邦学习训练进展

【ICASSP2020】分布式与高效深度学习，140页ppt详述深度学习压缩与联邦学习训练进展

专知会员服务

126+阅读 · 2020年5月6日

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知

0+阅读 · 2022年7月8日

ICML2022|谱图神经网络有多强大？线性GNN就能达到SOTA

ICML2022|谱图神经网络有多强大？线性GNN就能达到SOTA

图与推荐

1+阅读 · 2022年7月4日

【ICML2022】张量卷积神经网络的统一权值初始化范式

【ICML2022】张量卷积神经网络的统一权值初始化范式

专知

2+阅读 · 2022年6月8日

【ICML2022】蛋白质适应度预测与自回归transformers和推理时间检索

【ICML2022】蛋白质适应度预测与自回归transformers和推理时间检索

专知

0+阅读 · 2022年6月4日

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

专知

0+阅读 · 2022年5月28日

【速览】TNNLS 2022 | DualConv：用于轻量级深度神经网络的双卷积核

【速览】TNNLS 2022 | DualConv：用于轻量级深度神经网络的双卷积核

中国图象图形学学会CSIG

3+阅读 · 2022年4月11日

大规模神经网络最新文献综述：训练高效DNN、节省内存使用、优化器设计

大规模神经网络最新文献综述：训练高效DNN、节省内存使用、优化器设计

专知

0+阅读 · 2022年4月5日

【AAAI2022】基于对比学习的预训练语言模型剪枝压缩

【AAAI2022】基于对比学习的预训练语言模型剪枝压缩

专知

0+阅读 · 2022年1月24日

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

专知

0+阅读 · 2021年11月19日

结构化剪枝综述

结构化剪枝综述

专知

1+阅读 · 2021年11月18日

众核集群上基于MPI的模型扩展及性能优化研究

国家自然科学基金

1+阅读 · 2015年12月31日

大型异构系统上数百万核可扩展的新型区域分裂隐式求解器研究

国家自然科学基金

0+阅读 · 2015年12月31日

针对GPU的高效并行任务执行设计研究

国家自然科学基金

0+阅读 · 2013年12月31日

粘性不可压缩流体形状优化的快速水平集和自适应方法

国家自然科学基金

0+阅读 · 2012年12月31日

高雷诺数不可压缩流动参数自适应的并行变分多尺度算法

国家自然科学基金

0+阅读 · 2012年12月31日

理性密码协议的效率优化及可证明安全方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

利用新颖微纳结构提高光伏和光热伏太阳能电池的效率

国家自然科学基金

1+阅读 · 2012年12月31日

促溶剂提高反胶束萃取效率的作用机制与应用研究

国家自然科学基金

0+阅读 · 2009年12月31日

超临界压缩空气储能系统的研究与探索

国家自然科学基金

0+阅读 · 2009年12月31日

基于敏感性的前向神经网络学习机制研究

国家自然科学基金

0+阅读 · 2009年12月31日

Accelerating Deep Learning Model Inference on Arm CPUs with Ultra-Low Bit Quantization and Runtime

Arxiv

0+阅读 · 2022年7月18日

Associative Memory Based Experience Replay for Deep Reinforcement Learning

Arxiv

0+阅读 · 2022年7月16日

MARLAS: Multi Agent Reinforcement Learning for cooperated Adaptive Sampling

Arxiv

0+阅读 · 2022年7月15日

Efficient 6D Vlasov simulation using the dynamical low-rank framework Ensign

Arxiv

1+阅读 · 2022年7月15日

Enable Deep Learning on Mobile Devices: Methods, Systems, and Applications

Arxiv

35+阅读 · 2022年4月25日

A Survey on Reinforcement Learning for Recommender Systems

Arxiv

22+阅读 · 2021年9月22日

GraphNorm: A Principled Approach to Accelerating Graph Neural Network Training

Arxiv

14+阅读 · 2021年2月16日

A Survey of Methods for Low-Power Deep Learning and Computer Vision

A Survey of Methods for Low-Power Deep Learning and Computer Vision

Arxiv

14+阅读 · 2020年3月24日

已删除

Arxiv

32+阅读 · 2020年3月23日

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

VIP会员

相关主题

紧凑神经网络

相关VIP内容

【ICML2022】闭式同构变换的时间序列对齐

【ICML2022】闭式同构变换的时间序列对齐

专知会员服务

12+阅读 · 2022年6月20日

【ICML2022】张量卷积神经网络的统一权值初始化范式

【ICML2022】张量卷积神经网络的统一权值初始化范式

专知会员服务

18+阅读 · 2022年6月8日

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

专知会员服务

10+阅读 · 2022年5月28日

【ICML2022】鲁棒强化学习的策略梯度法

【ICML2022】鲁棒强化学习的策略梯度法

专知会员服务

38+阅读 · 2022年5月21日

【AAAI2022】基于对比学习的预训练语言模型剪枝压缩

【AAAI2022】基于对比学习的预训练语言模型剪枝压缩

专知会员服务

29+阅读 · 2022年1月24日

【ICML2021】深度隐式图匹配

专知会员服务

25+阅读 · 2021年9月22日

【ICML2021】无训练神经架构搜索

专知会员服务

20+阅读 · 2021年9月16日

【ICML2021】有向图网络

专知会员服务

82+阅读 · 2021年5月10日

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

专知会员服务

70+阅读 · 2020年7月1日

【ICASSP2020】分布式与高效深度学习，140页ppt详述深度学习压缩与联邦学习训练进展

【ICASSP2020】分布式与高效深度学习，140页ppt详述深度学习压缩与联邦学习训练进展

专知会员服务

126+阅读 · 2020年5月6日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知

0+阅读 · 2022年7月8日

ICML2022|谱图神经网络有多强大？线性GNN就能达到SOTA

ICML2022|谱图神经网络有多强大？线性GNN就能达到SOTA

图与推荐

1+阅读 · 2022年7月4日

【ICML2022】张量卷积神经网络的统一权值初始化范式

【ICML2022】张量卷积神经网络的统一权值初始化范式

专知

2+阅读 · 2022年6月8日

【ICML2022】蛋白质适应度预测与自回归transformers和推理时间检索

【ICML2022】蛋白质适应度预测与自回归transformers和推理时间检索

专知

0+阅读 · 2022年6月4日

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

专知

0+阅读 · 2022年5月28日

【速览】TNNLS 2022 | DualConv：用于轻量级深度神经网络的双卷积核

【速览】TNNLS 2022 | DualConv：用于轻量级深度神经网络的双卷积核

中国图象图形学学会CSIG

3+阅读 · 2022年4月11日

大规模神经网络最新文献综述：训练高效DNN、节省内存使用、优化器设计

大规模神经网络最新文献综述：训练高效DNN、节省内存使用、优化器设计

专知

0+阅读 · 2022年4月5日

【AAAI2022】基于对比学习的预训练语言模型剪枝压缩

【AAAI2022】基于对比学习的预训练语言模型剪枝压缩

专知

0+阅读 · 2022年1月24日

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

专知

0+阅读 · 2021年11月19日

结构化剪枝综述

结构化剪枝综述

专知

1+阅读 · 2021年11月18日

相关基金

众核集群上基于MPI的模型扩展及性能优化研究

国家自然科学基金

1+阅读 · 2015年12月31日

大型异构系统上数百万核可扩展的新型区域分裂隐式求解器研究

国家自然科学基金

0+阅读 · 2015年12月31日

针对GPU的高效并行任务执行设计研究

国家自然科学基金

0+阅读 · 2013年12月31日

粘性不可压缩流体形状优化的快速水平集和自适应方法

国家自然科学基金

0+阅读 · 2012年12月31日

高雷诺数不可压缩流动参数自适应的并行变分多尺度算法

国家自然科学基金

0+阅读 · 2012年12月31日

理性密码协议的效率优化及可证明安全方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

利用新颖微纳结构提高光伏和光热伏太阳能电池的效率

国家自然科学基金

1+阅读 · 2012年12月31日

促溶剂提高反胶束萃取效率的作用机制与应用研究

国家自然科学基金

0+阅读 · 2009年12月31日

超临界压缩空气储能系统的研究与探索

国家自然科学基金

0+阅读 · 2009年12月31日

基于敏感性的前向神经网络学习机制研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Accelerating Deep Learning Model Inference on Arm CPUs with Ultra-Low Bit Quantization and Runtime

Arxiv

0+阅读 · 2022年7月18日

Associative Memory Based Experience Replay for Deep Reinforcement Learning

Arxiv

0+阅读 · 2022年7月16日

MARLAS: Multi Agent Reinforcement Learning for cooperated Adaptive Sampling

Arxiv

0+阅读 · 2022年7月15日

Efficient 6D Vlasov simulation using the dynamical low-rank framework Ensign

Arxiv

1+阅读 · 2022年7月15日

Enable Deep Learning on Mobile Devices: Methods, Systems, and Applications

Arxiv

35+阅读 · 2022年4月25日

A Survey on Reinforcement Learning for Recommender Systems

Arxiv

22+阅读 · 2021年9月22日

GraphNorm: A Principled Approach to Accelerating Graph Neural Network Training

Arxiv

14+阅读 · 2021年2月16日

A Survey of Methods for Low-Power Deep Learning and Computer Vision

A Survey of Methods for Low-Power Deep Learning and Computer Vision

Arxiv

14+阅读 · 2020年3月24日

已删除

Arxiv

32+阅读 · 2020年3月23日

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

微信扫码咨询专知VIP会员