【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率 - 专知

会员服务 ·

0

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

2022 年 6 月 5 日 专知

配备紧凑算子(如深度卷积)的高效深度神经网络(DNN)模型在降低DNN的理论复杂性(如权重/操作的总数)同时保持良好的模型精度方面显示出了巨大的潜力。然而，现有的高效DNN在提高实际硬件效率方面仍然有限，原因是其通常采用的紧凑算子的硬件利用率较低。在这项工作中，我们为开发真正硬件高效的DNN开辟了一种新的压缩范式，从而在保持模型准确性的同时提高硬件效率。有趣的是，我们观察到，虽然一些DNN层的激活函数有助于DNN的训练优化和达到精度，但训练后可以适当地去除它们，而不影响模型的精度。受此启发，提出了一种深度收缩框架DepthShrinker，通过将现有高效且具有不规则计算模式的深度神经网络的基本模块收缩为密集的基本模块，开发硬件友好的紧凑网络，大大提高了硬件利用率，从而提高了硬件效率。令人兴奋的是，我们的DepthShrinker框架提供了硬件友好的紧凑网络，性能优于最先进的高效DNN和压缩技术，例如，在特斯拉V100上比SOTA通道修剪方法MetaPruning更高3.06%的精度和1.53×吞吐量。我们的代码可以在https://github.com/RICEEIC/DepthShrinker上找到。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“DSKR” 就可以获取《【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取100000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取100000+AI主题知识资料

登录查看更多

0

相关内容

DepthShrinker

【ICML2022】张量卷积神经网络的统一权值初始化范式

【ICML2022】张量卷积神经网络的统一权值初始化范式

专知会员服务

18+阅读 · 2022年6月8日

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

专知会员服务

10+阅读 · 2022年5月28日

【ICML2021】面向异构联邦学习的无数据知识蒸馏

专知会员服务

36+阅读 · 2021年7月9日

【ICML2021】贝叶斯神经网络的后验到底是什么样的?

专知会员服务

33+阅读 · 2021年5月18日

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

专知会员服务

70+阅读 · 2020年7月1日

【ICML2022】基于少样本策略泛化的决策Transformer

【ICML2022】基于少样本策略泛化的决策Transformer

专知

3+阅读 · 2022年7月11日

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知

0+阅读 · 2022年7月8日

【ICML2022】张量卷积神经网络的统一权值初始化范式

【ICML2022】张量卷积神经网络的统一权值初始化范式

专知

2+阅读 · 2022年6月8日

【ICML2022】通过凸对偶揭示注意力:视觉Transformers的分析与解读

【ICML2022】通过凸对偶揭示注意力:视觉Transformers的分析与解读

专知

1+阅读 · 2022年5月30日

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

专知

3+阅读 · 2022年4月19日

基于光源设计的微波光子滤波器及应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

针对GPU的高效并行任务执行设计研究

国家自然科学基金

0+阅读 · 2013年12月31日

面向数据表示的深度稀疏保持学习

国家自然科学基金

7+阅读 · 2013年12月31日

网络控制系统中基于时延在线预测的动态调度策略研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于改进的支持向量机在语音识别中的应用研究

国家自然科学基金

0+阅读 · 2009年12月31日

A Proper Orthogonal Decomposition approach for parameters reduction of Single Shot Detector networks

A Proper Orthogonal Decomposition approach for parameters reduction of Single Shot Detector networks

Arxiv

0+阅读 · 2022年7月27日

PointFix: Learning to Fix Domain Bias for Robust Online Stereo Adaptation

Arxiv

1+阅读 · 2022年7月27日

Interference and Need Aware Workload Colocation in Hyperscale Datacenters

Arxiv

0+阅读 · 2022年7月25日

Understanding the Dynamics of DNNs Using Graph Modularity

Arxiv

0+阅读 · 2022年7月22日

DeepSpeed-MoE: Advancing Mixture-of-Experts Inference and Training to Power Next-Generation AI Scale

Arxiv

0+阅读 · 2022年7月21日

VIP会员

相关主题

紧凑神经网络

相关VIP内容

【ICML2022】张量卷积神经网络的统一权值初始化范式

【ICML2022】张量卷积神经网络的统一权值初始化范式

专知会员服务

18+阅读 · 2022年6月8日

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

专知会员服务

10+阅读 · 2022年5月28日

【ICML2021】面向异构联邦学习的无数据知识蒸馏

专知会员服务

36+阅读 · 2021年7月9日

【ICML2021】贝叶斯神经网络的后验到底是什么样的?

专知会员服务

33+阅读 · 2021年5月18日

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

专知会员服务

70+阅读 · 2020年7月1日

热门VIP内容

开通专知VIP会员享更多权益服务

前沿人工智能趋势报告（Frontier AI Trends Report）

【AAAI2026】善始则事半功倍：基于前缀优化的大语言模型推理强化学习

Andrej Karpathy：2025 年 LLM 年度回顾（2025 LLM Year in Review）

音退化问题：基于输入操控的鲁棒语音转换综述

相关资讯

【ICML2022】基于少样本策略泛化的决策Transformer

【ICML2022】基于少样本策略泛化的决策Transformer

专知

3+阅读 · 2022年7月11日

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知

0+阅读 · 2022年7月8日

【ICML2022】张量卷积神经网络的统一权值初始化范式

【ICML2022】张量卷积神经网络的统一权值初始化范式

专知

2+阅读 · 2022年6月8日

【ICML2022】通过凸对偶揭示注意力:视觉Transformers的分析与解读

【ICML2022】通过凸对偶揭示注意力:视觉Transformers的分析与解读

专知

1+阅读 · 2022年5月30日

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

专知

3+阅读 · 2022年4月19日

相关基金

基于光源设计的微波光子滤波器及应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

针对GPU的高效并行任务执行设计研究

国家自然科学基金

0+阅读 · 2013年12月31日

面向数据表示的深度稀疏保持学习

国家自然科学基金

7+阅读 · 2013年12月31日

网络控制系统中基于时延在线预测的动态调度策略研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于改进的支持向量机在语音识别中的应用研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

A Proper Orthogonal Decomposition approach for parameters reduction of Single Shot Detector networks

A Proper Orthogonal Decomposition approach for parameters reduction of Single Shot Detector networks

Arxiv

0+阅读 · 2022年7月27日

PointFix: Learning to Fix Domain Bias for Robust Online Stereo Adaptation

Arxiv

1+阅读 · 2022年7月27日

Interference and Need Aware Workload Colocation in Hyperscale Datacenters

Arxiv

0+阅读 · 2022年7月25日

Understanding the Dynamics of DNNs Using Graph Modularity

Arxiv

0+阅读 · 2022年7月22日

DeepSpeed-MoE: Advancing Mixture-of-Experts Inference and Training to Power Next-Generation AI Scale

Arxiv

0+阅读 · 2022年7月21日

大家都在搜

大型语言模型

朱克爱德华兹家族

蓝牙安全攻防

冷启动，0预算，如何借助分销裂变引爆私域用户增长？

微信扫码咨询专知VIP会员