会员服务 ·

0

ICLR 2022 | 对偶彩票假说！美国东北大学等提出DLTH：将随机子网络变换得到中奖彩票

2022 年 3 月 17 日 极市平台

↑ 点击蓝字关注极市平台

作者丨deishou

编辑丨极市平台

极市导读

本文已被ICLR2022接收，来自美国东北大学，圣克拉拉大学和Meta的研究者提出对偶彩票假说（DLTH）。不同于彩票假说（LTH）验证了随机网络中存在好的子网络（中奖彩票），DLTH验证了在给定的随机网络中，随机的子网络都可以被转换成中奖彩票。 >>加入极市CV技术交流群，走在计算机视觉的最前沿

稀疏网络训练一直是深度学习中训练神经网络的难点。随着网络规模和数据量的不断增加，训练成本也不断提升。如何有效的训练稀疏网络来维持合理的训练开销便十分重要。另一方面，找到有效的稀疏网络训练方法对理解神经网络的工作原理同样很有帮助。

近日，来自美国东北大学，圣克拉拉大学和Meta的研究者提出对偶彩票假说（Dual Lottery Ticket Hypothesis（DLTH））。不同于彩票假说（Lottery Ticket Hypothesis（LTH））验证了随机网络中存在好的子网络（中奖彩票），DLTH验证了在给定的随机网络中，随机的子网络都可以被转换成中奖彩票。文章已被ICLR 2022接收。代码已开源。

论文地址：https://arxiv.org/abs/2203.04248

OpenReview: https://openreview.net/forum?id=fOsN52jn25l

论文代码：https://github.com/yueb17/DLTH

相关研究：

2019年，来自MIT的研究人员提出彩票假说（Lottery Ticket Hypothesis（LTH））：给定一个初始化网络，其中存在一个彩票子网络（winning ticket）在被单独训练的情况下达到很好的效果。这个子网络可以用传统的预训练加剪枝的方法得到。LTH还是用了iterative magnitude pruning的策略来找到更好的彩票子网络。LTH揭示了神经网络与其稀疏子网络之间的关系开启了一个研究稀疏网络训练的新方向。

给定随机初始化的神经网络，随机的子网络并不能达到理想的训练效果。而LTH中的彩票子网络是通过剪枝预训练网络得到的。但是LTH只验证了彩票子网络的存在性，并没有探索彩票网络的普遍性。相对应的，通过预训练加剪枝的方法找到的彩票子网络的结构是无法控制的。这同样限制了彩票网络在实际应用中的潜力。

对偶彩票假说：

研究者受LTH所启发，探索了其对偶问题并提出对偶彩票假说DLTH：给定随机初始化的网络，其随机挑选的子网络可以被转换成彩票子网络，并得到与LTH找到的彩票子网络相当甚至更好的准确率。

DLTH与LTH的关系与比较如下图所示：

同时，DLTH提出了随机子网络变换（Random Sparse Network Transformation（RST））来验证提出的DLTH。

随机子网络变换（RST）：

给定随机初始化网络并确定随机子网络结构，RST借助网络中其余的权重（masked weights）来帮助被选中的子网络（randomly selected sparse network）进行变换。形象的说，RST通过借助彩票池中所有的信息把一张随机彩票转换成了中奖彩票。RST通过训练完整的网络来完成。在训练过程中，RST通过在未被选中的权重上添加一个逐渐增加的正则项，从而这部分权重的幅值逐渐变小，这部分权重的作用也逐渐被抑制，并在变换结束之后完全去掉这部分权重。而被选中的子网络则进行正常训练。最终得到被转换好的稀疏子网络。这一过程可以理解为RST把信息从网络的其他部分挤到目标子网络中（information extrusion），如下图所示：

实验：

RST方法在cifar10，cifar100以及Imagenet 数据集上进行了测试。模型选择了ResNet56和ResNet18。对比方法包括LTH及其变体，预训练加剪枝，以及随机子网络scratch training。实验结果如下图所示。

作者发现RST方法相比较于LTH，普遍可以得到更好至少相当的结果，无论使用one-shot的策略或者iterative的策略。因此，所使用的RST很好的验证了文章提出的DLTH。直观的比较如下图所示。

对比Pruning at Initialization（PI）：PI同样在随机网络中选择子网络进行训练。因此，PI相关的研究同样也是重要的对比方法。文章中，作者选择了Gradient Signal Preservation （GraSP）作为PI方法的代表，与提出的RST进行比较。具体结果如下图所示。

实验结果表明相比较于GraSP，RST方法普遍取得了更好的效果。

结论：

本文从彩票假说（LTH）的研究视角出发，提出其对偶形式：对偶彩票假说（DLTH），从更广泛的角度探究了神经网络与其稀疏子网络之间的关系。相应的，文章提出了随机子网络变换（RST）的方法来验证DLTH。在benchmark数据集与网络上和众多对比方法的比较表明RST方法有效的验证了文章所提出的对偶彩票假说（DLTH）。

公众号后台回复“数据集”获取火焰和烟雾图像数据集下载～

△点击卡片关注极市平台，获取最新CV干货

极市干货

数据集资源汇总： 10个开源工业检测数据集汇总｜ 21个深度学习开源数据集分类汇总

算法trick ：目标检测比赛中的tricks集锦｜从39个kaggle竞赛中总结出来的图像分割的Tips和Tricks

技术综述：一文弄懂各种loss function ｜工业图像异常检测最新研究总结（2019-2020）

# CV技术社群邀请函 #

△长按添加极市小助手

添加极市小助手微信（ID : cvmart4）

备注：姓名-学校/公司-研究方向-城市（如：小极-北大-目标检测-深圳）

即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群

每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~

觉得有用麻烦给个在看啦~

登录查看更多

0

相关内容

DLTH

【CVPR 2022】提出一种基于Shapley value的ShapPruning后门去除算法，Few-shot Backdoor Defense Using Shapley Estimation

【CVPR 2022】提出一种基于Shapley value的ShapPruning后门去除算法，Few-shot Backdoor Defense Using Shapley Estimation

专知会员服务

7+阅读 · 2022年3月12日

NeurIPS 2021 | 华为诺亚Oral论文：基于频域的二值神经网络训练方法

NeurIPS 2021 | 华为诺亚Oral论文：基于频域的二值神经网络训练方法

专知会员服务

16+阅读 · 2021年12月16日

TKDE2021 | 基于对抗解耦器的异质网络嵌入

TKDE2021 | 基于对抗解耦器的异质网络嵌入

专知会员服务

9+阅读 · 2021年8月27日

[WWW2021]图结构估计神经网络

[WWW2021]图结构估计神经网络

专知会员服务

43+阅读 · 2021年3月29日

【NeurIPS 2020】学习神经网络中的不变性

专知会员服务

29+阅读 · 2020年10月24日

【Hinton新论文】SimCLRv2来了！提出蒸馏新思路，可迁移至小模型，性能精度超越有监督

【Hinton新论文】SimCLRv2来了！提出蒸馏新思路，可迁移至小模型，性能精度超越有监督

专知会员服务

41+阅读 · 2020年7月21日

【ICML2020】最小化验证损失代理来搜索最佳神经网络结构

专知会员服务

24+阅读 · 2020年7月13日

【ICML 2020 】小样本学习即领域迁移

【ICML 2020 】小样本学习即领域迁移

专知会员服务

78+阅读 · 2020年6月26日

【MIT韩松博士-ICLR2020】端上自动机器学习-一劳永逸网络的NAS: Once-for-All Network

【MIT韩松博士-ICLR2020】端上自动机器学习-一劳永逸网络的NAS: Once-for-All Network

专知会员服务

58+阅读 · 2020年5月4日

AAAI 2020 | 滴滴&东北大学提出自动结构化剪枝压缩算法框架，性能提升高达120倍

专知会员服务

30+阅读 · 2020年2月26日

让模型训练速度提升2到4倍，「彩票假设」作者的这个全新PyTorch库火了

让模型训练速度提升2到4倍，「彩票假设」作者的这个全新PyTorch库火了

机器之心

0+阅读 · 2022年4月5日

赛尔原创@EMNLP 2021 | 基于稀疏子网络的领域迁移

赛尔原创@EMNLP 2021 | 基于稀疏子网络的领域迁移

哈工大SCIR

0+阅读 · 2022年4月1日

CVPR 2022 Oral | 腾讯优图&厦门大学提出无需训练的ViT结构搜索算法

CVPR 2022 Oral | 腾讯优图&厦门大学提出无需训练的ViT结构搜索算法

机器之心

1+阅读 · 2022年3月30日

ICLR 2022 | 提高子网络「中奖」准确率，美国东北大学、Meta等提出对偶彩票假说

ICLR 2022 | 提高子网络「中奖」准确率，美国东北大学、Meta等提出对偶彩票假说

机器之心

0+阅读 · 2022年3月19日

ICLR 2022 | 对偶彩票假说！美国东北大学/圣克拉拉大学/Meta提出DLTH：随机子网络变换得到中奖彩票

ICLR 2022 | 对偶彩票假说！美国东北大学/圣克拉拉大学/Meta提出DLTH：随机子网络变换得到中奖彩票

CVer

0+阅读 · 2022年3月17日

CVPR 2022 | 即插即用！助力自监督涨点的ContrastiveCrop开源了！

CVPR 2022 | 即插即用！助力自监督涨点的ContrastiveCrop开源了！

极市平台

1+阅读 · 2022年3月7日

ICML 2021 | AlphaNet：基于α-散度的超网络训练方法

ICML 2021 | AlphaNet：基于α-散度的超网络训练方法

PaperWeekly

0+阅读 · 2021年12月28日

NeurIPS 2021 | 华为诺亚Oral论文：基于频域的二值神经网络训练方法

NeurIPS 2021 | 华为诺亚Oral论文：基于频域的二值神经网络训练方法

PaperWeekly

1+阅读 · 2021年12月17日

「彩票假说」要修正？王言治团队：神经网络要「中奖」，秘密在于学习率！｜ICML 2021

「彩票假说」要修正？王言治团队：神经网络要「中奖」，秘密在于学习率！｜ICML 2021

新智元

0+阅读 · 2021年10月26日

论文浅尝 | 知识图谱推理中表示学习和规则挖掘的迭代学习方法

论文浅尝 | 知识图谱推理中表示学习和规则挖掘的迭代学习方法

开放知识图谱

41+阅读 · 2019年7月2日

基于核与核度理论的在线社交网络拓扑结构研究

国家自然科学基金

0+阅读 · 2016年12月31日

复杂网络链接预测与社团发现混合方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于非整数阶梯度的稀疏信号重构方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

泛在网络资源优化若干算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

驱动器饱和受限下分布式系统的合作控制

国家自然科学基金

0+阅读 · 2012年12月31日

广义系统的迭代学习控制算法与应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于随机有限集理论的多目标跟踪方法若干问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

关于图上随机游走、渗流的几个问题

国家自然科学基金

0+阅读 · 2012年12月31日

随机最优控制的数值方法理论及其应用研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于链接权重化的链接预测研究

国家自然科学基金

1+阅读 · 2011年12月31日

Breaching the 2-Approximation Barrier for the Forest Augmentation Problem

Arxiv

0+阅读 · 2022年4月20日

Bodyless Block Propagation: TPS Fully Scalable Blockchain with Pre-Validation

Arxiv

0+阅读 · 2022年4月19日

The eigenvector-eigenvalue identity for the quaternion matrix with its algorithm and computer program

Arxiv

0+阅读 · 2022年4月18日

A New Dynamic Algorithm for Densest Subhypergraphs

Arxiv

0+阅读 · 2022年4月17日

BLISS: Robust Sequence-to-Sequence Learning via Self-Supervised Input Representation

Arxiv

0+阅读 · 2022年4月16日

Combinatorics of minimal absent words for a sliding window

Arxiv

0+阅读 · 2022年4月16日

An Experiment of Randomized Hints on an Axiom of Infinite-Valued Lukasiewicz Logic

Arxiv

0+阅读 · 2022年4月15日

Exemplar-based Pattern Synthesis with Implicit Periodic Field Network

Arxiv

0+阅读 · 2022年4月15日

Pre-training Text Representations as Meta Learning

Arxiv

13+阅读 · 2020年4月12日

A Simple Framework for Contrastive Learning of Visual Representations

Arxiv

21+阅读 · 2020年2月13日

VIP会员

相关主题

相关VIP内容

【CVPR 2022】提出一种基于Shapley value的ShapPruning后门去除算法，Few-shot Backdoor Defense Using Shapley Estimation

【CVPR 2022】提出一种基于Shapley value的ShapPruning后门去除算法，Few-shot Backdoor Defense Using Shapley Estimation

专知会员服务

7+阅读 · 2022年3月12日

NeurIPS 2021 | 华为诺亚Oral论文：基于频域的二值神经网络训练方法

NeurIPS 2021 | 华为诺亚Oral论文：基于频域的二值神经网络训练方法

专知会员服务

16+阅读 · 2021年12月16日

TKDE2021 | 基于对抗解耦器的异质网络嵌入

TKDE2021 | 基于对抗解耦器的异质网络嵌入

专知会员服务

9+阅读 · 2021年8月27日

[WWW2021]图结构估计神经网络

[WWW2021]图结构估计神经网络

专知会员服务

43+阅读 · 2021年3月29日

【NeurIPS 2020】学习神经网络中的不变性

专知会员服务

29+阅读 · 2020年10月24日

【Hinton新论文】SimCLRv2来了！提出蒸馏新思路，可迁移至小模型，性能精度超越有监督

【Hinton新论文】SimCLRv2来了！提出蒸馏新思路，可迁移至小模型，性能精度超越有监督

专知会员服务

41+阅读 · 2020年7月21日

【ICML2020】最小化验证损失代理来搜索最佳神经网络结构

专知会员服务

24+阅读 · 2020年7月13日

【ICML 2020 】小样本学习即领域迁移

【ICML 2020 】小样本学习即领域迁移

专知会员服务

78+阅读 · 2020年6月26日

【MIT韩松博士-ICLR2020】端上自动机器学习-一劳永逸网络的NAS: Once-for-All Network

【MIT韩松博士-ICLR2020】端上自动机器学习-一劳永逸网络的NAS: Once-for-All Network

专知会员服务

58+阅读 · 2020年5月4日

AAAI 2020 | 滴滴&东北大学提出自动结构化剪枝压缩算法框架，性能提升高达120倍

专知会员服务

30+阅读 · 2020年2月26日

热门VIP内容

开通专知VIP会员享更多权益服务

【新书】面向企业的图学习扩展：生产级图学习与推理，485页pdf

AI智能体编程：技术、挑战与机遇综述

【国家标准】数据安全技术数据安全风险评估方法

【CMU博士论文】交互式学习的进展：替代性反馈机制与自适应因果推理

相关资讯

让模型训练速度提升2到4倍，「彩票假设」作者的这个全新PyTorch库火了

让模型训练速度提升2到4倍，「彩票假设」作者的这个全新PyTorch库火了

机器之心

0+阅读 · 2022年4月5日

赛尔原创@EMNLP 2021 | 基于稀疏子网络的领域迁移

赛尔原创@EMNLP 2021 | 基于稀疏子网络的领域迁移

哈工大SCIR

0+阅读 · 2022年4月1日

CVPR 2022 Oral | 腾讯优图&厦门大学提出无需训练的ViT结构搜索算法

CVPR 2022 Oral | 腾讯优图&厦门大学提出无需训练的ViT结构搜索算法

机器之心

1+阅读 · 2022年3月30日

ICLR 2022 | 提高子网络「中奖」准确率，美国东北大学、Meta等提出对偶彩票假说

ICLR 2022 | 提高子网络「中奖」准确率，美国东北大学、Meta等提出对偶彩票假说

机器之心

0+阅读 · 2022年3月19日

ICLR 2022 | 对偶彩票假说！美国东北大学/圣克拉拉大学/Meta提出DLTH：随机子网络变换得到中奖彩票

ICLR 2022 | 对偶彩票假说！美国东北大学/圣克拉拉大学/Meta提出DLTH：随机子网络变换得到中奖彩票

CVer

0+阅读 · 2022年3月17日

CVPR 2022 | 即插即用！助力自监督涨点的ContrastiveCrop开源了！

CVPR 2022 | 即插即用！助力自监督涨点的ContrastiveCrop开源了！

极市平台

1+阅读 · 2022年3月7日

ICML 2021 | AlphaNet：基于α-散度的超网络训练方法

ICML 2021 | AlphaNet：基于α-散度的超网络训练方法

PaperWeekly

0+阅读 · 2021年12月28日

NeurIPS 2021 | 华为诺亚Oral论文：基于频域的二值神经网络训练方法

NeurIPS 2021 | 华为诺亚Oral论文：基于频域的二值神经网络训练方法

PaperWeekly

1+阅读 · 2021年12月17日

「彩票假说」要修正？王言治团队：神经网络要「中奖」，秘密在于学习率！｜ICML 2021

「彩票假说」要修正？王言治团队：神经网络要「中奖」，秘密在于学习率！｜ICML 2021

新智元

0+阅读 · 2021年10月26日

论文浅尝 | 知识图谱推理中表示学习和规则挖掘的迭代学习方法

论文浅尝 | 知识图谱推理中表示学习和规则挖掘的迭代学习方法

开放知识图谱

41+阅读 · 2019年7月2日

相关基金

基于核与核度理论的在线社交网络拓扑结构研究

国家自然科学基金

0+阅读 · 2016年12月31日

复杂网络链接预测与社团发现混合方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于非整数阶梯度的稀疏信号重构方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

泛在网络资源优化若干算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

驱动器饱和受限下分布式系统的合作控制

国家自然科学基金

0+阅读 · 2012年12月31日

广义系统的迭代学习控制算法与应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于随机有限集理论的多目标跟踪方法若干问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

关于图上随机游走、渗流的几个问题

国家自然科学基金

0+阅读 · 2012年12月31日

随机最优控制的数值方法理论及其应用研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于链接权重化的链接预测研究

国家自然科学基金

1+阅读 · 2011年12月31日

相关论文

Breaching the 2-Approximation Barrier for the Forest Augmentation Problem

Arxiv

0+阅读 · 2022年4月20日

Bodyless Block Propagation: TPS Fully Scalable Blockchain with Pre-Validation

Arxiv

0+阅读 · 2022年4月19日

The eigenvector-eigenvalue identity for the quaternion matrix with its algorithm and computer program

Arxiv

0+阅读 · 2022年4月18日

A New Dynamic Algorithm for Densest Subhypergraphs

Arxiv

0+阅读 · 2022年4月17日

BLISS: Robust Sequence-to-Sequence Learning via Self-Supervised Input Representation

Arxiv

0+阅读 · 2022年4月16日

Combinatorics of minimal absent words for a sliding window

Arxiv

0+阅读 · 2022年4月16日

An Experiment of Randomized Hints on an Axiom of Infinite-Valued Lukasiewicz Logic

Arxiv

0+阅读 · 2022年4月15日

Exemplar-based Pattern Synthesis with Implicit Periodic Field Network

Arxiv

0+阅读 · 2022年4月15日

Pre-training Text Representations as Meta Learning

Arxiv

13+阅读 · 2020年4月12日

A Simple Framework for Contrastive Learning of Visual Representations

Arxiv

21+阅读 · 2020年2月13日

大家都在搜

软件无线电

无人机集群

CMU博士论文

国防科技创新

久别重逢话双塔

论文浅尝 - ICLR2020 | 通过神经逻辑归纳学习有效地解释

微信扫码咨询专知VIP会员