【CVPR2020】用多样性最大化克服单样本NAS中的多模型遗忘 - 专知VIP

会员服务 ·

2

CVPR 2020 · 神经架构搜索 ·

2020 年 5 月 16 日

【CVPR2020】用多样性最大化克服单样本NAS中的多模型遗忘

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

一次性神经架构搜索(NAS)通过权重共享显著提高了计算效率。然而，这种方法也在超网络训练(架构搜索阶段)中引入了多模型遗忘，在超网络训练中，当使用部分共享的权重顺序训练新架构时，之前架构的性能会下降。为了克服这种灾难性遗忘，最先进的方法假设共享权值在联合优化后验概率时是最优的。然而，这种严格的假设在实践中并不一定适用于一次性NAS。在本文中，我们将一次性NAS中的超网络训练描述为一个持续学习的约束优化问题，即当前架构的学习不应该降低以前架构的性能。提出了一种基于新搜索的结构选择损失函数，并证明了在最大化所选约束的多样性时，不需要严格的假设就可以计算后验概率。设计了一种贪心查新方法，寻找最具代表性的子集，对超网络训练进行正则化。我们将我们提出的方法应用于两个一次性的NAS基线，随机抽样NAS (RandomNAS)和基于梯度的抽样NAS (GDAS)。大量的实验证明，我们的方法提高了超级网络在一次NAS中的预测能力，并在CIFAR-10、CIFAR-100和PTB上取得了显著的效率。

成为VIP会员查看完整内容

21

相关内容

CVPR 2020

CVPR is the premier annual computer vision event comprising the main conference and several co-located workshops and short courses. With its high quality and low cost, it provides an exceptional value for students, academics and industry researchers. CVPR 2020 will take place at The Washington State Convention Center in Seattle, WA, from June 16 to June 20, 2020. http://cvpr2020.thecvf.com/

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

专知会员服务

70+阅读 · 2020年7月1日

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知会员服务

85+阅读 · 2020年6月9日

【ICML2020】小样本目标检测

【ICML2020】小样本目标检测

专知会员服务

91+阅读 · 2020年6月2日

【CVPR2020】我们能用强化学习来学习图模型推断的启发规则吗?

专知会员服务

43+阅读 · 2020年5月5日

【CVPR2020-港中文】图像识别中的自注意力探索

【CVPR2020-港中文】图像识别中的自注意力探索

专知会员服务

56+阅读 · 2020年4月29日

【CVPR2020-Oral】用于任务感知的持续学习的条件信道门控网络

专知会员服务

21+阅读 · 2020年4月2日

【华南理工大学-CVPR2020-Oral】通过结构正则化深度聚类实现无监督域自适应

专知会员服务

56+阅读 · 2020年3月20日

【伯克利】通过增大模型加速Transformer训练和推理

专知会员服务

45+阅读 · 2020年3月6日

【斯坦福大学】Dropout的隐性和显性正则化效应，Regularization Effects

【斯坦福大学】Dropout的隐性和显性正则化效应，Regularization Effects

专知会员服务

34+阅读 · 2020年3月4日

【Uber AI新论文】持续元学习，Learning to Continually Learn

【Uber AI新论文】持续元学习，Learning to Continually Learn

专知会员服务

37+阅读 · 2020年2月27日

谷歌提出新分类损失函数：将噪声对训练结果影响降到最低

谷歌提出新分类损失函数：将噪声对训练结果影响降到最低

量子位

8+阅读 · 2019年8月28日

【学界】大幅减少训练迭代次数，提高泛化能力：IBM提出「新版Dropout」

【学界】大幅减少训练迭代次数，提高泛化能力：IBM提出「新版Dropout」

GAN生成式对抗网络

7+阅读 · 2019年6月7日

利用神经网络进行序列到序列转换的学习

利用神经网络进行序列到序列转换的学习

AI研习社

12+阅读 · 2019年4月26日

CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

PaperWeekly

5+阅读 · 2019年4月19日

介绍高维超参数调整 - 优化ML模型的最佳实践

介绍高维超参数调整 - 优化ML模型的最佳实践

AI研习社

7+阅读 · 2019年4月17日

FAIR&MIT提出知识蒸馏新方法：数据集蒸馏

FAIR&MIT提出知识蒸馏新方法：数据集蒸馏

机器之心

7+阅读 · 2019年2月7日

CMU、谷歌提出Transformer-XL：学习超长上下文关系

CMU、谷歌提出Transformer-XL：学习超长上下文关系

机器之心

9+阅读 · 2019年1月18日

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

机器之心

15+阅读 · 2018年10月21日

误差反向传播——RNN

误差反向传播——RNN

统计学习与视觉计算组

18+阅读 · 2018年9月6日

教程 | 拟合目标函数后验分布的调参利器：贝叶斯优化

教程 | 拟合目标函数后验分布的调参利器：贝叶斯优化

机器之心

6+阅读 · 2017年8月18日

Imitation Learning for Fashion Style Based on Hierarchical Multimodal Representation

Imitation Learning for Fashion Style Based on Hierarchical Multimodal Representation

Arxiv

8+阅读 · 2020年4月13日

Pre-training Text Representations as Meta Learning

Arxiv

13+阅读 · 2020年4月12日

Language as an Abstraction for Hierarchical Deep Reinforcement Learning

Language as an Abstraction for Hierarchical Deep Reinforcement Learning

Arxiv

5+阅读 · 2019年6月18日

Dynamic Transfer Learning for Named Entity Recognition

Dynamic Transfer Learning for Named Entity Recognition

Arxiv

5+阅读 · 2019年5月1日

Few-shot classification in Named Entity Recognition Task

Arxiv

6+阅读 · 2018年12月14日

Self-Attention with Relative Position Representations

Arxiv

27+阅读 · 2018年4月12日

Zero-Shot Object Detection

Arxiv

9+阅读 · 2018年4月12日

Graph Attention Networks

Arxiv

10+阅读 · 2018年2月4日

MR image reconstruction using deep density priors

Arxiv

5+阅读 · 2018年1月17日

A Unified approach for Conventional Zero-shot, Generalized Zero-shot and Few-shot Learning

Arxiv

4+阅读 · 2017年10月26日

VIP会员

相关主题

神经架构搜索

相关VIP内容

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

专知会员服务

70+阅读 · 2020年7月1日

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知会员服务

85+阅读 · 2020年6月9日

【ICML2020】小样本目标检测

【ICML2020】小样本目标检测

专知会员服务

91+阅读 · 2020年6月2日

【CVPR2020】我们能用强化学习来学习图模型推断的启发规则吗?

专知会员服务

43+阅读 · 2020年5月5日

【CVPR2020-港中文】图像识别中的自注意力探索

【CVPR2020-港中文】图像识别中的自注意力探索

专知会员服务

56+阅读 · 2020年4月29日

【CVPR2020-Oral】用于任务感知的持续学习的条件信道门控网络

专知会员服务

21+阅读 · 2020年4月2日

【华南理工大学-CVPR2020-Oral】通过结构正则化深度聚类实现无监督域自适应

专知会员服务

56+阅读 · 2020年3月20日

【伯克利】通过增大模型加速Transformer训练和推理

专知会员服务

45+阅读 · 2020年3月6日

【斯坦福大学】Dropout的隐性和显性正则化效应，Regularization Effects

【斯坦福大学】Dropout的隐性和显性正则化效应，Regularization Effects

专知会员服务

34+阅读 · 2020年3月4日

【Uber AI新论文】持续元学习，Learning to Continually Learn

【Uber AI新论文】持续元学习，Learning to Continually Learn

专知会员服务

37+阅读 · 2020年2月27日

热门VIP内容

开通专知VIP会员享更多权益服务

GPT-5如何对齐？从硬性拒绝到安全完成：走向以输出为中心的安全训练

【伯克利博士论文】超越人类监督的视觉智能

【ICCV2025】SO(3) 上连续非保守动力系统的预测

2025年中国数据要素行业发展研究报告

相关资讯

谷歌提出新分类损失函数：将噪声对训练结果影响降到最低

谷歌提出新分类损失函数：将噪声对训练结果影响降到最低

量子位

8+阅读 · 2019年8月28日

【学界】大幅减少训练迭代次数，提高泛化能力：IBM提出「新版Dropout」

【学界】大幅减少训练迭代次数，提高泛化能力：IBM提出「新版Dropout」

GAN生成式对抗网络

7+阅读 · 2019年6月7日

利用神经网络进行序列到序列转换的学习

利用神经网络进行序列到序列转换的学习

AI研习社

12+阅读 · 2019年4月26日

CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

PaperWeekly

5+阅读 · 2019年4月19日

介绍高维超参数调整 - 优化ML模型的最佳实践

介绍高维超参数调整 - 优化ML模型的最佳实践

AI研习社

7+阅读 · 2019年4月17日

FAIR&MIT提出知识蒸馏新方法：数据集蒸馏

FAIR&MIT提出知识蒸馏新方法：数据集蒸馏

机器之心

7+阅读 · 2019年2月7日

CMU、谷歌提出Transformer-XL：学习超长上下文关系

CMU、谷歌提出Transformer-XL：学习超长上下文关系

机器之心

9+阅读 · 2019年1月18日

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

机器之心

15+阅读 · 2018年10月21日

误差反向传播——RNN

误差反向传播——RNN

统计学习与视觉计算组

18+阅读 · 2018年9月6日

教程 | 拟合目标函数后验分布的调参利器：贝叶斯优化

教程 | 拟合目标函数后验分布的调参利器：贝叶斯优化

机器之心

6+阅读 · 2017年8月18日

相关论文

Imitation Learning for Fashion Style Based on Hierarchical Multimodal Representation

Imitation Learning for Fashion Style Based on Hierarchical Multimodal Representation

Arxiv

8+阅读 · 2020年4月13日

Pre-training Text Representations as Meta Learning

Arxiv

13+阅读 · 2020年4月12日

Language as an Abstraction for Hierarchical Deep Reinforcement Learning

Language as an Abstraction for Hierarchical Deep Reinforcement Learning

Arxiv

5+阅读 · 2019年6月18日

Dynamic Transfer Learning for Named Entity Recognition

Dynamic Transfer Learning for Named Entity Recognition

Arxiv

5+阅读 · 2019年5月1日

Few-shot classification in Named Entity Recognition Task

Arxiv

6+阅读 · 2018年12月14日

Self-Attention with Relative Position Representations

Arxiv

27+阅读 · 2018年4月12日

Zero-Shot Object Detection

Arxiv

9+阅读 · 2018年4月12日

Graph Attention Networks

Arxiv

10+阅读 · 2018年2月4日

MR image reconstruction using deep density priors

Arxiv

5+阅读 · 2018年1月17日

A Unified approach for Conventional Zero-shot, Generalized Zero-shot and Few-shot Learning

Arxiv

4+阅读 · 2017年10月26日

微信扫码咨询专知VIP会员