【斯坦福大学】Dropout的隐性和显性正则化效应，Regularization Effects - 专知VIP

会员服务 ·

8

Dropout · 正则化 · 深度学习 ·

2020 年 3 月 4 日

【斯坦福大学】Dropout的隐性和显性正则化效应，Regularization Effects

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

Dropout是一种广泛使用的正则化技术，通常需要为许多体系结构获得最先进的技术。这项工作表明，dropout引入了两种截然不同但相互纠缠的正则化效应:由于dropout修改了预期的训练目标而产生的显式效应(在之前的工作中也研究过)，以及可能令人惊讶的是，dropout训练更新中的随机性带来的另一种隐式效应。这种隐式正则化效应类似于小批量随机梯度下降中的随机度效应。我们通过控制实验把这两种效应分开。然后，我们推导出分析的简化，用模型的导数和损失来描述每个影响，对于深度神经网络。我们证明了这些简化的、解析的正则化器准确地捕获了辍学的重要方面，表明它们在实践中忠实地替代了dropout。

成为VIP会员查看完整内容

34

相关内容

Dropout

Dropout就是指在深度学习网络的训练过程中，对于神经网络单元，按照一定的概率将其暂时从网络中丢弃。Dropout可以减轻过拟合问题。

【ICML2020】持续图神经网络，Continuous Graph Neural Networks

【ICML2020】持续图神经网络，Continuous Graph Neural Networks

专知会员服务

151+阅读 · 2020年6月28日

【ICML2020-MIT】常曲率图卷积神经网络，构建非欧几里得GCN（附论文和76页ppt）

【ICML2020-MIT】常曲率图卷积神经网络，构建非欧几里得GCN（附论文和76页ppt）

专知会员服务

67+阅读 · 2020年6月21日

【ICML2020】小样本目标检测

【ICML2020】小样本目标检测

专知会员服务

91+阅读 · 2020年6月2日

生成对抗网络GAN正则化方法: 近期研究综述

专知会员服务

109+阅读 · 2020年5月21日

【CVPR2020】用多样性最大化克服单样本NAS中的多模型遗忘

【CVPR2020】用多样性最大化克服单样本NAS中的多模型遗忘

专知会员服务

21+阅读 · 2020年5月16日

【华南理工大学-CVPR2020-Oral】通过结构正则化深度聚类实现无监督域自适应

专知会员服务

56+阅读 · 2020年3月20日

【MIT】对抗鲁棒性的流形正则化，Manifold Regularization for Adversarial Robustness

【MIT】对抗鲁棒性的流形正则化，Manifold Regularization for Adversarial Robustness

专知会员服务

28+阅读 · 2020年3月11日

最大均方差正则化贝叶斯神经网络，Bayesian Neural Networks With Maximum Mean Discrepancy Regularization

最大均方差正则化贝叶斯神经网络，Bayesian Neural Networks With Maximum Mean Discrepancy Regularization

专知会员服务

54+阅读 · 2020年3月5日

【谷歌大脑新论文】利用可微摄动优化器进行学习，Learning with Differentiable Perturbed Optimizers

【谷歌大脑新论文】利用可微摄动优化器进行学习，Learning with Differentiable Perturbed Optimizers

专知会员服务

29+阅读 · 2020年2月22日

使用图卷积网络对多药副作用进行建模（Modeling polypharmacy side effects with graph convolutional networks）

使用图卷积网络对多药副作用进行建模（Modeling polypharmacy side effects with graph convolutional networks）

专知会员服务

36+阅读 · 2019年12月12日

【学界】大幅减少训练迭代次数，提高泛化能力：IBM提出「新版Dropout」

【学界】大幅减少训练迭代次数，提高泛化能力：IBM提出「新版Dropout」

GAN生成式对抗网络

7+阅读 · 2019年6月7日

这一份217页斯坦福大学统计学习理论笔记，Percy Liang带你搞清楚难懂的理论基础

这一份217页斯坦福大学统计学习理论笔记，Percy Liang带你搞清楚难懂的理论基础

专知

24+阅读 · 2018年12月20日

生姜外泌体miRNAs调节肠道菌群缓解肠道炎症|Cell Host & Microbe

生姜外泌体miRNAs调节肠道菌群缓解肠道炎症|Cell Host & Microbe

外泌体之家

4+阅读 · 2018年11月1日

误差反向传播——RNN

误差反向传播——RNN

统计学习与视觉计算组

18+阅读 · 2018年9月6日

人间充质干细胞来源的外泌体通过逆转胰岛素抵抗和缓解β细胞损伤从而减轻II型糖尿病

人间充质干细胞来源的外泌体通过逆转胰岛素抵抗和缓解β细胞损伤从而减轻II型糖尿病

外泌体之家

8+阅读 · 2018年7月30日

从零开始深度学习：dropout与正则化

从零开始深度学习：dropout与正则化

数萃大数据

7+阅读 · 2018年7月22日

深度学习面试100题（第31-35题）

深度学习面试100题（第31-35题）

七月在线实验室

8+阅读 · 2018年7月16日

L2正则化视角下的对抗样本

L2正则化视角下的对抗样本

极市平台

7+阅读 · 2018年7月13日

入门 | 深度学习模型的简单优化技巧

入门 | 深度学习模型的简单优化技巧

机器之心

10+阅读 · 2018年6月10日

BAT题库 | 机器学习面试1000题系列（第196~200题）

BAT题库 | 机器学习面试1000题系列（第196~200题）

七月在线实验室

17+阅读 · 2017年11月16日

Conditional Channel Gated Networks for Task-Aware Continual Learning

Arxiv

5+阅读 · 2020年3月31日

Self-training with Noisy Student improves ImageNet classification

Arxiv

15+阅读 · 2019年11月11日

Bivariate Beta LSTM

Bivariate Beta LSTM

Arxiv

6+阅读 · 2019年10月7日

Position-aware Graph Neural Networks

Position-aware Graph Neural Networks

Arxiv

15+阅读 · 2019年6月11日

Meta-Learning with Differentiable Convex Optimization

Arxiv

5+阅读 · 2019年4月23日

Ordered Neurons: Integrating Tree Structures into Recurrent Neural Networks

Ordered Neurons: Integrating Tree Structures into Recurrent Neural Networks

Arxiv

4+阅读 · 2018年11月21日

Knowledge Graph Completion to Predict Polypharmacy Side Effects

Arxiv

3+阅读 · 2018年10月22日

Physical Primitive Decomposition

Physical Primitive Decomposition

Arxiv

4+阅读 · 2018年9月13日

Token-level and sequence-level loss smoothing for RNN language models

Arxiv

7+阅读 · 2018年5月14日

Dr.VAE: Drug Response Variational Autoencoder

Arxiv

3+阅读 · 2017年7月6日

VIP会员

相关主题

相关VIP内容

【ICML2020】持续图神经网络，Continuous Graph Neural Networks

【ICML2020】持续图神经网络，Continuous Graph Neural Networks

专知会员服务

151+阅读 · 2020年6月28日

【ICML2020-MIT】常曲率图卷积神经网络，构建非欧几里得GCN（附论文和76页ppt）

【ICML2020-MIT】常曲率图卷积神经网络，构建非欧几里得GCN（附论文和76页ppt）

专知会员服务

67+阅读 · 2020年6月21日

【ICML2020】小样本目标检测

【ICML2020】小样本目标检测

专知会员服务

91+阅读 · 2020年6月2日

生成对抗网络GAN正则化方法: 近期研究综述

专知会员服务

109+阅读 · 2020年5月21日

【CVPR2020】用多样性最大化克服单样本NAS中的多模型遗忘

【CVPR2020】用多样性最大化克服单样本NAS中的多模型遗忘

专知会员服务

21+阅读 · 2020年5月16日

【华南理工大学-CVPR2020-Oral】通过结构正则化深度聚类实现无监督域自适应

专知会员服务

56+阅读 · 2020年3月20日

【MIT】对抗鲁棒性的流形正则化，Manifold Regularization for Adversarial Robustness

【MIT】对抗鲁棒性的流形正则化，Manifold Regularization for Adversarial Robustness

专知会员服务

28+阅读 · 2020年3月11日

最大均方差正则化贝叶斯神经网络，Bayesian Neural Networks With Maximum Mean Discrepancy Regularization

最大均方差正则化贝叶斯神经网络，Bayesian Neural Networks With Maximum Mean Discrepancy Regularization

专知会员服务

54+阅读 · 2020年3月5日

【谷歌大脑新论文】利用可微摄动优化器进行学习，Learning with Differentiable Perturbed Optimizers

【谷歌大脑新论文】利用可微摄动优化器进行学习，Learning with Differentiable Perturbed Optimizers

专知会员服务

29+阅读 · 2020年2月22日

使用图卷积网络对多药副作用进行建模（Modeling polypharmacy side effects with graph convolutional networks）

使用图卷积网络对多药副作用进行建模（Modeling polypharmacy side effects with graph convolutional networks）

专知会员服务

36+阅读 · 2019年12月12日

热门VIP内容

开通专知VIP会员享更多权益服务

《战区安全决策课程体系》最新244页

《"无人机航母"原型平台》

任务规划与地形分析：现代复杂环境作战导航体系

《攻击场景描述形式化模型研究》

相关资讯

【学界】大幅减少训练迭代次数，提高泛化能力：IBM提出「新版Dropout」

【学界】大幅减少训练迭代次数，提高泛化能力：IBM提出「新版Dropout」

GAN生成式对抗网络

7+阅读 · 2019年6月7日

这一份217页斯坦福大学统计学习理论笔记，Percy Liang带你搞清楚难懂的理论基础

这一份217页斯坦福大学统计学习理论笔记，Percy Liang带你搞清楚难懂的理论基础

专知

24+阅读 · 2018年12月20日

生姜外泌体miRNAs调节肠道菌群缓解肠道炎症|Cell Host & Microbe

生姜外泌体miRNAs调节肠道菌群缓解肠道炎症|Cell Host & Microbe

外泌体之家

4+阅读 · 2018年11月1日

误差反向传播——RNN

误差反向传播——RNN

统计学习与视觉计算组

18+阅读 · 2018年9月6日

人间充质干细胞来源的外泌体通过逆转胰岛素抵抗和缓解β细胞损伤从而减轻II型糖尿病

人间充质干细胞来源的外泌体通过逆转胰岛素抵抗和缓解β细胞损伤从而减轻II型糖尿病

外泌体之家

8+阅读 · 2018年7月30日

从零开始深度学习：dropout与正则化

从零开始深度学习：dropout与正则化

数萃大数据

7+阅读 · 2018年7月22日

深度学习面试100题（第31-35题）

深度学习面试100题（第31-35题）

七月在线实验室

8+阅读 · 2018年7月16日

L2正则化视角下的对抗样本

L2正则化视角下的对抗样本

极市平台

7+阅读 · 2018年7月13日

入门 | 深度学习模型的简单优化技巧

入门 | 深度学习模型的简单优化技巧

机器之心

10+阅读 · 2018年6月10日

BAT题库 | 机器学习面试1000题系列（第196~200题）

BAT题库 | 机器学习面试1000题系列（第196~200题）

七月在线实验室

17+阅读 · 2017年11月16日

相关论文

Conditional Channel Gated Networks for Task-Aware Continual Learning

Arxiv

5+阅读 · 2020年3月31日

Self-training with Noisy Student improves ImageNet classification

Arxiv

15+阅读 · 2019年11月11日

Bivariate Beta LSTM

Bivariate Beta LSTM

Arxiv

6+阅读 · 2019年10月7日

Position-aware Graph Neural Networks

Position-aware Graph Neural Networks

Arxiv

15+阅读 · 2019年6月11日

Meta-Learning with Differentiable Convex Optimization

Arxiv

5+阅读 · 2019年4月23日

Ordered Neurons: Integrating Tree Structures into Recurrent Neural Networks

Ordered Neurons: Integrating Tree Structures into Recurrent Neural Networks

Arxiv

4+阅读 · 2018年11月21日

Knowledge Graph Completion to Predict Polypharmacy Side Effects

Arxiv

3+阅读 · 2018年10月22日

Physical Primitive Decomposition

Physical Primitive Decomposition

Arxiv

4+阅读 · 2018年9月13日

Token-level and sequence-level loss smoothing for RNN language models

Arxiv

7+阅读 · 2018年5月14日

Dr.VAE: Drug Response Variational Autoencoder

Arxiv

3+阅读 · 2017年7月6日

微信扫码咨询专知VIP会员