Dropout到底在干啥?看完这篇文章,你就知道了

2019 年 5 月 2 日 专知

【导读】Dropout是非常常用的深度学习组件,一般用来做模型正则化或模型压缩,然而,Dropout到底是怎么做的?它有哪些变体?CNN和RNN中Dropout该怎么用?看完这篇文章,你就都知道了。


论文链接:
https://arxiv.org/pdf/1904.13310.pdf
论文题目:
Survey of Dropout Methods for Deep Neural Networks




深度神经网络是当代人工智能和信号处理领域的一个重要课题。它们的大量参数使得它们特别容易过度拟合,在实践中需要正则化方法。Dropout是2012年推出的一种避免过度拟合的技术,随后被应用于2012年的大尺度视觉识别挑战赛 (Large Scale Visual Recognition Challenge) ,该挑战赛彻底改变了深度学习研究。原方法在每次训练迭代中省略概率为0.5的神经网络中的每个神经元,在测试中包含所有神经元。该技术被证明可以显著提高在各种任务上的结果。


近年来,受原始dropout方法的启发而提出的各种随机技术得到了广泛的应用。我们通常使用术语dropout方法来指代它们。其中包括dropconnect、standout、fast dropout、变分dropout、Monte Carlo dropout等。上图展示了对随时间推移的辍学方法的研究。一般来说,dropout方法是在神经网络训练、推理或近似过程中随机修改参数。虽然最初用于避免过度拟合,但dropout方法已经扩展到各种应用程序中。


本篇文章将上述dropout方法进行了一一分析。

请关注专知公众号(点击上方蓝色专知关注

  • 后台回复“dropout” 就可以获取Survey of Dropout Methods for Deep Neural Networks的下载链接~ 


【部分文章】

-END-

专 · 知

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎登录www.zhuanzhi.ai,注册登录专知,获取更多AI知识资料!

欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程视频资料和与专家交流咨询!

请加专知小助手微信(扫一扫如下二维码添加),加入专知人工智能主题群,咨询技术商务合作~

专知《深度学习:算法到实战》课程全部完成!530+位同学在学习,现在报名,限时优惠!网易云课堂人工智能畅销榜首位!

点击“阅读原文”,了解报名专知《深度学习:算法到实战》课程

登录查看更多
25

相关内容

一份循环神经网络RNNs简明教程,37页ppt
专知会员服务
172+阅读 · 2020年5月6日
麻省理工学院MIT-ICLR2020《神经网络能推断出什么?》
专知会员服务
50+阅读 · 2020年2月19日
模型压缩究竟在做什么?我们真的需要模型压缩么?
专知会员服务
27+阅读 · 2020年1月16日
【新书】傻瓜式入门深度学习,371页pdf
专知会员服务
188+阅读 · 2019年12月28日
复旦大学邱锡鹏老师《神经网络与深度学习》书册最新版
模型不work怎么办?141页PPT告诉你怎么改模型
深度学习了解一下(附53页Slides)
专知
48+阅读 · 2019年5月20日
最新415页《人工智能与机器人原理》书籍
专知
11+阅读 · 2019年3月31日
3D Deep Learning on Medical Images: A Review
Arxiv
12+阅读 · 2020年4月1日
Meta-Learning with Implicit Gradients
Arxiv
13+阅读 · 2019年9月10日
Generalization and Regularization in DQN
Arxiv
6+阅读 · 2019年1月30日
Feature Selection Library (MATLAB Toolbox)
Arxiv
7+阅读 · 2018年8月6日
VIP会员
Top
微信扫码咨询专知VIP会员