深度学习在实践中的显著成功,从理论的角度揭示了一些重大的惊喜。特别是,简单的梯度方法很容易找到非凸优化问题的接近最优的解决方案,尽管在没有任何明确的努力控制模型复杂性的情况下,这些方法提供了近乎完美的训练数据,这些方法显示了优秀的预测精度。我们推测这些现象背后有特定的原理: 过度参数化允许梯度方法找到插值解,这些方法隐含地施加正则化,过度参数化导致良性过拟合,也就是说,尽管过拟合训练数据,但仍能准确预测。在这篇文章中,我们调查了统计学习理论的最新进展,它提供了在更简单的设置中说明这些原则的例子。我们首先回顾经典的一致收敛结果以及为什么它们不能解释深度学习方法的行为方面。我们在简单的设置中给出隐式正则化的例子,在这些例子中,梯度方法可以得到完美匹配训练数据的最小范数函数。然后我们回顾显示良性过拟合的预测方法,关注二次损失的回归问题。对于这些方法,我们可以将预测规则分解为一个用于预测的简单组件和一个用于过拟合的尖状组件,但在良好的设置下,不会损害预测精度。我们特别关注神经网络的线性区域,其中网络可以用一个线性模型来近似。在这种情况下,我们证明了梯度流的成功,并考虑了双层网络的良性过拟合,给出了精确的渐近分析,精确地证明了过参数化的影响。最后,我们强调了在将这些见解扩展到现实的深度学习设置中出现的关键挑战。

https://www.zhuanzhi.ai/paper/324cdbb68665c1675a05bc147210d8c8

成为VIP会员查看完整内容
73

相关内容

最新《深度学习人体姿态估计》综述论文,26页pdf
专知会员服务
39+阅读 · 2020年12月29日
最新《深度学习视频异常检测》2020综述论文,21页pdf
专知会员服务
85+阅读 · 2020年9月30日
专知会员服务
72+阅读 · 2020年9月20日
专知会员服务
65+阅读 · 2020年9月10日
最新《深度持续学习》综述论文,32页pdf
专知会员服务
182+阅读 · 2020年9月7日
专知会员服务
100+阅读 · 2020年7月20日
最新《深度多模态数据分析》综述论文,26页pdf
专知会员服务
299+阅读 · 2020年6月16日
最新《图嵌入组合优化》综述论文,40页pdf
最新《动态网络嵌入》综述论文,25页pdf
专知
34+阅读 · 2020年6月17日
【新书册】贝叶斯神经网络,41页pdf
专知
28+阅读 · 2020年6月3日
图数据表示学习综述论文
专知
52+阅读 · 2019年6月10日
7个实用的深度学习技巧
机器学习算法与Python学习
16+阅读 · 2019年3月6日
深度学习综述(下载PDF版)
机器学习算法与Python学习
27+阅读 · 2018年7月3日
深度学习中的五大正则化方法和七大优化策略
全球人工智能
11+阅读 · 2017年12月25日
Arxiv
0+阅读 · 2021年5月9日
Arxiv
18+阅读 · 2021年3月16日
Arxiv
32+阅读 · 2021年3月8日
Learning in the Frequency Domain
Arxiv
11+阅读 · 2020年3月12日
VIP会员
相关主题
相关VIP内容
最新《深度学习人体姿态估计》综述论文,26页pdf
专知会员服务
39+阅读 · 2020年12月29日
最新《深度学习视频异常检测》2020综述论文,21页pdf
专知会员服务
85+阅读 · 2020年9月30日
专知会员服务
72+阅读 · 2020年9月20日
专知会员服务
65+阅读 · 2020年9月10日
最新《深度持续学习》综述论文,32页pdf
专知会员服务
182+阅读 · 2020年9月7日
专知会员服务
100+阅读 · 2020年7月20日
最新《深度多模态数据分析》综述论文,26页pdf
专知会员服务
299+阅读 · 2020年6月16日
相关资讯
最新《图嵌入组合优化》综述论文,40页pdf
最新《动态网络嵌入》综述论文,25页pdf
专知
34+阅读 · 2020年6月17日
【新书册】贝叶斯神经网络,41页pdf
专知
28+阅读 · 2020年6月3日
图数据表示学习综述论文
专知
52+阅读 · 2019年6月10日
7个实用的深度学习技巧
机器学习算法与Python学习
16+阅读 · 2019年3月6日
深度学习综述(下载PDF版)
机器学习算法与Python学习
27+阅读 · 2018年7月3日
深度学习中的五大正则化方法和七大优化策略
全球人工智能
11+阅读 · 2017年12月25日
微信扫码咨询专知VIP会员