虽然深度学习在许多应用中都取得了成功,但它在理论上还没有得到很好的理解。尽管存在过度参数化和缺乏显式正则化,但深度学习的理论表征应该回答有关其近似能力、优化动力学和强泛化性能的问题。为了实现这一目标,我们回顾了最近的成果。在近似理论中,浅层网络和深层网络都可以以指数代价逼近任意连续函数。但是,我们证明了对于某些类型的合成函数,卷积型深度网络(即使没有权值共享)可以避免维数诅咒。在描述最小化经验指数损失时,我们考虑权值方向的梯度流动,而不是权值本身,因为相关的分类函数对应于归一化网络。归一化权值的动力学结果等价于在单位范数约束下最小化损失的约束问题。特别地,典型梯度下降动力学与约束问题具有相同的临界点。因此,在梯度流中,在指数型损失函数下训练深度网络存在隐式正则化。因此,临界点对应于损失的最小常模infima。这个结果特别相关,因为它最近表明,对于过度参数化的模型,选择最小范数解决方案优化了交叉验证留下一的稳定性,从而优化了预期误差。因此,我们的结果表明梯度下降深度网络的期望误差最小。

https://www.pnas.org/content/117/48/30039

成为VIP会员查看完整内容
20

相关内容

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。
最新《非凸优化理论》进展书册,79页pdf
专知会员服务
109+阅读 · 2020年12月18日
最新《深度卷积神经网络理论》报告,35页ppt
专知会员服务
46+阅读 · 2020年11月30日
【NeurIPS2020-北大】非凸优化裁剪算法的改进分析
专知会员服务
29+阅读 · 2020年10月11日
【ECAI2020】可扩展深度学习: 理论与算法,120页ppt
专知会员服务
28+阅读 · 2020年9月25日
【经典书】机器学习高斯过程,266页pdf
专知会员服务
197+阅读 · 2020年5月2日
【Nature论文】深度网络中的梯度下降复杂度控制
专知会员服务
40+阅读 · 2020年3月9日
从动力学角度看优化算法:一个更整体的视角
黑龙江大学自然语言处理实验室
8+阅读 · 2019年1月28日
从动力学角度看优化算法:自适应学习率算法
PaperWeekly
8+阅读 · 2018年12月27日
220页深度神经网络基础、理论与挑战PPT【下载】
机器学习算法与Python学习
8+阅读 · 2018年9月12日
再谈变分自编码器VAE:从贝叶斯观点出发
PaperWeekly
13+阅读 · 2018年4月2日
2017年深度学习优化算法最新综述
计算机视觉战队
7+阅读 · 2017年12月18日
Arxiv
18+阅读 · 2021年3月16日
Arxiv
0+阅读 · 2021年3月15日
Arxiv
0+阅读 · 2021年3月13日
Arxiv
7+阅读 · 2020年12月10日
Arxiv
13+阅读 · 2020年8月3日
Arxiv
26+阅读 · 2020年2月21日
Precise Detection in Densely Packed Scenes
Arxiv
3+阅读 · 2019年4月8日
Arxiv
5+阅读 · 2018年10月11日
VIP会员
相关VIP内容
最新《非凸优化理论》进展书册,79页pdf
专知会员服务
109+阅读 · 2020年12月18日
最新《深度卷积神经网络理论》报告,35页ppt
专知会员服务
46+阅读 · 2020年11月30日
【NeurIPS2020-北大】非凸优化裁剪算法的改进分析
专知会员服务
29+阅读 · 2020年10月11日
【ECAI2020】可扩展深度学习: 理论与算法,120页ppt
专知会员服务
28+阅读 · 2020年9月25日
【经典书】机器学习高斯过程,266页pdf
专知会员服务
197+阅读 · 2020年5月2日
【Nature论文】深度网络中的梯度下降复杂度控制
专知会员服务
40+阅读 · 2020年3月9日
相关资讯
从动力学角度看优化算法:一个更整体的视角
黑龙江大学自然语言处理实验室
8+阅读 · 2019年1月28日
从动力学角度看优化算法:自适应学习率算法
PaperWeekly
8+阅读 · 2018年12月27日
220页深度神经网络基础、理论与挑战PPT【下载】
机器学习算法与Python学习
8+阅读 · 2018年9月12日
再谈变分自编码器VAE:从贝叶斯观点出发
PaperWeekly
13+阅读 · 2018年4月2日
2017年深度学习优化算法最新综述
计算机视觉战队
7+阅读 · 2017年12月18日
相关论文
Arxiv
18+阅读 · 2021年3月16日
Arxiv
0+阅读 · 2021年3月15日
Arxiv
0+阅读 · 2021年3月13日
Arxiv
7+阅读 · 2020年12月10日
Arxiv
13+阅读 · 2020年8月3日
Arxiv
26+阅读 · 2020年2月21日
Precise Detection in Densely Packed Scenes
Arxiv
3+阅读 · 2019年4月8日
Arxiv
5+阅读 · 2018年10月11日
微信扫码咨询专知VIP会员