【PNAS】深度神经网络中的理论议题，麻省理工Tomaso Poggio撰写 - 专知VIP

会员服务 ·

1

深度神经网络 · 深度学习理论 ·

2021 年 1 月 23 日

【PNAS】深度神经网络中的理论议题，麻省理工Tomaso Poggio撰写

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

虽然深度学习在许多应用中都取得了成功，但它在理论上还没有得到很好的理解。尽管存在过度参数化和缺乏显式正则化，但深度学习的理论表征应该回答有关其近似能力、优化动力学和强泛化性能的问题。为了实现这一目标，我们回顾了最近的成果。在近似理论中，浅层网络和深层网络都可以以指数代价逼近任意连续函数。但是，我们证明了对于某些类型的合成函数，卷积型深度网络(即使没有权值共享)可以避免维数诅咒。在描述最小化经验指数损失时，我们考虑权值方向的梯度流动，而不是权值本身，因为相关的分类函数对应于归一化网络。归一化权值的动力学结果等价于在单位范数约束下最小化损失的约束问题。特别地，典型梯度下降动力学与约束问题具有相同的临界点。因此，在梯度流中，在指数型损失函数下训练深度网络存在隐式正则化。因此，临界点对应于损失的最小常模infima。这个结果特别相关，因为它最近表明，对于过度参数化的模型，选择最小范数解决方案优化了交叉验证留下一的稳定性，从而优化了预期误差。因此，我们的结果表明梯度下降深度网络的期望误差最小。

https://www.pnas.org/content/117/48/30039

成为VIP会员查看完整内容

20

相关内容

深度神经网络

深度神经网络

深度神经网络（DNN）是深度学习的一种框架，它是一种具备至少一个隐层的神经网络。与浅层神经网络类似，深度神经网络也能够为复杂非线性系统提供建模，但多出的层次为模型提供了更高的抽象层次，因而提高了模型的能力。

UIUC《深度学习理论》硬核课程书，Matus 教授最新讲解，131页pdf

UIUC《深度学习理论》硬核课程书，Matus 教授最新讲解，131页pdf

专知会员服务

64+阅读 · 2021年1月8日

最新《非凸优化理论》进展书册，79页pdf

最新《非凸优化理论》进展书册，79页pdf

专知会员服务

112+阅读 · 2020年12月18日

【NeurIPS2020-北大】非凸优化裁剪算法的改进分析

【NeurIPS2020-北大】非凸优化裁剪算法的改进分析

专知会员服务

29+阅读 · 2020年10月11日

【ICML2020】深度神经网络置信感知学习，Conﬁdence-Aware Learning for Deep Neural Networks

【ICML2020】深度神经网络置信感知学习，Conﬁdence-Aware Learning for Deep Neural Networks

专知会员服务

74+阅读 · 2020年7月6日

【Nature论文】深度网络中的梯度下降复杂度控制

【Nature论文】深度网络中的梯度下降复杂度控制

专知会员服务

41+阅读 · 2020年3月9日

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

专知

27+阅读 · 2020年2月25日

从动力学角度看优化算法：一个更整体的视角

从动力学角度看优化算法：一个更整体的视角

黑龙江大学自然语言处理实验室

8+阅读 · 2019年1月28日

从动力学角度看优化算法：自适应学习率算法

从动力学角度看优化算法：自适应学习率算法

PaperWeekly

8+阅读 · 2018年12月27日

深度 | 如何理解深度学习的优化？通过分析梯度下降的轨迹

深度 | 如何理解深度学习的优化？通过分析梯度下降的轨迹

机器之心

8+阅读 · 2018年11月20日

再谈变分自编码器VAE：从贝叶斯观点出发

再谈变分自编码器VAE：从贝叶斯观点出发

PaperWeekly

13+阅读 · 2018年4月2日

Taming Wild Price Fluctuations: Monotone Stochastic Convex Optimization with Bandit Feedback

Arxiv

0+阅读 · 2021年3月16日

Of Toasts and Tails

Arxiv

0+阅读 · 2021年3月15日

Deep Learning on Image Denoising: An overview

Arxiv

13+阅读 · 2020年8月3日

Few-shot acoustic event detection via meta-learning

Arxiv

26+阅读 · 2020年2月21日

Precise Detection in Densely Packed Scenes

Precise Detection in Densely Packed Scenes

Arxiv

3+阅读 · 2019年4月8日

VIP会员

相关主题

深度神经网络

深度学习理论

相关VIP内容

UIUC《深度学习理论》硬核课程书，Matus 教授最新讲解，131页pdf

UIUC《深度学习理论》硬核课程书，Matus 教授最新讲解，131页pdf

专知会员服务

64+阅读 · 2021年1月8日

最新《非凸优化理论》进展书册，79页pdf

最新《非凸优化理论》进展书册，79页pdf

专知会员服务

112+阅读 · 2020年12月18日

【NeurIPS2020-北大】非凸优化裁剪算法的改进分析

【NeurIPS2020-北大】非凸优化裁剪算法的改进分析

专知会员服务

29+阅读 · 2020年10月11日

【ICML2020】深度神经网络置信感知学习，Conﬁdence-Aware Learning for Deep Neural Networks

【ICML2020】深度神经网络置信感知学习，Conﬁdence-Aware Learning for Deep Neural Networks

专知会员服务

74+阅读 · 2020年7月6日

【Nature论文】深度网络中的梯度下降复杂度控制

【Nature论文】深度网络中的梯度下降复杂度控制

专知会员服务

41+阅读 · 2020年3月9日

热门VIP内容

开通专知VIP会员享更多权益服务

因果强化学习的统一框架：综述、分类体系、算法与应用

《无人机系统 - 反无人机系统：测试方法》364页

【MIT博士论文】语言模型的推理时学习算法

美军低成本无人作战攻击系统（LUCAS）：扩大无人机战争规模

相关资讯

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

专知

27+阅读 · 2020年2月25日

从动力学角度看优化算法：一个更整体的视角

从动力学角度看优化算法：一个更整体的视角

黑龙江大学自然语言处理实验室

8+阅读 · 2019年1月28日

从动力学角度看优化算法：自适应学习率算法

从动力学角度看优化算法：自适应学习率算法

PaperWeekly

8+阅读 · 2018年12月27日

深度 | 如何理解深度学习的优化？通过分析梯度下降的轨迹

深度 | 如何理解深度学习的优化？通过分析梯度下降的轨迹

机器之心

8+阅读 · 2018年11月20日

再谈变分自编码器VAE：从贝叶斯观点出发

再谈变分自编码器VAE：从贝叶斯观点出发

PaperWeekly

13+阅读 · 2018年4月2日

相关论文

Taming Wild Price Fluctuations: Monotone Stochastic Convex Optimization with Bandit Feedback

Arxiv

0+阅读 · 2021年3月16日

Of Toasts and Tails

Arxiv

0+阅读 · 2021年3月15日

Deep Learning on Image Denoising: An overview

Arxiv

13+阅读 · 2020年8月3日

Few-shot acoustic event detection via meta-learning

Arxiv

26+阅读 · 2020年2月21日

Precise Detection in Densely Packed Scenes

Precise Detection in Densely Packed Scenes

Arxiv

3+阅读 · 2019年4月8日

微信扫码咨询专知VIP会员