深度学习为何泛化好？CMU博士论文《解释深度学习中的泛化性》探究深度学习泛化性的理论基础进展 - 专知VIP

会员服务 ·

18

深度学习 · 深度学习理论 · 深度学习泛化性 · 泛化性 · 博士论文 ·

2021 年 10 月 22 日

深度学习为何泛化好？CMU博士论文《解释深度学习中的泛化性》探究深度学习泛化性的理论基础进展

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

本文研究了深度学习理论中一个基本的开放挑战: 为什么深度网络在过度参数化、非正则化和拟合训练数据为零误差的情况下仍能很好地泛化? 在论文的第一部分，我们将实证研究如何通过随机梯度下降训练深度网络隐式控制网络容量。随后，为了说明这如何导致更好的泛化，我们将推导基于数据的一致收敛的泛化边界，并改进参数计数的依赖性。由于其简单性和通用性，一致收敛实际上已经成为深度学习文献中使用最广泛的工具。鉴于它的流行，在这篇论文中，我们也将后退一步，确定一致收敛的基本极限，作为解释泛化的工具。特别地，我们将证明在一些过度参数化的设置的例子中，任何一致收敛界将只提供一个空洞的泛化界。考虑到这一点，在论文的最后一部分，我们将改变航向，并引入一种经验技术来估计使用未标记数据的泛化。我们的技术不依赖于任何基于一致收敛的复杂性概念，而且非常精确。我们将从理论上说明为什么我们的技术如此精确。最后，我们将讨论未来的工作如何探索在泛化边界中纳入分布假设的新方法(例如以未标记数据的形式)，并探索其他工具来推导边界，可能是通过修改统一收敛或开发完全新的工具。

成为VIP会员查看完整内容

84

相关内容

深度学习

机器学习的一个分支，它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【NeurIPS 2021 】学习理论(有时)可以解释图神经网络中的泛化

【NeurIPS 2021 】学习理论(有时)可以解释图神经网络中的泛化

专知会员服务

30+阅读 · 2021年12月13日

【哈佛大学】深度学习理论实证探究

【哈佛大学】深度学习理论实证探究

专知会员服务

43+阅读 · 2021年11月1日

【哥本哈根博士论文】因果性与泛化:可识别性与学习方法

专知会员服务

65+阅读 · 2021年10月18日

【NeurIPS2021】黑箱学习算法的信息理论泛化界

专知会员服务

23+阅读 · 2021年10月6日

【CMU博士论文】面向分布偏移的自然语言处理学习神经模型，148页pdf

专知会员服务

37+阅读 · 2021年9月7日

【斯坦福博士论文】深度学习医学图像解译，207页pdf

专知会员服务

107+阅读 · 2021年7月17日

「深度学习:一种统计视角」，伯克利&斯坦福89页pdf综述论文

专知会员服务

73+阅读 · 2021年3月20日

【新书册】贝叶斯神经网络，41页pdf

【新书册】贝叶斯神经网络，41页pdf

专知会员服务

180+阅读 · 2020年6月3日

【NeurlPS2019论文总结】一致收敛可能无法解释深度学习中的泛化现象，Uniform convergence may be unable to explain generalization in deep learning

【NeurlPS2019论文总结】一致收敛可能无法解释深度学习中的泛化现象，Uniform convergence may be unable to explain generalization in deep learning

专知会员服务

15+阅读 · 2019年12月17日

【NeurIPS2019 论文】一致收敛可能无法解释深度学习中的泛化现象（Uniform convergence may be unable to explain generalization in deep learning）

【NeurIPS2019 论文】一致收敛可能无法解释深度学习中的泛化现象（Uniform convergence may be unable to explain generalization in deep learning）

专知会员服务

4+阅读 · 2019年12月10日

2020->2021必看的十篇「深度学习领域综述」论文

2020->2021必看的十篇「深度学习领域综述」论文

专知

6+阅读 · 2021年1月1日

贝叶斯与深度学习如何结合？看这份256页《贝叶斯深度学习原理》SPCOM2020硬核教程

贝叶斯与深度学习如何结合？看这份256页《贝叶斯深度学习原理》SPCOM2020硬核教程

专知

20+阅读 · 2020年7月22日

【新书册】贝叶斯神经网络，41页pdf

【新书册】贝叶斯神经网络，41页pdf

专知

29+阅读 · 2020年6月3日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

77+阅读 · 2019年10月20日

田渊栋博士:求道之人，不问寒暑—理解ReLU深度网络训练动态

田渊栋博士:求道之人，不问寒暑—理解ReLU深度网络训练动态

极市平台

7+阅读 · 2019年6月5日

MIT课程：深度学习背后的科学—架起理论与实践的桥梁

MIT课程：深度学习背后的科学—架起理论与实践的桥梁

专知

10+阅读 · 2019年3月12日

从动力学角度看优化算法：自适应学习率算法

从动力学角度看优化算法：自适应学习率算法

PaperWeekly

8+阅读 · 2018年12月27日

2017年深度学习优化算法最新综述

2017年深度学习优化算法最新综述

计算机视觉战队

7+阅读 · 2017年12月18日

2017深度学习NLP进展与趋势

2017深度学习NLP进展与趋势

云栖社区

7+阅读 · 2017年12月17日

深度 | 思考VC维与PAC：如何理解深度神经网络中的泛化理论？

深度 | 思考VC维与PAC：如何理解深度神经网络中的泛化理论？

机器之心

5+阅读 · 2017年12月17日

Structure-Exploiting Newton-Type Method for Optimal Control of Switched Systems

Arxiv

0+阅读 · 2021年12月20日

Evaluating Explanations: How much do explanations from the teacher aid students?

Arxiv

0+阅读 · 2021年12月17日

Two-view Graph Neural Networks for Knowledge Graph Completion

Arxiv

0+阅读 · 2021年12月16日

GFlowNet Foundations

GFlowNet Foundations

Arxiv

9+阅读 · 2021年11月17日

The Causal Learning of Retail Delinquency

Arxiv

15+阅读 · 2020年12月17日

Contrastive Transformation for Self-supervised Correspondence Learning

Contrastive Transformation for Self-supervised Correspondence Learning

Arxiv

13+阅读 · 2020年12月9日

Self-supervised Learning: Generative or Contrastive

Arxiv

19+阅读 · 2020年7月21日

Towards Backward-Compatible Representation Learning

Arxiv

5+阅读 · 2020年3月26日

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

Demystifying MMD GANs

Arxiv

12+阅读 · 2018年1月12日

VIP会员

相关主题

深度学习理论

深度学习泛化性

相关VIP内容

【NeurIPS 2021 】学习理论(有时)可以解释图神经网络中的泛化

【NeurIPS 2021 】学习理论(有时)可以解释图神经网络中的泛化

专知会员服务

30+阅读 · 2021年12月13日

【哈佛大学】深度学习理论实证探究

【哈佛大学】深度学习理论实证探究

专知会员服务

43+阅读 · 2021年11月1日

【哥本哈根博士论文】因果性与泛化:可识别性与学习方法

专知会员服务

65+阅读 · 2021年10月18日

【NeurIPS2021】黑箱学习算法的信息理论泛化界

专知会员服务

23+阅读 · 2021年10月6日

【CMU博士论文】面向分布偏移的自然语言处理学习神经模型，148页pdf

专知会员服务

37+阅读 · 2021年9月7日

【斯坦福博士论文】深度学习医学图像解译，207页pdf

专知会员服务

107+阅读 · 2021年7月17日

「深度学习:一种统计视角」，伯克利&斯坦福89页pdf综述论文

专知会员服务

73+阅读 · 2021年3月20日

【新书册】贝叶斯神经网络，41页pdf

【新书册】贝叶斯神经网络，41页pdf

专知会员服务

180+阅读 · 2020年6月3日

【NeurlPS2019论文总结】一致收敛可能无法解释深度学习中的泛化现象，Uniform convergence may be unable to explain generalization in deep learning

【NeurlPS2019论文总结】一致收敛可能无法解释深度学习中的泛化现象，Uniform convergence may be unable to explain generalization in deep learning

专知会员服务

15+阅读 · 2019年12月17日

【NeurIPS2019 论文】一致收敛可能无法解释深度学习中的泛化现象（Uniform convergence may be unable to explain generalization in deep learning）

【NeurIPS2019 论文】一致收敛可能无法解释深度学习中的泛化现象（Uniform convergence may be unable to explain generalization in deep learning）

专知会员服务

4+阅读 · 2019年12月10日

热门VIP内容

开通专知VIP会员享更多权益服务

【NeurIPS2025】VideoLucy：用于长视频理解的深度记忆回溯机制

不确定环境下无人机与无人地面车辆编队的地下勘探规划算法 | 122页

【NTU博士论文】端到端鲁棒自动语音识别的最新进展

用于强化学习的扩散模型：基础、分类与发展

相关资讯

2020->2021必看的十篇「深度学习领域综述」论文

2020->2021必看的十篇「深度学习领域综述」论文

专知

6+阅读 · 2021年1月1日

贝叶斯与深度学习如何结合？看这份256页《贝叶斯深度学习原理》SPCOM2020硬核教程

贝叶斯与深度学习如何结合？看这份256页《贝叶斯深度学习原理》SPCOM2020硬核教程

专知

20+阅读 · 2020年7月22日

【新书册】贝叶斯神经网络，41页pdf

【新书册】贝叶斯神经网络，41页pdf

专知

29+阅读 · 2020年6月3日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

77+阅读 · 2019年10月20日

田渊栋博士:求道之人，不问寒暑—理解ReLU深度网络训练动态

田渊栋博士:求道之人，不问寒暑—理解ReLU深度网络训练动态

极市平台

7+阅读 · 2019年6月5日

MIT课程：深度学习背后的科学—架起理论与实践的桥梁

MIT课程：深度学习背后的科学—架起理论与实践的桥梁

专知

10+阅读 · 2019年3月12日

从动力学角度看优化算法：自适应学习率算法

从动力学角度看优化算法：自适应学习率算法

PaperWeekly

8+阅读 · 2018年12月27日

2017年深度学习优化算法最新综述

2017年深度学习优化算法最新综述

计算机视觉战队

7+阅读 · 2017年12月18日

2017深度学习NLP进展与趋势

2017深度学习NLP进展与趋势

云栖社区

7+阅读 · 2017年12月17日

深度 | 思考VC维与PAC：如何理解深度神经网络中的泛化理论？

深度 | 思考VC维与PAC：如何理解深度神经网络中的泛化理论？

机器之心

5+阅读 · 2017年12月17日

相关论文

Structure-Exploiting Newton-Type Method for Optimal Control of Switched Systems

Arxiv

0+阅读 · 2021年12月20日

Evaluating Explanations: How much do explanations from the teacher aid students?

Arxiv

0+阅读 · 2021年12月17日

Two-view Graph Neural Networks for Knowledge Graph Completion

Arxiv

0+阅读 · 2021年12月16日

GFlowNet Foundations

GFlowNet Foundations

Arxiv

9+阅读 · 2021年11月17日

The Causal Learning of Retail Delinquency

Arxiv

15+阅读 · 2020年12月17日

Contrastive Transformation for Self-supervised Correspondence Learning

Contrastive Transformation for Self-supervised Correspondence Learning

Arxiv

13+阅读 · 2020年12月9日

Self-supervised Learning: Generative or Contrastive

Arxiv

19+阅读 · 2020年7月21日

Towards Backward-Compatible Representation Learning

Arxiv

5+阅读 · 2020年3月26日

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

Demystifying MMD GANs

Arxiv

12+阅读 · 2018年1月12日

微信扫码咨询专知VIP会员