【哈佛大学】深度学习理论实证探究 - 专知VIP

会员服务 ·

8

深度学习理论 · 哈佛大学 (Harvard University) · 论文 ·

2021 年 11 月 1 日

【哈佛大学】深度学习理论实证探究

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

在这篇论文中，我们对深度学习理论进行了实证研究。我们将深度学习系统视为黑盒，有我们可以控制的输入(训练样本、架构、模型大小、优化器等)和我们可以观察的输出(神经网络函数、其测试误差、其参数等)。我们的目标是描述输入的选择如何影响输出。作为一个经验理论，我们的目标是定量地描述这种行为，如果不是严格地证明它。我们希望理论尽可能普适化，应用于广泛的深度学习设置，包括那些在实践中。

为此，我们提出了三个经验理论。(1) Deep Double Descent证明了深度学习的输入和输出之间的关系并不总是以自然的方式单调:存在一个可预测的“关键机制”，例如，对更多数据的训练实际上会损害性能，但模型在这个机制之外表现良好。(2) 深度Bootstrap框架表明，要理解输出网络的泛化，只要理解我们的输入选择的优化方面就足够了。（3) 分布泛化更深入地研究了输出网络，发现经过训练的模型实际上“泛化”的范围比我们通常预期的要广得多。我们引入了一种新的泛化捕捉这些行为。

我们的研究结果揭示了学习理论中已有的主题(特别是泛化、过度参数化、插值化)，也揭示了需要新的框架来捕捉的新现象。在某些情况下，我们对深度学习的研究揭示了一些现象，即使是非深度学习方法也适用。因此，我们希望这篇论文的结果将最终编织成一个一般性的深度学习理论。

Preetum Nakkiran 个人主页：https://preetum.nakkiran.org/

成为VIP会员查看完整内容

43

相关内容

深度学习理论

深度学习理论

深度学习理论，55页ppt，Preetum Nakkiran (UCSD)

深度学习理论，55页ppt，Preetum Nakkiran (UCSD)

专知会员服务

33+阅读 · 2021年10月27日

深度学习为何泛化好？CMU博士论文《解释深度学习中的泛化性》探究深度学习泛化性的理论基础进展

深度学习为何泛化好？CMU博士论文《解释深度学习中的泛化性》探究深度学习泛化性的理论基础进展

专知会员服务

84+阅读 · 2021年10月22日

《过参数化机器学习理论》综述论文

《过参数化机器学习理论》综述论文

专知会员服务

46+阅读 · 2021年9月19日

【CMU博士论文】面向分布偏移的自然语言处理学习神经模型，148页pdf

专知会员服务

37+阅读 · 2021年9月7日

深度学习理论基础

专知会员服务

45+阅读 · 2021年8月5日

【纽约大学Martin Arjovsky 博士论文】机器学习的分布外泛化,106页pdf

【纽约大学Martin Arjovsky 博士论文】机器学习的分布外泛化,106页pdf

专知会员服务

61+阅读 · 2021年3月28日

「深度学习:一种统计视角」，伯克利&斯坦福89页pdf综述论文

专知会员服务

73+阅读 · 2021年3月20日

多伦多大学2021《机器学习》课程，讲述深度学习理论中的神经网络训练动力学

多伦多大学2021《机器学习》课程，讲述深度学习理论中的神经网络训练动力学

专知会员服务

59+阅读 · 2021年1月29日

深度学习理论进展如何？看这6节上海交大暑期学校硬课: 均值场理论、神经切核、函数空间理论、隐式正则化、频率原理（附PPT下载）

深度学习理论进展如何？看这6节上海交大暑期学校硬课: 均值场理论、神经切核、函数空间理论、隐式正则化、频率原理（附PPT下载）

专知会员服务

53+阅读 · 2020年8月2日

论深度学习的信息瓶颈理论（On the information bottleneck theory of deep learning）

论深度学习的信息瓶颈理论（On the information bottleneck theory of deep learning）

专知会员服务

66+阅读 · 2019年12月20日

TPAMI 2020 | 无监督多类域适应：理论，算法与实践

TPAMI 2020 | 无监督多类域适应：理论，算法与实践

PaperWeekly

5+阅读 · 2021年1月21日

详解深度学习中的双下降现象

详解深度学习中的双下降现象

计算机视觉life

5+阅读 · 2019年12月19日

MIT课程：深度学习背后的科学—架起理论与实践的桥梁

MIT课程：深度学习背后的科学—架起理论与实践的桥梁

专知

10+阅读 · 2019年3月12日

【优博微展2018】王宇琦：科学风险议题的媒介话语与政府回应

【优博微展2018】王宇琦：科学风险议题的媒介话语与政府回应

清华大学研究生教育

3+阅读 · 2019年2月26日

从动力学角度看优化算法：一个更整体的视角

从动力学角度看优化算法：一个更整体的视角

黑龙江大学自然语言处理实验室

8+阅读 · 2019年1月28日

MIT&哈佛大学最新综述文章：NLP模型的分析方法

MIT&哈佛大学最新综述文章：NLP模型的分析方法

专知

24+阅读 · 2018年12月26日

2018年深度学习优化算法最新综述

2018年深度学习优化算法最新综述

计算机视觉战队

10+阅读 · 2018年12月11日

从傅里叶分析角度解读深度学习的泛化能力

从傅里叶分析角度解读深度学习的泛化能力

PaperWeekly

8+阅读 · 2018年8月24日

NLP选题：6大研究方向助你开启科研之路

NLP选题：6大研究方向助你开启科研之路

论智

4+阅读 · 2018年3月6日

2017年深度学习优化算法最新综述

2017年深度学习优化算法最新综述

计算机视觉战队

7+阅读 · 2017年12月18日

Settling the Bias and Variance of Meta-Gradient Estimation for Meta-Reinforcement Learning

Arxiv

1+阅读 · 2021年12月31日

Advances in Multi-turn Dialogue Comprehension: A Survey

Arxiv

23+阅读 · 2021年10月11日

Causal Understanding of Fake News Dissemination on Social Media

Arxiv

8+阅读 · 2021年7月14日

The Principles of Deep Learning Theory

Arxiv

65+阅读 · 2021年6月18日

Network Inference and Influence Maximization from Samples

Arxiv

7+阅读 · 2021年6月7日

Self-correcting Q-Learning

Arxiv

11+阅读 · 2020年12月2日

Early-Learning Regularization Prevents Memorization of Noisy Labels

Early-Learning Regularization Prevents Memorization of Noisy Labels

Arxiv

3+阅读 · 2020年6月30日

SelfVIO: Self-Supervised Deep Monocular Visual-Inertial Odometry and Depth Estimation

Arxiv

5+阅读 · 2019年11月22日

The Book of Why: Review

Arxiv

15+阅读 · 2019年9月30日

A BERT Baseline for the Natural Questions

Arxiv

8+阅读 · 2019年3月21日

VIP会员

相关主题

深度学习理论

哈佛大学 (Harvard University)

相关VIP内容

深度学习理论，55页ppt，Preetum Nakkiran (UCSD)

深度学习理论，55页ppt，Preetum Nakkiran (UCSD)

专知会员服务

33+阅读 · 2021年10月27日

深度学习为何泛化好？CMU博士论文《解释深度学习中的泛化性》探究深度学习泛化性的理论基础进展

深度学习为何泛化好？CMU博士论文《解释深度学习中的泛化性》探究深度学习泛化性的理论基础进展

专知会员服务

84+阅读 · 2021年10月22日

《过参数化机器学习理论》综述论文

《过参数化机器学习理论》综述论文

专知会员服务

46+阅读 · 2021年9月19日

【CMU博士论文】面向分布偏移的自然语言处理学习神经模型，148页pdf

专知会员服务

37+阅读 · 2021年9月7日

深度学习理论基础

专知会员服务

45+阅读 · 2021年8月5日

【纽约大学Martin Arjovsky 博士论文】机器学习的分布外泛化,106页pdf

【纽约大学Martin Arjovsky 博士论文】机器学习的分布外泛化,106页pdf

专知会员服务

61+阅读 · 2021年3月28日

「深度学习:一种统计视角」，伯克利&斯坦福89页pdf综述论文

专知会员服务

73+阅读 · 2021年3月20日

多伦多大学2021《机器学习》课程，讲述深度学习理论中的神经网络训练动力学

多伦多大学2021《机器学习》课程，讲述深度学习理论中的神经网络训练动力学

专知会员服务

59+阅读 · 2021年1月29日

深度学习理论进展如何？看这6节上海交大暑期学校硬课: 均值场理论、神经切核、函数空间理论、隐式正则化、频率原理（附PPT下载）

深度学习理论进展如何？看这6节上海交大暑期学校硬课: 均值场理论、神经切核、函数空间理论、隐式正则化、频率原理（附PPT下载）

专知会员服务

53+阅读 · 2020年8月2日

论深度学习的信息瓶颈理论（On the information bottleneck theory of deep learning）

论深度学习的信息瓶颈理论（On the information bottleneck theory of deep learning）

专知会员服务

66+阅读 · 2019年12月20日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

TPAMI 2020 | 无监督多类域适应：理论，算法与实践

TPAMI 2020 | 无监督多类域适应：理论，算法与实践

PaperWeekly

5+阅读 · 2021年1月21日

详解深度学习中的双下降现象

详解深度学习中的双下降现象

计算机视觉life

5+阅读 · 2019年12月19日

MIT课程：深度学习背后的科学—架起理论与实践的桥梁

MIT课程：深度学习背后的科学—架起理论与实践的桥梁

专知

10+阅读 · 2019年3月12日

【优博微展2018】王宇琦：科学风险议题的媒介话语与政府回应

【优博微展2018】王宇琦：科学风险议题的媒介话语与政府回应

清华大学研究生教育

3+阅读 · 2019年2月26日

从动力学角度看优化算法：一个更整体的视角

从动力学角度看优化算法：一个更整体的视角

黑龙江大学自然语言处理实验室

8+阅读 · 2019年1月28日

MIT&哈佛大学最新综述文章：NLP模型的分析方法

MIT&哈佛大学最新综述文章：NLP模型的分析方法

专知

24+阅读 · 2018年12月26日

2018年深度学习优化算法最新综述

2018年深度学习优化算法最新综述

计算机视觉战队

10+阅读 · 2018年12月11日

从傅里叶分析角度解读深度学习的泛化能力

从傅里叶分析角度解读深度学习的泛化能力

PaperWeekly

8+阅读 · 2018年8月24日

NLP选题：6大研究方向助你开启科研之路

NLP选题：6大研究方向助你开启科研之路

论智

4+阅读 · 2018年3月6日

2017年深度学习优化算法最新综述

2017年深度学习优化算法最新综述

计算机视觉战队

7+阅读 · 2017年12月18日

相关论文

Settling the Bias and Variance of Meta-Gradient Estimation for Meta-Reinforcement Learning

Arxiv

1+阅读 · 2021年12月31日

Advances in Multi-turn Dialogue Comprehension: A Survey

Arxiv

23+阅读 · 2021年10月11日

Causal Understanding of Fake News Dissemination on Social Media

Arxiv

8+阅读 · 2021年7月14日

The Principles of Deep Learning Theory

Arxiv

65+阅读 · 2021年6月18日

Network Inference and Influence Maximization from Samples

Arxiv

7+阅读 · 2021年6月7日

Self-correcting Q-Learning

Arxiv

11+阅读 · 2020年12月2日

Early-Learning Regularization Prevents Memorization of Noisy Labels

Early-Learning Regularization Prevents Memorization of Noisy Labels

Arxiv

3+阅读 · 2020年6月30日

SelfVIO: Self-Supervised Deep Monocular Visual-Inertial Odometry and Depth Estimation

Arxiv

5+阅读 · 2019年11月22日

The Book of Why: Review

Arxiv

15+阅读 · 2019年9月30日

A BERT Baseline for the Natural Questions

Arxiv

8+阅读 · 2019年3月21日

微信扫码咨询专知VIP会员