【哈佛大学博士论文】构建深度学习的理论基础:一种实证方法 - 专知VIP

会员服务 ·

25

哈佛大学 (Harvard University) · 博士论文 · 深度学习理论 ·

2022 年 11 月 28 日

【哈佛大学博士论文】构建深度学习的理论基础:一种实证方法

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

尽管在深度学习方面已经取得了巨大的实践进展，但我们对是什么使深度学习工作得很好以及为什么这样做缺乏清晰的理论理解。在本文中，我们采用“自然科学”的方法来构建深度学习的理论。我们首先确定在跨越各种不同背景的实际深度网络中出现的各种经验属性。然后，我们讨论了这些实证发现可以如何用来通知理论。具体而言，我们证明:(1)与监督学习相比，经过自监督学习训练的先进深度网络尽管过度参数化，但在特定条件下仍能实现有限的泛化差距。(2)具有相似性能和架构的模型通常会收敛到相似的内部表示，即使它们的训练方法有很大的不同(例如:监督学习和自监督学习)(3)插值分类器服从一种分布泛化形式——它们从训练分布中收敛到一种条件采样器类型。(4)深度网络的数据扩展特性对训练数据集的结构和噪声水平的变化具有鲁棒性。

https://dash.harvard.edu/handle/1/37372168

我们的发现强调，尽管缺乏最坏情况的保证，深度网络隐含地以可预测的、结构化的方式运行，从而为未来的理论分析奠定了基础。

成为VIP会员查看完整内容

49

相关内容

哈佛大学 (Harvard University)

哈佛大学 (Harvard University)

哈佛大学（Harvard University）是一所位于美国马萨诸塞州剑桥市（波士顿郊外）的私立大学，常春藤盟校成员之一。它的历史比美国悠久，是北美洲第一所大学，绰号为深红。哈佛与临近的麻省理工学院在世界上享有一流大学的声誉、财富和影响力，在英语系大学中的排名尤其突出。

【牛津大学博士论文】深度生成模型的鲁棒性、结构性和层次性，241页pdf

【牛津大学博士论文】深度生成模型的鲁棒性、结构性和层次性，241页pdf

专知会员服务

66+阅读 · 2023年1月17日

【悉尼大学博士论文】基于图神经网络的几何信号处理，187页pdf

【悉尼大学博士论文】基于图神经网络的几何信号处理，187页pdf

专知会员服务

34+阅读 · 2022年12月28日

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

专知会员服务

48+阅读 · 2022年11月4日

《现代深度学习的均衡方法》卡内基梅隆大学2022最新155页博士学位论文

《现代深度学习的均衡方法》卡内基梅隆大学2022最新155页博士学位论文

专知会员服务

23+阅读 · 2022年8月4日

【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解

【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解

专知会员服务

89+阅读 · 2022年7月9日

【多伦多大学博士论文】深度学习中的训练效率和鲁棒性

【多伦多大学博士论文】深度学习中的训练效率和鲁棒性

专知会员服务

59+阅读 · 2022年6月27日

信息论揭开深度学习黑匣子？纽约大学Ravid博士论文《深度神经网络信息流》139页pdf探究信息瓶颈来解释深度学习理论

信息论揭开深度学习黑匣子？纽约大学Ravid博士论文《深度神经网络信息流》139页pdf探究信息瓶颈来解释深度学习理论

专知会员服务

98+阅读 · 2022年2月21日

【哈佛大学】深度学习理论实证探究

【哈佛大学】深度学习理论实证探究

专知会员服务

43+阅读 · 2021年11月1日

深度学习为何泛化好？CMU博士论文《解释深度学习中的泛化性》探究深度学习泛化性的理论基础进展

深度学习为何泛化好？CMU博士论文《解释深度学习中的泛化性》探究深度学习泛化性的理论基础进展

专知会员服务

84+阅读 · 2021年10月22日

《过参数化机器学习理论》综述论文

《过参数化机器学习理论》综述论文

专知会员服务

46+阅读 · 2021年9月19日

【哈佛大学博士论文】构建深度学习的理论基础:一种实证方法，164页pdf

【哈佛大学博士论文】构建深度学习的理论基础:一种实证方法，164页pdf

专知

9+阅读 · 2022年11月28日

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

专知

2+阅读 · 2022年11月4日

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知

9+阅读 · 2022年10月29日

【伯克利博士论文】机器学习模型泛化性什么时候良好? 从信号处理视角分析，191页pdf

【伯克利博士论文】机器学习模型泛化性什么时候良好? 从信号处理视角分析，191页pdf

专知

2+阅读 · 2022年8月19日

哈佛医学院等最新《深度无监督领域适应UDA》综述，49页pdf阐述研究UDA进展与展望

哈佛医学院等最新《深度无监督领域适应UDA》综述，49页pdf阐述研究UDA进展与展望

专知

1+阅读 · 2022年8月17日

【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解

【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解

专知

3+阅读 · 2022年7月9日

图、深度学习与贝叶斯如何结合？Errica博士论文《图贝叶斯深度学习》阐述方法框架，附201页pdf与Slides

图、深度学习与贝叶斯如何结合？Errica博士论文《图贝叶斯深度学习》阐述方法框架，附201页pdf与Slides

专知

6+阅读 · 2022年3月2日

信息论揭开深度学习黑匣子？纽约大学研究员Ravid博士论文《深度神经网络信息流》139页pdf探究信息瓶颈来解释深度学习理论

信息论揭开深度学习黑匣子？纽约大学研究员Ravid博士论文《深度神经网络信息流》139页pdf探究信息瓶颈来解释深度学习理论

专知

7+阅读 · 2022年2月21日

大数据时代小样本如何学习？看这篇最新《小样本学习方法综述》论文

大数据时代小样本如何学习？看这篇最新《小样本学习方法综述》论文

专知

127+阅读 · 2019年3月31日

无监督深度学习——这《元监督视觉学习》132页伯克利博士论文带你回顾无监督视觉应用最新发展脉络

无监督深度学习——这《元监督视觉学习》132页伯克利博士论文带你回顾无监督视觉应用最新发展脉络

专知

26+阅读 · 2019年1月1日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

分类体系不确定的机器学习研究

国家自然科学基金

5+阅读 · 2014年12月31日

条件模型的计量经济学方法探讨及应用

国家自然科学基金

1+阅读 · 2013年12月31日

神经网络随机学习算法的泛化性研究

国家自然科学基金

2+阅读 · 2013年12月31日

基于后验预测分布的Bayes推断及相关问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

高阶多元Markov链及其非负张量模型的理论与数值分析

国家自然科学基金

1+阅读 · 2012年12月31日

非平稳时间序列的非参数预测回归

国家自然科学基金

7+阅读 · 2012年12月31日

主流形理论和算法研究

国家自然科学基金

0+阅读 · 2009年12月31日

Bayesian Self-Supervised Contrastive Learning

Arxiv

0+阅读 · 2023年1月27日

Achieving Risk Control in Online Learning Settings

Arxiv

0+阅读 · 2023年1月27日

Self-Supervised Hierarchical Metrical Structure Modeling

Arxiv

0+阅读 · 2023年1月25日

BayesSpeech: A Bayesian Transformer Network for Automatic Speech Recognition

Arxiv

0+阅读 · 2023年1月16日

ProtGNN: Towards Self-Explaining Graph Neural Networks

Arxiv

22+阅读 · 2021年12月2日

Graph Self-Supervised Learning: A Survey

Arxiv

15+阅读 · 2021年8月5日

Training Graph Neural Networks with 1000 Layers

Arxiv

13+阅读 · 2021年6月14日

Self-Supervised Learning of Graph Neural Networks: A Unified Review

Arxiv

38+阅读 · 2021年2月23日

Hierarchical Graph Pooling with Structure Learning

Arxiv

13+阅读 · 2019年11月14日

Attention-based Group Recommendation

Arxiv

14+阅读 · 2018年4月18日

VIP会员

相关主题

哈佛大学 (Harvard University)

深度学习理论

相关VIP内容

【牛津大学博士论文】深度生成模型的鲁棒性、结构性和层次性，241页pdf

【牛津大学博士论文】深度生成模型的鲁棒性、结构性和层次性，241页pdf

专知会员服务

66+阅读 · 2023年1月17日

【悉尼大学博士论文】基于图神经网络的几何信号处理，187页pdf

【悉尼大学博士论文】基于图神经网络的几何信号处理，187页pdf

专知会员服务

34+阅读 · 2022年12月28日

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

专知会员服务

48+阅读 · 2022年11月4日

《现代深度学习的均衡方法》卡内基梅隆大学2022最新155页博士学位论文

《现代深度学习的均衡方法》卡内基梅隆大学2022最新155页博士学位论文

专知会员服务

23+阅读 · 2022年8月4日

【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解

【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解

专知会员服务

89+阅读 · 2022年7月9日

【多伦多大学博士论文】深度学习中的训练效率和鲁棒性

【多伦多大学博士论文】深度学习中的训练效率和鲁棒性

专知会员服务

59+阅读 · 2022年6月27日

信息论揭开深度学习黑匣子？纽约大学Ravid博士论文《深度神经网络信息流》139页pdf探究信息瓶颈来解释深度学习理论

信息论揭开深度学习黑匣子？纽约大学Ravid博士论文《深度神经网络信息流》139页pdf探究信息瓶颈来解释深度学习理论

专知会员服务

98+阅读 · 2022年2月21日

【哈佛大学】深度学习理论实证探究

【哈佛大学】深度学习理论实证探究

专知会员服务

43+阅读 · 2021年11月1日

深度学习为何泛化好？CMU博士论文《解释深度学习中的泛化性》探究深度学习泛化性的理论基础进展

深度学习为何泛化好？CMU博士论文《解释深度学习中的泛化性》探究深度学习泛化性的理论基础进展

专知会员服务

84+阅读 · 2021年10月22日

《过参数化机器学习理论》综述论文

《过参数化机器学习理论》综述论文

专知会员服务

46+阅读 · 2021年9月19日

热门VIP内容

开通专知VIP会员享更多权益服务

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

《大型语言模型能否有效生成基于博弈论的网络安全场景？》

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

相关资讯

【哈佛大学博士论文】构建深度学习的理论基础:一种实证方法，164页pdf

【哈佛大学博士论文】构建深度学习的理论基础:一种实证方法，164页pdf

专知

9+阅读 · 2022年11月28日

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

专知

2+阅读 · 2022年11月4日

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知

9+阅读 · 2022年10月29日

【伯克利博士论文】机器学习模型泛化性什么时候良好? 从信号处理视角分析，191页pdf

【伯克利博士论文】机器学习模型泛化性什么时候良好? 从信号处理视角分析，191页pdf

专知

2+阅读 · 2022年8月19日

哈佛医学院等最新《深度无监督领域适应UDA》综述，49页pdf阐述研究UDA进展与展望

哈佛医学院等最新《深度无监督领域适应UDA》综述，49页pdf阐述研究UDA进展与展望

专知

1+阅读 · 2022年8月17日

【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解

【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解

专知

3+阅读 · 2022年7月9日

图、深度学习与贝叶斯如何结合？Errica博士论文《图贝叶斯深度学习》阐述方法框架，附201页pdf与Slides

图、深度学习与贝叶斯如何结合？Errica博士论文《图贝叶斯深度学习》阐述方法框架，附201页pdf与Slides

专知

6+阅读 · 2022年3月2日

信息论揭开深度学习黑匣子？纽约大学研究员Ravid博士论文《深度神经网络信息流》139页pdf探究信息瓶颈来解释深度学习理论

信息论揭开深度学习黑匣子？纽约大学研究员Ravid博士论文《深度神经网络信息流》139页pdf探究信息瓶颈来解释深度学习理论

专知

7+阅读 · 2022年2月21日

大数据时代小样本如何学习？看这篇最新《小样本学习方法综述》论文

大数据时代小样本如何学习？看这篇最新《小样本学习方法综述》论文

专知

127+阅读 · 2019年3月31日

无监督深度学习——这《元监督视觉学习》132页伯克利博士论文带你回顾无监督视觉应用最新发展脉络

无监督深度学习——这《元监督视觉学习》132页伯克利博士论文带你回顾无监督视觉应用最新发展脉络

专知

26+阅读 · 2019年1月1日

相关基金

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

分类体系不确定的机器学习研究

国家自然科学基金

5+阅读 · 2014年12月31日

条件模型的计量经济学方法探讨及应用

国家自然科学基金

1+阅读 · 2013年12月31日

神经网络随机学习算法的泛化性研究

国家自然科学基金

2+阅读 · 2013年12月31日

基于后验预测分布的Bayes推断及相关问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

高阶多元Markov链及其非负张量模型的理论与数值分析

国家自然科学基金

1+阅读 · 2012年12月31日

非平稳时间序列的非参数预测回归

国家自然科学基金

7+阅读 · 2012年12月31日

主流形理论和算法研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Bayesian Self-Supervised Contrastive Learning

Arxiv

0+阅读 · 2023年1月27日

Achieving Risk Control in Online Learning Settings

Arxiv

0+阅读 · 2023年1月27日

Self-Supervised Hierarchical Metrical Structure Modeling

Arxiv

0+阅读 · 2023年1月25日

BayesSpeech: A Bayesian Transformer Network for Automatic Speech Recognition

Arxiv

0+阅读 · 2023年1月16日

ProtGNN: Towards Self-Explaining Graph Neural Networks

Arxiv

22+阅读 · 2021年12月2日

Graph Self-Supervised Learning: A Survey

Arxiv

15+阅读 · 2021年8月5日

Training Graph Neural Networks with 1000 Layers

Arxiv

13+阅读 · 2021年6月14日

Self-Supervised Learning of Graph Neural Networks: A Unified Review

Arxiv

38+阅读 · 2021年2月23日

Hierarchical Graph Pooling with Structure Learning

Arxiv

13+阅读 · 2019年11月14日

Attention-based Group Recommendation

Arxiv

14+阅读 · 2018年4月18日

微信扫码咨询专知VIP会员