【哈佛大学博士论文】构建深度学习的理论基础:一种实证方法，164页pdf - 专知

会员服务 ·

0

【哈佛大学博士论文】构建深度学习的理论基础:一种实证方法，164页pdf

2022 年 11 月 28 日 专知

尽管在深度学习方面已经取得了巨大的实践进展，但我们对是什么使深度学习工作得很好以及为什么这样做缺乏清晰的理论理解。在本文中，我们采用“自然科学”的方法来构建深度学习的理论。我们首先确定在跨越各种不同背景的实际深度网络中出现的各种经验属性。然后，我们讨论了这些实证发现可以如何用来通知理论。具体而言，我们证明: (1)与监督学习相比，经过自监督学习训练的先进深度网络尽管过度参数化，但在特定条件下仍能实现有限的泛化差距。(2)具有相似性能和架构的模型通常会收敛到相似的内部表示，即使它们的训练方法有很大的不同(例如:监督学习和自监督学习)(3)插值分类器服从一种分布泛化形式——它们从训练分布中收敛到一种条件采样器类型。(4)深度网络的数据扩展特性对训练数据集的结构和噪声水平的变化具有鲁棒性。

我们的发现强调，尽管缺乏最坏情况的保证，深度网络隐含地以可预测的、结构化的方式运行，从而为未来的理论分析奠定了基础。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“T164” 就可以获取《【哈佛大学博士论文】构建深度学习的理论基础:一种实证方法，164页pdf》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取100000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取100000+AI主题知识资料

登录查看更多

9

相关内容

【剑桥大学博士论文】贝叶斯机器学习进展:从不确定性到决策，272页pdf

【剑桥大学博士论文】贝叶斯机器学习进展:从不确定性到决策，272页pdf

专知会员服务

82+阅读 · 2023年2月5日

【哈佛大学博士论文】构建深度学习的理论基础:一种实证方法

【哈佛大学博士论文】构建深度学习的理论基础:一种实证方法

专知会员服务

49+阅读 · 2022年11月28日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知会员服务

78+阅读 · 2022年11月9日

【牛津大学博士论文】多模态自监督学习，172页pdf

【牛津大学博士论文】多模态自监督学习，172页pdf

专知会员服务

136+阅读 · 2022年10月4日

最新《因果机器学习:构建可泛化模型》教程，89页ppt，Amit Sharma

最新《因果机器学习:构建可泛化模型》教程，89页ppt，Amit Sharma

专知会员服务

84+阅读 · 2022年9月25日

【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解

【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解

专知会员服务

89+阅读 · 2022年7月9日

【MIT-Kenji博士论文】深度学习中的优化与可扩展性，260页pdf

【MIT-Kenji博士论文】深度学习中的优化与可扩展性，260页pdf

专知会员服务

61+阅读 · 2022年4月3日

【ETH博士论文】贝叶斯深度学习，241页pdf

【ETH博士论文】贝叶斯深度学习，241页pdf

专知会员服务

130+阅读 · 2022年1月16日

【哈佛大学】深度学习理论实证探究

【哈佛大学】深度学习理论实证探究

专知会员服务

43+阅读 · 2021年11月1日

【MIT经典书】统计学习与序列预测，261页pdf

【MIT经典书】统计学习与序列预测，261页pdf

专知会员服务

78+阅读 · 2020年11月17日

【哈佛大学博士论文】小数据医学成像中的可泛化和可解释深度学习，199页pdf

【哈佛大学博士论文】小数据医学成像中的可泛化和可解释深度学习，199页pdf

专知

8+阅读 · 2022年11月15日

【UFPE大学博士论文】基于熵损失的鲁棒深度学习，179页pdf

【UFPE大学博士论文】基于熵损失的鲁棒深度学习，179页pdf

专知

6+阅读 · 2022年11月11日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知

9+阅读 · 2022年11月9日

271页ppt！可解释机器学习预测的最新技术、挑战和机遇，哈佛大学𝙷𝚒𝚖𝚊 𝙻𝚊𝚔𝚔𝚊𝚛𝚊𝚓𝚞讲授

271页ppt！可解释机器学习预测的最新技术、挑战和机遇，哈佛大学𝙷𝚒𝚖𝚊 𝙻𝚊𝚔𝚔𝚊𝚛𝚊𝚓𝚞讲授

专知

5+阅读 · 2022年11月5日

【加州理工学院博士论文】神经元网络的优化与泛化，98页pdf

【加州理工学院博士论文】神经元网络的优化与泛化，98页pdf

专知

4+阅读 · 2022年10月24日

最新《因果机器学习:构建可泛化模型》教程，89页ppt，Amit Sharma

最新《因果机器学习:构建可泛化模型》教程，89页ppt，Amit Sharma

专知

1+阅读 · 2022年9月25日

【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解

【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解

专知

3+阅读 · 2022年7月9日

【MIT-Kenji博士论文】深度学习中的优化与可扩展性，260页pdf

【MIT-Kenji博士论文】深度学习中的优化与可扩展性，260页pdf

专知

6+阅读 · 2022年4月3日

弗里堡大学教授Martin新书《因果分析》，365页pdf

弗里堡大学教授Martin新书《因果分析》，365页pdf

专知

2+阅读 · 2022年2月12日

【ETH博士论文】贝叶斯深度学习，241页pdf

【ETH博士论文】贝叶斯深度学习，241页pdf

专知

9+阅读 · 2022年1月16日

基于深度学习技术的视神经系统研究

国家自然科学基金

7+阅读 · 2017年12月31日

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

基于相似性的图像特征逆向学习算法与应用

国家自然科学基金

0+阅读 · 2013年12月31日

六方BN薄膜生长机理的理论研究

国家自然科学基金

0+阅读 · 2013年12月31日

自相互作用蛋白质的系统研究和预测

国家自然科学基金

2+阅读 · 2012年12月31日

基于数据学习的高斯过程混合体的模型选择及其应用研究

国家自然科学基金

1+阅读 · 2011年12月31日

跨姿态人脸识别研究

国家自然科学基金

1+阅读 · 2011年12月31日

数据驱动的逼近方法、理论与应用研究

国家自然科学基金

0+阅读 · 2011年12月31日

超洛伦兹-高斯光束的构建及其用于表征大角度激光束的研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于概念格的数字图书馆知识构建研究

国家自然科学基金

1+阅读 · 2009年12月31日

Large-scale Stochastic Optimization of NDCG Surrogates for Deep Learning with Provable Convergence

Arxiv

0+阅读 · 2023年2月2日

Automatically Marginalized MCMC in Probabilistic Programming

Arxiv

0+阅读 · 2023年2月1日

Learning from Stochastic Labels

Arxiv

1+阅读 · 2023年2月1日

Dictionary-based Manifold Learning

Arxiv

0+阅读 · 2023年2月1日

Identifiability and inference for copula-based semiparametric models for random vectors with arbitrary marginal distributions

Identifiability and inference for copula-based semiparametric models for random vectors with arbitrary marginal distributions

Arxiv

0+阅读 · 2023年2月1日

Active Learning-based Domain Adaptive Localized Polynomial Chaos Expansion

Arxiv

0+阅读 · 2023年1月31日

Stabilize Deep ResNet with A Sharp Scaling Factor $τ$

Arxiv

0+阅读 · 2023年1月31日

Fairness and Accuracy under Domain Generalization

Arxiv

0+阅读 · 2023年1月30日

Active Learning for Domain Adaptation: An Energy-based Approach

Arxiv

13+阅读 · 2021年12月2日

VideoDG: Generalizing Temporal Relations in Videos to Novel Domains

Arxiv

14+阅读 · 2021年9月17日

VIP会员

相关主题

相关VIP内容

【剑桥大学博士论文】贝叶斯机器学习进展:从不确定性到决策，272页pdf

【剑桥大学博士论文】贝叶斯机器学习进展:从不确定性到决策，272页pdf

专知会员服务

82+阅读 · 2023年2月5日

【哈佛大学博士论文】构建深度学习的理论基础:一种实证方法

【哈佛大学博士论文】构建深度学习的理论基础:一种实证方法

专知会员服务

49+阅读 · 2022年11月28日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知会员服务

78+阅读 · 2022年11月9日

【牛津大学博士论文】多模态自监督学习，172页pdf

【牛津大学博士论文】多模态自监督学习，172页pdf

专知会员服务

136+阅读 · 2022年10月4日

最新《因果机器学习:构建可泛化模型》教程，89页ppt，Amit Sharma

最新《因果机器学习:构建可泛化模型》教程，89页ppt，Amit Sharma

专知会员服务

84+阅读 · 2022年9月25日

【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解

【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解

专知会员服务

89+阅读 · 2022年7月9日

【MIT-Kenji博士论文】深度学习中的优化与可扩展性，260页pdf

【MIT-Kenji博士论文】深度学习中的优化与可扩展性，260页pdf

专知会员服务

61+阅读 · 2022年4月3日

【ETH博士论文】贝叶斯深度学习，241页pdf

【ETH博士论文】贝叶斯深度学习，241页pdf

专知会员服务

130+阅读 · 2022年1月16日

【哈佛大学】深度学习理论实证探究

【哈佛大学】深度学习理论实证探究

专知会员服务

43+阅读 · 2021年11月1日

【MIT经典书】统计学习与序列预测，261页pdf

【MIT经典书】统计学习与序列预测，261页pdf

专知会员服务

78+阅读 · 2020年11月17日

热门VIP内容

开通专知VIP会员享更多权益服务

GPT-5如何对齐？从硬性拒绝到安全完成：走向以输出为中心的安全训练

【伯克利博士论文】超越人类监督的视觉智能

【ICCV2025】SO(3) 上连续非保守动力系统的预测

2025年中国数据要素行业发展研究报告

相关资讯

【哈佛大学博士论文】小数据医学成像中的可泛化和可解释深度学习，199页pdf

【哈佛大学博士论文】小数据医学成像中的可泛化和可解释深度学习，199页pdf

专知

8+阅读 · 2022年11月15日

【UFPE大学博士论文】基于熵损失的鲁棒深度学习，179页pdf

【UFPE大学博士论文】基于熵损失的鲁棒深度学习，179页pdf

专知

6+阅读 · 2022年11月11日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知

9+阅读 · 2022年11月9日

271页ppt！可解释机器学习预测的最新技术、挑战和机遇，哈佛大学𝙷𝚒𝚖𝚊 𝙻𝚊𝚔𝚔𝚊𝚛𝚊𝚓𝚞讲授

271页ppt！可解释机器学习预测的最新技术、挑战和机遇，哈佛大学𝙷𝚒𝚖𝚊 𝙻𝚊𝚔𝚔𝚊𝚛𝚊𝚓𝚞讲授

专知

5+阅读 · 2022年11月5日

【加州理工学院博士论文】神经元网络的优化与泛化，98页pdf

【加州理工学院博士论文】神经元网络的优化与泛化，98页pdf

专知

4+阅读 · 2022年10月24日

最新《因果机器学习:构建可泛化模型》教程，89页ppt，Amit Sharma

最新《因果机器学习:构建可泛化模型》教程，89页ppt，Amit Sharma

专知

1+阅读 · 2022年9月25日

【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解

【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解

专知

3+阅读 · 2022年7月9日

【MIT-Kenji博士论文】深度学习中的优化与可扩展性，260页pdf

【MIT-Kenji博士论文】深度学习中的优化与可扩展性，260页pdf

专知

6+阅读 · 2022年4月3日

弗里堡大学教授Martin新书《因果分析》，365页pdf

弗里堡大学教授Martin新书《因果分析》，365页pdf

专知

2+阅读 · 2022年2月12日

【ETH博士论文】贝叶斯深度学习，241页pdf

【ETH博士论文】贝叶斯深度学习，241页pdf

专知

9+阅读 · 2022年1月16日

相关基金

基于深度学习技术的视神经系统研究

国家自然科学基金

7+阅读 · 2017年12月31日

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

基于相似性的图像特征逆向学习算法与应用

国家自然科学基金

0+阅读 · 2013年12月31日

六方BN薄膜生长机理的理论研究

国家自然科学基金

0+阅读 · 2013年12月31日

自相互作用蛋白质的系统研究和预测

国家自然科学基金

2+阅读 · 2012年12月31日

基于数据学习的高斯过程混合体的模型选择及其应用研究

国家自然科学基金

1+阅读 · 2011年12月31日

跨姿态人脸识别研究

国家自然科学基金

1+阅读 · 2011年12月31日

数据驱动的逼近方法、理论与应用研究

国家自然科学基金

0+阅读 · 2011年12月31日

超洛伦兹-高斯光束的构建及其用于表征大角度激光束的研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于概念格的数字图书馆知识构建研究

国家自然科学基金

1+阅读 · 2009年12月31日

相关论文

Large-scale Stochastic Optimization of NDCG Surrogates for Deep Learning with Provable Convergence

Arxiv

0+阅读 · 2023年2月2日

Automatically Marginalized MCMC in Probabilistic Programming

Arxiv

0+阅读 · 2023年2月1日

Learning from Stochastic Labels

Arxiv

1+阅读 · 2023年2月1日

Dictionary-based Manifold Learning

Arxiv

0+阅读 · 2023年2月1日

Identifiability and inference for copula-based semiparametric models for random vectors with arbitrary marginal distributions

Identifiability and inference for copula-based semiparametric models for random vectors with arbitrary marginal distributions

Arxiv

0+阅读 · 2023年2月1日

Active Learning-based Domain Adaptive Localized Polynomial Chaos Expansion

Arxiv

0+阅读 · 2023年1月31日

Stabilize Deep ResNet with A Sharp Scaling Factor $τ$

Arxiv

0+阅读 · 2023年1月31日

Fairness and Accuracy under Domain Generalization

Arxiv

0+阅读 · 2023年1月30日

Active Learning for Domain Adaptation: An Energy-based Approach

Arxiv

13+阅读 · 2021年12月2日

VideoDG: Generalizing Temporal Relations in Videos to Novel Domains

Arxiv

14+阅读 · 2021年9月17日

大家都在搜

国防科技创新

久别重逢话双塔

软件无线电

再见，TD-SCDMA！

微信扫码咨询专知VIP会员