【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解 - 专知

会员服务 ·

0

【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解

2022 年 7 月 9 日 专知

深度学习在经验上非常有影响力，但在理论理解上滞后。神经网络在结构和训练算法上都比传统的机器学习模型复杂得多，所以传统的理论直觉可能不适用。本文旨在从理论上更好地理解深度学习中的泛化问题。在论文的第一部分，我们研究了所有数据都有标签的监督设置下的泛化。我们的主要工具是泛化界:通过推导和研究泛化界，我们可以深入了解深度学习中影响泛化的各种因素。

首先，我们比较了正则化神经网络和神经正切核(NTK)的统计特性。通过建立神经网络常见的正则化训练损失与基于输出边际的泛化界之间的联系，我们证明了正则化神经网络比NTK解具有更好的泛化效果。其次，我们基于边缘的新概念——全层边缘，推导出神经网络的新泛化边界。与传统的基于规范的泛化测度相比，这些边界更依赖于数据，更具有深度，并突出了数据依赖的Lipschitzness在泛化中的重要作用。我们以经验证明，这些边界对于激励新的训练目标和理解和解密现有的正则化策略是有用的。

在论文的第二部分，我们把我们的焦点转向涉及未标记数据的设置。在这些情况下，很难证明为什么许多算法可以工作，尽管它们有广泛的经验成功。

首先，我们研究了视觉设置，并提出了一个理论框架来理解最近的半监督学习和领域适应的自训练算法。通过利用自然图像的现实结构属性，我们表明，在未标记数据上的自训练导致可证明的准确性增益。此外，我们的理论框架和相关假设可以用来表明，自监督对比学习在线性探针评价下获得了可证明的良好特征。最后，我们研究了为什么预训练语言模型可以帮助处理NLP设置中的下游任务。我们通过潜在的潜在变量生成模型来考虑预训练和下游任务相关的设置。我们表明，当这个生成模型是HMM或记忆增强HMM时，预训练允许解决下游任务的可证明保证。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“0987” 就可以获取《【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取100000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取100000+AI主题知识资料

登录查看更多

3

相关内容

【斯坦福博士论文】具有学习约束的深度表示，239页pdf

【斯坦福博士论文】具有学习约束的深度表示，239页pdf

专知会员服务

62+阅读 · 2022年9月13日

【经典书】《无记忆多智能体系统中的博弈论学习和分布式优化》176页pdf

【经典书】《无记忆多智能体系统中的博弈论学习和分布式优化》176页pdf

专知会员服务

53+阅读 · 2022年6月14日

【ETH博士论文】贝叶斯深度学习，241页pdf

【ETH博士论文】贝叶斯深度学习，241页pdf

专知会员服务

130+阅读 · 2022年1月16日

【CMU博士论文】面向分布偏移的自然语言处理学习神经模型，148页pdf

专知会员服务

37+阅读 · 2021年9月7日

SiT: 自监督视觉Transformer

专知会员服务

65+阅读 · 2021年4月11日

【伯克利博士论文】通过对齐表示和图像来跨域自适应，95页pdf

【伯克利博士论文】通过对齐表示和图像来跨域自适应，95页pdf

专知会员服务

44+阅读 · 2020年12月27日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知会员服务

59+阅读 · 2020年12月9日

【牛津大学BoYang博士论文】学习重建和分割三维物体，143页pdf

【牛津大学BoYang博士论文】学习重建和分割三维物体，143页pdf

专知会员服务

68+阅读 · 2020年11月9日

【NeurIPS 2020】学习神经网络中的不变性

专知会员服务

29+阅读 · 2020年10月24日

【斯坦福大学博士论文】自监督场景表示学习， 97页pdf

【斯坦福大学博士论文】自监督场景表示学习， 97页pdf

专知会员服务

95+阅读 · 2020年6月19日

【多伦多大学博士论文】整合语言学理论与神经语言模型，104页pdf

【多伦多大学博士论文】整合语言学理论与神经语言模型，104页pdf

专知

6+阅读 · 2022年8月4日

【ICML2022】时序自监督视频transformer

【ICML2022】时序自监督视频transformer

专知

1+阅读 · 2022年7月28日

【MIT博士论文】鲁棒高效的深度学习在虚假信息预防中的应用

【MIT博士论文】鲁棒高效的深度学习在虚假信息预防中的应用

专知

2+阅读 · 2022年7月13日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

18+阅读 · 2022年7月11日

【MIT博士论文】优化理论与机器学习实践

【MIT博士论文】优化理论与机器学习实践

专知

2+阅读 · 2022年6月30日

【KDD2022】GraphMAE:自监督掩码图自编码器

【KDD2022】GraphMAE:自监督掩码图自编码器

专知

7+阅读 · 2022年6月12日

【港科大Yunfei Yang博士论文】生成式对抗网络的分布学习:近似与泛化

【港科大Yunfei Yang博士论文】生成式对抗网络的分布学习:近似与泛化

专知

1+阅读 · 2022年5月29日

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

专知

3+阅读 · 2022年4月19日

【ETH博士论文】贝叶斯深度学习，241页pdf

【ETH博士论文】贝叶斯深度学习，241页pdf

专知

9+阅读 · 2022年1月16日

【新书册】贝叶斯神经网络，41页pdf

【新书册】贝叶斯神经网络，41页pdf

专知

29+阅读 · 2020年6月3日

前馈神经网络容错学习算法的设计与确定型收敛性研究

国家自然科学基金

0+阅读 · 2013年12月31日

学习理论中相似度量学习及相关课题的研究

国家自然科学基金

2+阅读 · 2013年12月31日

面向数据表示的深度稀疏保持学习

国家自然科学基金

7+阅读 · 2013年12月31日

神经网络随机学习算法的泛化性研究

国家自然科学基金

2+阅读 · 2013年12月31日

高维数据的图模型学习与统计推断

国家自然科学基金

8+阅读 · 2012年12月31日

虚拟社区成员持续参与动机演变与激励机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

半监督半配对高维多表示数据的降维及拓展研究

国家自然科学基金

0+阅读 · 2011年12月31日

完善我国食品安全监管体系的政策研究

国家自然科学基金

7+阅读 · 2011年9月30日

基于"非监督-监督-激励"集成学习模式的机器人行为自主学习系统研究

国家自然科学基金

1+阅读 · 2010年12月31日

半监督回归学习理论和方法及其在工业过程软测量建模中的应用研究

国家自然科学基金

1+阅读 · 2009年12月31日

OmniVL:One Foundation Model for Image-Language and Video-Language Tasks

OmniVL:One Foundation Model for Image-Language and Video-Language Tasks

Arxiv

0+阅读 · 2022年9月15日

Tangent Space and Dimension Estimation with the Wasserstein Distance

Arxiv

0+阅读 · 2022年9月15日

Multidimensional Projection Filters via Automatic Differentiation and Sparse-Grid Integration

Arxiv

0+阅读 · 2022年9月14日

DASH: Visual Analytics for Debiasing Image Classification via User-Driven Synthetic Data Augmentation

Arxiv

0+阅读 · 2022年9月14日

Transformers Meet Visual Learning Understanding: A Comprehensive Review

Arxiv

28+阅读 · 2022年3月24日

A Survey of Visual Transformers

Arxiv

39+阅读 · 2021年11月11日

A Battle of Network Structures: An Empirical Study of CNN, Transformer, and MLP

Arxiv

12+阅读 · 2021年8月30日

A Survey on Bayesian Deep Learning

A Survey on Bayesian Deep Learning

Arxiv

64+阅读 · 2020年7月2日

Image Segmentation Using Deep Learning: A Survey

Image Segmentation Using Deep Learning: A Survey

Arxiv

47+阅读 · 2020年1月15日

Bayesian Convolutional Neural Networks

Arxiv

19+阅读 · 2018年6月27日

VIP会员

相关主题

斯坦福大学 (Stanford University)

相关VIP内容

【斯坦福博士论文】具有学习约束的深度表示，239页pdf

【斯坦福博士论文】具有学习约束的深度表示，239页pdf

专知会员服务

62+阅读 · 2022年9月13日

【经典书】《无记忆多智能体系统中的博弈论学习和分布式优化》176页pdf

【经典书】《无记忆多智能体系统中的博弈论学习和分布式优化》176页pdf

专知会员服务

53+阅读 · 2022年6月14日

【ETH博士论文】贝叶斯深度学习，241页pdf

【ETH博士论文】贝叶斯深度学习，241页pdf

专知会员服务

130+阅读 · 2022年1月16日

【CMU博士论文】面向分布偏移的自然语言处理学习神经模型，148页pdf

专知会员服务

37+阅读 · 2021年9月7日

SiT: 自监督视觉Transformer

专知会员服务

65+阅读 · 2021年4月11日

【伯克利博士论文】通过对齐表示和图像来跨域自适应，95页pdf

【伯克利博士论文】通过对齐表示和图像来跨域自适应，95页pdf

专知会员服务

44+阅读 · 2020年12月27日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知会员服务

59+阅读 · 2020年12月9日

【牛津大学BoYang博士论文】学习重建和分割三维物体，143页pdf

【牛津大学BoYang博士论文】学习重建和分割三维物体，143页pdf

专知会员服务

68+阅读 · 2020年11月9日

【NeurIPS 2020】学习神经网络中的不变性

专知会员服务

29+阅读 · 2020年10月24日

【斯坦福大学博士论文】自监督场景表示学习， 97页pdf

【斯坦福大学博士论文】自监督场景表示学习， 97页pdf

专知会员服务

95+阅读 · 2020年6月19日

热门VIP内容

开通专知VIP会员享更多权益服务

《以任务为中心的建模未来：将集成数字成熟度路径与用户故事框架融入任务工程》最新文献

《人机协作集成模型中的不确定性捕获》博士论文

运用不可解释人工智能进行军事决策

《以军铁剑战争中的战场决策》最新报告

相关资讯

【多伦多大学博士论文】整合语言学理论与神经语言模型，104页pdf

【多伦多大学博士论文】整合语言学理论与神经语言模型，104页pdf

专知

6+阅读 · 2022年8月4日

【ICML2022】时序自监督视频transformer

【ICML2022】时序自监督视频transformer

专知

1+阅读 · 2022年7月28日

【MIT博士论文】鲁棒高效的深度学习在虚假信息预防中的应用

【MIT博士论文】鲁棒高效的深度学习在虚假信息预防中的应用

专知

2+阅读 · 2022年7月13日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

18+阅读 · 2022年7月11日

【MIT博士论文】优化理论与机器学习实践

【MIT博士论文】优化理论与机器学习实践

专知

2+阅读 · 2022年6月30日

【KDD2022】GraphMAE:自监督掩码图自编码器

【KDD2022】GraphMAE:自监督掩码图自编码器

专知

7+阅读 · 2022年6月12日

【港科大Yunfei Yang博士论文】生成式对抗网络的分布学习:近似与泛化

【港科大Yunfei Yang博士论文】生成式对抗网络的分布学习:近似与泛化

专知

1+阅读 · 2022年5月29日

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

专知

3+阅读 · 2022年4月19日

【ETH博士论文】贝叶斯深度学习，241页pdf

【ETH博士论文】贝叶斯深度学习，241页pdf

专知

9+阅读 · 2022年1月16日

【新书册】贝叶斯神经网络，41页pdf

【新书册】贝叶斯神经网络，41页pdf

专知

29+阅读 · 2020年6月3日

相关基金

前馈神经网络容错学习算法的设计与确定型收敛性研究

国家自然科学基金

0+阅读 · 2013年12月31日

学习理论中相似度量学习及相关课题的研究

国家自然科学基金

2+阅读 · 2013年12月31日

面向数据表示的深度稀疏保持学习

国家自然科学基金

7+阅读 · 2013年12月31日

神经网络随机学习算法的泛化性研究

国家自然科学基金

2+阅读 · 2013年12月31日

高维数据的图模型学习与统计推断

国家自然科学基金

8+阅读 · 2012年12月31日

虚拟社区成员持续参与动机演变与激励机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

半监督半配对高维多表示数据的降维及拓展研究

国家自然科学基金

0+阅读 · 2011年12月31日

完善我国食品安全监管体系的政策研究

国家自然科学基金

7+阅读 · 2011年9月30日

基于"非监督-监督-激励"集成学习模式的机器人行为自主学习系统研究

国家自然科学基金

1+阅读 · 2010年12月31日

半监督回归学习理论和方法及其在工业过程软测量建模中的应用研究

国家自然科学基金

1+阅读 · 2009年12月31日

相关论文

OmniVL:One Foundation Model for Image-Language and Video-Language Tasks

OmniVL:One Foundation Model for Image-Language and Video-Language Tasks

Arxiv

0+阅读 · 2022年9月15日

Tangent Space and Dimension Estimation with the Wasserstein Distance

Arxiv

0+阅读 · 2022年9月15日

Multidimensional Projection Filters via Automatic Differentiation and Sparse-Grid Integration

Arxiv

0+阅读 · 2022年9月14日

DASH: Visual Analytics for Debiasing Image Classification via User-Driven Synthetic Data Augmentation

Arxiv

0+阅读 · 2022年9月14日

Transformers Meet Visual Learning Understanding: A Comprehensive Review

Arxiv

28+阅读 · 2022年3月24日

A Survey of Visual Transformers

Arxiv

39+阅读 · 2021年11月11日

A Battle of Network Structures: An Empirical Study of CNN, Transformer, and MLP

Arxiv

12+阅读 · 2021年8月30日

A Survey on Bayesian Deep Learning

A Survey on Bayesian Deep Learning

Arxiv

64+阅读 · 2020年7月2日

Image Segmentation Using Deep Learning: A Survey

Image Segmentation Using Deep Learning: A Survey

Arxiv

47+阅读 · 2020年1月15日

Bayesian Convolutional Neural Networks

Arxiv

19+阅读 · 2018年6月27日

大家都在搜

无人机系统

国防科技创新

久别重逢话双塔

无人机测控通信自组网技术综述

微信扫码咨询专知VIP会员