【加州理工学院博士论文】神经元网络的优化与泛化，98页pdf - 专知VIP

会员服务 ·

25

加州理工学院（California Institute of Technology） · 博士论文 · 神经网络 · 泛化 ·

2022 年 10 月 24 日

【加州理工学院博士论文】神经元网络的优化与泛化，98页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

本文的目标是发展人工神经网络学习的优化和泛化理论基础。这篇论文涉及两个核心问题。给定训练数据和网络架构:1)哪种权重设置对未见数据的泛化效果最好，为什么?2)应该使用什么优化器来恢复这个权重设置?

https://www.zhuanzhi.ai/paper/004b660b4e92a46e1ca507001a0d5d54

在优化方面，神经网络训练的一个基本特征是，网络权重仅通过其在网络架构中的出现间接影响损失函数。这篇论文提出了一个三步框架来派生新的“架构感知”优化算法。第一步称为函数优化，是根据函数扰动对损失函数的一系列展开进行优化。第二步是推导出体系结构摄动边界，将函数摄动的大小与权重摄动的大小联系起来。第三步是将这些体系结构扰动边界代入损耗的函数多数化，并通过最小化得到优化算法。这构成了主要最小化元算法在神经网络中的应用。在泛化方面，最近的一项有前途的工作是应用PAC-Bayes理论为神经网络推导非空泛化保证。由于这些保证控制了网络集合的平均风险，它们没有解决哪一个单独的网络应该是最好的泛化。为了弥补这一差距，本文重新点燃了核文献中的一个老思想:贝叶斯点机。贝叶斯点机是一个单一分类器，它近似于分类器集合的集合预测。由于聚合减少了集合预测的方差，贝叶斯点机往往比其他集合成员更好地进行泛化。本文证明，当网络宽度和归一化裕度都无穷大时，与训练集一致的神经网络空间集中在贝叶斯点机上。这激发了返回大标准化裕度的广泛网络的实践。这些想法的潜在应用包括不确定性量化的新方法，神经硬件更有效的数值表示，以及在学习问题中传递超参数的优化器。

成为VIP会员查看完整内容

48

相关内容

加州理工学院（California Institute of Technology）

加州理工学院（California Institute of Technology）

加州理工学院是一所位于美国加利福尼亚州帕萨迪纳的私立大学，创建于1891年。现有1204名研究生和977名本科生，约有300名教授以及超过600名研究学者。另外，美国国家航空航天局的喷射推进实验室也是由加州理工学院管理。虽然加州理工学院的规模不大，但是它却是全球最顶尖的大学之一。维基百科

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知会员服务

78+阅读 · 2022年11月9日

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

专知会员服务

48+阅读 · 2022年11月4日

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知会员服务

72+阅读 · 2022年10月29日

【伯克利博士论文】学习在动态环境中泛化，103页pdf

【伯克利博士论文】学习在动态环境中泛化，103页pdf

专知会员服务

72+阅读 · 2022年10月12日

【多伦多大学博士论文】深度学习中的训练效率和鲁棒性

【多伦多大学博士论文】深度学习中的训练效率和鲁棒性

专知会员服务

58+阅读 · 2022年6月27日

《通过最优传输失配措施进行鲁棒性贝叶斯推断：应用和算法》麻省理工学院2022最新博士论文

《通过最优传输失配措施进行鲁棒性贝叶斯推断：应用和算法》麻省理工学院2022最新博士论文

专知会员服务

15+阅读 · 2022年6月21日

【巴黎理工学院博士论文】持续学习：用重放过程解决深度神经网络中的灾难性遗忘

【巴黎理工学院博士论文】持续学习：用重放过程解决深度神经网络中的灾难性遗忘

专知会员服务

35+阅读 · 2022年5月8日

【新讲义】《非线性优化》洛桑联邦理工学院(EPFL），147页PDF

【新讲义】《非线性优化》洛桑联邦理工学院(EPFL），147页PDF

专知会员服务

31+阅读 · 2022年4月28日

【MIT-Kenji博士论文】深度学习中的优化与可扩展性，260页pdf

【MIT-Kenji博士论文】深度学习中的优化与可扩展性，260页pdf

专知会员服务

61+阅读 · 2022年4月3日

【NeurIPS 2020】学习神经网络中的不变性

专知会员服务

29+阅读 · 2020年10月24日

【苏黎世联邦理工博士论文】深度强化学习的体系结构，186页pdf

【苏黎世联邦理工博士论文】深度强化学习的体系结构，186页pdf

专知

6+阅读 · 2022年11月29日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知

9+阅读 · 2022年11月9日

【苏黎世联邦理工博士论文】因果推断的混杂调整

【苏黎世联邦理工博士论文】因果推断的混杂调整

专知

4+阅读 · 2022年11月7日

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

专知

2+阅读 · 2022年11月4日

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知

9+阅读 · 2022年10月29日

【伯克利博士论文】学习在动态环境中泛化，103页pdf

【伯克利博士论文】学习在动态环境中泛化，103页pdf

专知

6+阅读 · 2022年10月12日

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

专知

6+阅读 · 2022年10月5日

【MIT博士论文】通过最优传输不匹配措施的鲁棒贝叶斯推断:应用和算法

【MIT博士论文】通过最优传输不匹配措施的鲁棒贝叶斯推断:应用和算法

专知

3+阅读 · 2022年7月14日

为什么深度学习是非参数的？

为什么深度学习是非参数的？

THU数据派

1+阅读 · 2022年3月29日

一文读懂生成对抗网络GANs（附学习资源）

一文读懂生成对抗网络GANs（附学习资源）

数据派THU

10+阅读 · 2018年2月9日

双层网络下的振子集体行为研究：以生物钟神经元网络为例

国家自然科学基金

0+阅读 · 2015年12月31日

学习与记忆的神经动力学研究

国家自然科学基金

1+阅读 · 2014年12月31日

无线传感器网络中多路径路由及非干扰路由的研究

国家自然科学基金

0+阅读 · 2013年12月31日

应用于无线传感器网络的低时延分布式信源编码及延伸性研究

国家自然科学基金

0+阅读 · 2013年12月31日

反馈神经网络对非线性动力系统的本质逼近能力研究

国家自然科学基金

0+阅读 · 2012年12月31日

DBFC燃料电池Au基合金催化剂结构设计、性能表征及电催化特性研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于泛化神经网络和李亚普诺夫稳定性的超声波电机伺服控制系统建模与实验研究

国家自然科学基金

0+阅读 · 2012年12月31日

前馈神经网络学习算法的设计与分析

国家自然科学基金

3+阅读 · 2011年12月31日

传感器网络中动态信道环境下保性能的能量协同优化策略研究

国家自然科学基金

0+阅读 · 2009年12月31日

图和复杂网络的谱分析

国家自然科学基金

1+阅读 · 2009年12月31日

Tracking the Dynamics of the Tear Film Lipid Layer

Arxiv

0+阅读 · 2022年12月7日

Hybrid Model using Feature Extraction and Non-linear SVM for Brain Tumor Classification

Arxiv

0+阅读 · 2022年12月6日

High Dimensional Binary Classification under Label Shift: Phase Transition and Regularization

Arxiv

0+阅读 · 2022年12月5日

Agent Miner: An Algorithm for Discovering Agent Systems from Event Data

Arxiv

0+阅读 · 2022年12月2日

Astromorphic Self-Repair of Neuromorphic Hardware Systems

Arxiv

0+阅读 · 2022年12月2日

P(Expression|Grammar): Probability of deriving an algebraic expression with a probabilistic context-free grammar

Arxiv

0+阅读 · 2022年12月2日

Large-Scale Deep Learning Optimizations: A Comprehensive Survey

Arxiv

23+阅读 · 2021年11月2日

The Principles of Deep Learning Theory

Arxiv

65+阅读 · 2021年6月18日

Model Complexity of Deep Learning: A Survey

Arxiv

32+阅读 · 2021年3月8日

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

VIP会员

相关主题

加州理工学院（California Institute of Technology）

相关VIP内容

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知会员服务

78+阅读 · 2022年11月9日

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

专知会员服务

48+阅读 · 2022年11月4日

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知会员服务

72+阅读 · 2022年10月29日

【伯克利博士论文】学习在动态环境中泛化，103页pdf

【伯克利博士论文】学习在动态环境中泛化，103页pdf

专知会员服务

72+阅读 · 2022年10月12日

【多伦多大学博士论文】深度学习中的训练效率和鲁棒性

【多伦多大学博士论文】深度学习中的训练效率和鲁棒性

专知会员服务

58+阅读 · 2022年6月27日

《通过最优传输失配措施进行鲁棒性贝叶斯推断：应用和算法》麻省理工学院2022最新博士论文

《通过最优传输失配措施进行鲁棒性贝叶斯推断：应用和算法》麻省理工学院2022最新博士论文

专知会员服务

15+阅读 · 2022年6月21日

【巴黎理工学院博士论文】持续学习：用重放过程解决深度神经网络中的灾难性遗忘

【巴黎理工学院博士论文】持续学习：用重放过程解决深度神经网络中的灾难性遗忘

专知会员服务

35+阅读 · 2022年5月8日

【新讲义】《非线性优化》洛桑联邦理工学院(EPFL），147页PDF

【新讲义】《非线性优化》洛桑联邦理工学院(EPFL），147页PDF

专知会员服务

31+阅读 · 2022年4月28日

【MIT-Kenji博士论文】深度学习中的优化与可扩展性，260页pdf

【MIT-Kenji博士论文】深度学习中的优化与可扩展性，260页pdf

专知会员服务

61+阅读 · 2022年4月3日

【NeurIPS 2020】学习神经网络中的不变性

专知会员服务

29+阅读 · 2020年10月24日

热门VIP内容

开通专知VIP会员享更多权益服务

【伯克利博士论文】通过真实世界实践赋能机器人自主性

军用无人机集群技术尚未成熟——但潜力可期

人工智能安全治理白皮书（2025）

AgentOps综述：分类、挑战与未来方向

相关资讯

【苏黎世联邦理工博士论文】深度强化学习的体系结构，186页pdf

【苏黎世联邦理工博士论文】深度强化学习的体系结构，186页pdf

专知

6+阅读 · 2022年11月29日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知

9+阅读 · 2022年11月9日

【苏黎世联邦理工博士论文】因果推断的混杂调整

【苏黎世联邦理工博士论文】因果推断的混杂调整

专知

4+阅读 · 2022年11月7日

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

专知

2+阅读 · 2022年11月4日

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知

9+阅读 · 2022年10月29日

【伯克利博士论文】学习在动态环境中泛化，103页pdf

【伯克利博士论文】学习在动态环境中泛化，103页pdf

专知

6+阅读 · 2022年10月12日

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

专知

6+阅读 · 2022年10月5日

【MIT博士论文】通过最优传输不匹配措施的鲁棒贝叶斯推断:应用和算法

【MIT博士论文】通过最优传输不匹配措施的鲁棒贝叶斯推断:应用和算法

专知

3+阅读 · 2022年7月14日

为什么深度学习是非参数的？

为什么深度学习是非参数的？

THU数据派

1+阅读 · 2022年3月29日

一文读懂生成对抗网络GANs（附学习资源）

一文读懂生成对抗网络GANs（附学习资源）

数据派THU

10+阅读 · 2018年2月9日

相关基金

双层网络下的振子集体行为研究：以生物钟神经元网络为例

国家自然科学基金

0+阅读 · 2015年12月31日

学习与记忆的神经动力学研究

国家自然科学基金

1+阅读 · 2014年12月31日

无线传感器网络中多路径路由及非干扰路由的研究

国家自然科学基金

0+阅读 · 2013年12月31日

应用于无线传感器网络的低时延分布式信源编码及延伸性研究

国家自然科学基金

0+阅读 · 2013年12月31日

反馈神经网络对非线性动力系统的本质逼近能力研究

国家自然科学基金

0+阅读 · 2012年12月31日

DBFC燃料电池Au基合金催化剂结构设计、性能表征及电催化特性研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于泛化神经网络和李亚普诺夫稳定性的超声波电机伺服控制系统建模与实验研究

国家自然科学基金

0+阅读 · 2012年12月31日

前馈神经网络学习算法的设计与分析

国家自然科学基金

3+阅读 · 2011年12月31日

传感器网络中动态信道环境下保性能的能量协同优化策略研究

国家自然科学基金

0+阅读 · 2009年12月31日

图和复杂网络的谱分析

国家自然科学基金

1+阅读 · 2009年12月31日

相关论文

Tracking the Dynamics of the Tear Film Lipid Layer

Arxiv

0+阅读 · 2022年12月7日

Hybrid Model using Feature Extraction and Non-linear SVM for Brain Tumor Classification

Arxiv

0+阅读 · 2022年12月6日

High Dimensional Binary Classification under Label Shift: Phase Transition and Regularization

Arxiv

0+阅读 · 2022年12月5日

Agent Miner: An Algorithm for Discovering Agent Systems from Event Data

Arxiv

0+阅读 · 2022年12月2日

Astromorphic Self-Repair of Neuromorphic Hardware Systems

Arxiv

0+阅读 · 2022年12月2日

P(Expression|Grammar): Probability of deriving an algebraic expression with a probabilistic context-free grammar

Arxiv

0+阅读 · 2022年12月2日

Large-Scale Deep Learning Optimizations: A Comprehensive Survey

Arxiv

23+阅读 · 2021年11月2日

The Principles of Deep Learning Theory

Arxiv

65+阅读 · 2021年6月18日

Model Complexity of Deep Learning: A Survey

Arxiv

32+阅读 · 2021年3月8日

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

微信扫码咨询专知VIP会员