【加州理工学院博士论文】神经元网络的优化与泛化，98页pdf - 专知

会员服务 ·

0

【加州理工学院博士论文】神经元网络的优化与泛化，98页pdf

2022 年 10 月 24 日 专知

本文的目标是发展人工神经网络学习的优化和泛化理论基础 。这篇论文涉及两个核心问题。给定训练数据和网络架构:1)哪种权重设置对未见数据的泛化效果最好，为什么?2)应该使用什么优化器来恢复这个权重设置?

https://www.zhuanzhi.ai/paper/004b660b4e92a46e1ca507001a0d5d54

在优化方面，神经网络训练的一个基本特征是，网络权重仅通过其在网络架构中的出现间接影响损失函数 。这篇论文提出了一个三步框架来派生新的“架构感知”优化算法。第一步称为函数优化，是根据函数扰动对损失函数的一系列展开进行优化。第二步是推导出体系结构摄动边界，将函数摄动的大小与权重摄动的大小联系起来。第三步是将这些体系结构扰动边界代入损耗的函数多数化，并通过最小化得到优化算法。这构成了主要最小化元算法在神经网络中的应用。

在泛化方面，最近的一项有前途的工作是应用PAC-Bayes理论为神经网络推导非空泛化保证 。由于这些保证控制了网络集合的平均风险，它们没有解决哪一个单独的网络应该是最好的泛化。为了弥补这一差距，本文重新点燃了核文献中的一个老思想:贝叶斯点机。贝叶斯点机是一个单一分类器，它近似于分类器集合的集合预测。由于聚合减少了集合预测的方差，贝叶斯点机往往比其他集合成员更好地进行泛化。本文证明，当网络宽度和归一化裕度都无穷大时，与训练集一致的神经网络空间集中在贝叶斯点机上。这激发了返回大标准化裕度的广泛网络的实践。

这些想法的潜在应用包括不确定性量化的新方法，神经硬件更有效的数值表示，以及在学习问题中传递超参数的优化器。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“OG98” 就可以获取《 【加州理工学院博士论文】神经元网络的优化与泛化，98页pdf》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取100000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取100000+AI主题知识资料

登录查看更多

4

相关内容

【苏黎世联邦理工博士论文】深度强化学习的体系结构，186页pdf

【苏黎世联邦理工博士论文】深度强化学习的体系结构，186页pdf

专知会员服务

40+阅读 · 2022年11月29日

【CMU博士论文】黑盒和多目标优化策略，151页pdf

【CMU博士论文】黑盒和多目标优化策略，151页pdf

专知会员服务

52+阅读 · 2022年11月24日

【华盛顿大学博士论文】因果模型的似然分析，190页pdf

【华盛顿大学博士论文】因果模型的似然分析，190页pdf

专知会员服务

35+阅读 · 2022年11月14日

神经网络如何安全可靠？牛津大学博士论文《贝叶斯神经网络的对抗鲁棒性》，206页pdf

神经网络如何安全可靠？牛津大学博士论文《贝叶斯神经网络的对抗鲁棒性》，206页pdf

专知会员服务

65+阅读 · 2022年11月10日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知会员服务

78+阅读 · 2022年11月9日

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知会员服务

72+阅读 · 2022年10月29日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知会员服务

112+阅读 · 2022年10月6日

【巴黎理工学院博士论文】持续学习：用重放过程解决深度神经网络中的灾难性遗忘

【巴黎理工学院博士论文】持续学习：用重放过程解决深度神经网络中的灾难性遗忘

专知会员服务

35+阅读 · 2022年5月8日

【MIT-Kenji博士论文】深度学习中的优化与可扩展性，260页pdf

【MIT-Kenji博士论文】深度学习中的优化与可扩展性，260页pdf

专知会员服务

61+阅读 · 2022年4月3日

【NeurIPS 2020】学习神经网络中的不变性

专知会员服务

29+阅读 · 2020年10月24日

【华盛顿大学博士论文】因果模型的似然分析，190页pdf

【华盛顿大学博士论文】因果模型的似然分析，190页pdf

专知

2+阅读 · 2022年11月14日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知

9+阅读 · 2022年11月9日

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知

9+阅读 · 2022年10月29日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

10+阅读 · 2022年10月15日

【牛津大学博士论文】基于物理信息神经网络的数据高效学习，210页pdf

【牛津大学博士论文】基于物理信息神经网络的数据高效学习，210页pdf

专知

8+阅读 · 2022年10月10日

【牛津大学博士论文】学习神经网络中的不变表示，130页pdf

【牛津大学博士论文】学习神经网络中的不变表示，130页pdf

专知

6+阅读 · 2022年10月8日

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

专知

6+阅读 · 2022年10月5日

【迪肯大学博士论文】深度神经网络视觉推理，221页pdf

【迪肯大学博士论文】深度神经网络视觉推理，221页pdf

专知

5+阅读 · 2022年10月3日

【MIT-Kenji博士论文】深度学习中的优化与可扩展性，260页pdf

【MIT-Kenji博士论文】深度学习中的优化与可扩展性，260页pdf

专知

6+阅读 · 2022年4月3日

【ETH博士论文】贝叶斯深度学习，241页pdf

【ETH博士论文】贝叶斯深度学习，241页pdf

专知

9+阅读 · 2022年1月16日

非线性混合效应模型的最优与稳健设计

国家自然科学基金

0+阅读 · 2014年12月31日

创伤性场景恐惧记忆遗忘机制的研究

国家自然科学基金

0+阅读 · 2014年12月31日

结合先进机器学习方法的代理模型进化算法研究

国家自然科学基金

4+阅读 · 2013年12月31日

面向节能的时间窗约束下炼钢生产调度与物流优化

国家自然科学基金

0+阅读 · 2013年12月31日

神经网络随机学习算法的泛化性研究

国家自然科学基金

2+阅读 · 2013年12月31日

耦合约束下非合作无线网络协调机制研究

国家自然科学基金

0+阅读 · 2013年12月31日

内源性大麻素介导自主运动增强学习记忆及其机制

国家自然科学基金

0+阅读 · 2012年12月31日

脉冲神经网络的新结构与学习算法研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于Agent的智能化元搜索引擎模型及关键技术

国家自然科学基金

2+阅读 · 2012年12月31日

一类有限混合半参数时间序列模型的研究

国家自然科学基金

0+阅读 · 2009年12月31日

Debiased Machine Learning of Set-Identified Linear Models

Arxiv

0+阅读 · 2022年12月11日

A general framework for the rigorous computation of invariant densities and the coarse-fine strategy

Arxiv

0+阅读 · 2022年12月9日

Nonparametric estimator of the tail dependence coefficient: balancing bias and variance

Arxiv

0+阅读 · 2022年12月9日

Polynomial Distributions and Transformations

Arxiv

0+阅读 · 2022年12月9日

Safe Equilibrium

Arxiv

0+阅读 · 2022年12月9日

A Novel Hierarchical-Classification-Block Based Convolutional Neural Network for Source Camera Model Identification

Arxiv

0+阅读 · 2022年12月8日

The Ordered Matrix Dirichlet for Modeling Ordinal Dynamics

Arxiv

0+阅读 · 2022年12月8日

Weapon Engagement Zone Maximum Launch Range Estimation Using a Deep Neural Network

Arxiv

19+阅读 · 2021年11月17日

The Deep Learning Compiler: A Comprehensive Survey

Arxiv

15+阅读 · 2020年2月6日

Bayesian Convolutional Neural Networks

Arxiv

19+阅读 · 2018年6月27日

VIP会员

相关主题

相关VIP内容

【苏黎世联邦理工博士论文】深度强化学习的体系结构，186页pdf

【苏黎世联邦理工博士论文】深度强化学习的体系结构，186页pdf

专知会员服务

40+阅读 · 2022年11月29日

【CMU博士论文】黑盒和多目标优化策略，151页pdf

【CMU博士论文】黑盒和多目标优化策略，151页pdf

专知会员服务

52+阅读 · 2022年11月24日

【华盛顿大学博士论文】因果模型的似然分析，190页pdf

【华盛顿大学博士论文】因果模型的似然分析，190页pdf

专知会员服务

35+阅读 · 2022年11月14日

神经网络如何安全可靠？牛津大学博士论文《贝叶斯神经网络的对抗鲁棒性》，206页pdf

神经网络如何安全可靠？牛津大学博士论文《贝叶斯神经网络的对抗鲁棒性》，206页pdf

专知会员服务

65+阅读 · 2022年11月10日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知会员服务

78+阅读 · 2022年11月9日

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知会员服务

72+阅读 · 2022年10月29日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知会员服务

112+阅读 · 2022年10月6日

【巴黎理工学院博士论文】持续学习：用重放过程解决深度神经网络中的灾难性遗忘

【巴黎理工学院博士论文】持续学习：用重放过程解决深度神经网络中的灾难性遗忘

专知会员服务

35+阅读 · 2022年5月8日

【MIT-Kenji博士论文】深度学习中的优化与可扩展性，260页pdf

【MIT-Kenji博士论文】深度学习中的优化与可扩展性，260页pdf

专知会员服务

61+阅读 · 2022年4月3日

【NeurIPS 2020】学习神经网络中的不变性

专知会员服务

29+阅读 · 2020年10月24日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

【华盛顿大学博士论文】因果模型的似然分析，190页pdf

【华盛顿大学博士论文】因果模型的似然分析，190页pdf

专知

2+阅读 · 2022年11月14日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知

9+阅读 · 2022年11月9日

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知

9+阅读 · 2022年10月29日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

10+阅读 · 2022年10月15日

【牛津大学博士论文】基于物理信息神经网络的数据高效学习，210页pdf

【牛津大学博士论文】基于物理信息神经网络的数据高效学习，210页pdf

专知

8+阅读 · 2022年10月10日

【牛津大学博士论文】学习神经网络中的不变表示，130页pdf

【牛津大学博士论文】学习神经网络中的不变表示，130页pdf

专知

6+阅读 · 2022年10月8日

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

专知

6+阅读 · 2022年10月5日

【迪肯大学博士论文】深度神经网络视觉推理，221页pdf

【迪肯大学博士论文】深度神经网络视觉推理，221页pdf

专知

5+阅读 · 2022年10月3日

【MIT-Kenji博士论文】深度学习中的优化与可扩展性，260页pdf

【MIT-Kenji博士论文】深度学习中的优化与可扩展性，260页pdf

专知

6+阅读 · 2022年4月3日

【ETH博士论文】贝叶斯深度学习，241页pdf

【ETH博士论文】贝叶斯深度学习，241页pdf

专知

9+阅读 · 2022年1月16日

相关基金

非线性混合效应模型的最优与稳健设计

国家自然科学基金

0+阅读 · 2014年12月31日

创伤性场景恐惧记忆遗忘机制的研究

国家自然科学基金

0+阅读 · 2014年12月31日

结合先进机器学习方法的代理模型进化算法研究

国家自然科学基金

4+阅读 · 2013年12月31日

面向节能的时间窗约束下炼钢生产调度与物流优化

国家自然科学基金

0+阅读 · 2013年12月31日

神经网络随机学习算法的泛化性研究

国家自然科学基金

2+阅读 · 2013年12月31日

耦合约束下非合作无线网络协调机制研究

国家自然科学基金

0+阅读 · 2013年12月31日

内源性大麻素介导自主运动增强学习记忆及其机制

国家自然科学基金

0+阅读 · 2012年12月31日

脉冲神经网络的新结构与学习算法研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于Agent的智能化元搜索引擎模型及关键技术

国家自然科学基金

2+阅读 · 2012年12月31日

一类有限混合半参数时间序列模型的研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Debiased Machine Learning of Set-Identified Linear Models

Arxiv

0+阅读 · 2022年12月11日

A general framework for the rigorous computation of invariant densities and the coarse-fine strategy

Arxiv

0+阅读 · 2022年12月9日

Nonparametric estimator of the tail dependence coefficient: balancing bias and variance

Arxiv

0+阅读 · 2022年12月9日

Polynomial Distributions and Transformations

Arxiv

0+阅读 · 2022年12月9日

Safe Equilibrium

Arxiv

0+阅读 · 2022年12月9日

A Novel Hierarchical-Classification-Block Based Convolutional Neural Network for Source Camera Model Identification

Arxiv

0+阅读 · 2022年12月8日

The Ordered Matrix Dirichlet for Modeling Ordinal Dynamics

Arxiv

0+阅读 · 2022年12月8日

Weapon Engagement Zone Maximum Launch Range Estimation Using a Deep Neural Network

Arxiv

19+阅读 · 2021年11月17日

The Deep Learning Compiler: A Comprehensive Survey

Arxiv

15+阅读 · 2020年2月6日

Bayesian Convolutional Neural Networks

Arxiv

19+阅读 · 2018年6月27日

大家都在搜

大型语言模型

CMU博士论文

久别重逢话双塔

OpenKG开源系列 | 海洋鱼类百科知识图谱（浙江大学）

微信扫码咨询专知VIP会员