【NeurIPS2023】宽度神经网络作为高斯过程:深度均衡模型的经验教训 - 专知VIP

会员服务 ·

14

NeurIPS 2023 · 宽度神经网络 · 高斯过程 · 深度模型 ·

2023 年 10 月 18 日

【NeurIPS2023】宽度神经网络作为高斯过程:深度均衡模型的经验教训

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

宽度神经网络因其与高斯过程的等价性而受到了极大的关注，这使得它可以完美地拟合训练数据，同时保持泛化性能，这被称为良性过拟合。然而，现有的研究主要集中在浅层或有限深度的网络上，这使得我们有必要对具有无限深度层的宽神经网络进行全面分析，例如神经常微分方程（ODEs）和深度平衡模型（DEQs）。在这篇文章中，我们特别研究了深度平衡模型（DEQ），一个在各层之间共享权重矩阵的无限深度神经网络。我们的分析揭示，随着DEQ层的宽度逼近无穷大，它会收敛到一个高斯过程，从而确立了所谓的神经网络与高斯过程（NNGP）对应关系。值得注意的是，即使深度和宽度的极限互换，这种收敛性仍然存在，这在典型的无限深度多层感知器（MLP）网络中并没有观察到。此外，我们证明了相关的高斯向量对于任何成对不同的输入数据仍然是非退化的，确保使用NNGP核的相应核矩阵具有严格正的最小特征值。这些发现为研究DEQs的训练和泛化提供了基本要素，为这一领域的未来研究奠定了基础。

成为VIP会员查看完整内容

26

相关内容

NeurIPS 2023

【NeurIPS2023】大型预训练模型的等变自适应

【NeurIPS2023】大型预训练模型的等变自适应

专知会员服务

32+阅读 · 2023年10月4日

【KDD2023】GraphGLOW：面向图神经网络的通用和可泛化的结构学习

【KDD2023】GraphGLOW：面向图神经网络的通用和可泛化的结构学习

专知会员服务

30+阅读 · 2023年6月24日

张量神经网络是什么？香港城市大学最新《张量网络与神经网络结合》综述

张量神经网络是什么？香港城市大学最新《张量网络与神经网络结合》综述

专知会员服务

42+阅读 · 2023年2月28日

【KDD2022】基于对抗性知识蒸馏的深度图神经网络压缩

【KDD2022】基于对抗性知识蒸馏的深度图神经网络压缩

专知会员服务

24+阅读 · 2022年6月10日

【TPAMI2022】双曲深度神经网络研究综述

【TPAMI2022】双曲深度神经网络研究综述

专知会员服务

66+阅读 · 2021年12月29日

【KDD2021】深度图卷积网络混合归一化的精确和多样化推荐

专知会员服务

22+阅读 · 2021年8月23日

【KDD2021】图神经网络的自适应迁移学习

专知会员服务

66+阅读 · 2021年7月25日

WWW2021 | 同源共流：一个优化框架统一与解释图神经网络

专知会员服务

30+阅读 · 2021年2月26日

【UC伯克利-清华】隐式图神经网络

专知会员服务

24+阅读 · 2020年9月15日

【KDD2020】Connecting the Dots: 基于图神经网络的多元时间序列预测

【KDD2020】Connecting the Dots: 基于图神经网络的多元时间序列预测

专知会员服务

130+阅读 · 2020年7月6日

【CVPR2023】自异构融合知识挖掘的长尾视觉识别

【CVPR2023】自异构融合知识挖掘的长尾视觉识别

专知

5+阅读 · 2023年4月6日

【AAAI2023】面向领域自适应语义分割的几何感知网络

【AAAI2023】面向领域自适应语义分割的几何感知网络

专知

8+阅读 · 2022年12月7日

图神经网络及其在电力系统中的应用综述，12页pdf

图神经网络及其在电力系统中的应用综述，12页pdf

专知

29+阅读 · 2021年1月28日

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知

29+阅读 · 2021年1月25日

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知

17+阅读 · 2021年1月24日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

17+阅读 · 2020年6月7日

【CVPR2020-清华大学】渐进对抗网络的细粒度域适应，Progressive Adversarial Networks

【CVPR2020-清华大学】渐进对抗网络的细粒度域适应，Progressive Adversarial Networks

专知

31+阅读 · 2020年4月4日

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

专知

13+阅读 · 2020年4月1日

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

专知

41+阅读 · 2020年3月25日

含非正态及缺失数据的结构方程模型分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于低秩表示的鲁棒特征抽取和分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于神经网络的无约束0-1二次规划全局最优算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

故障互连网络中含经过指定边的无错误哈密顿圈问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

扩散过程离散化形式下的若干统计问题的大偏差原理

国家自然科学基金

0+阅读 · 2014年12月31日

图的随机p-中心和中位问题的理论和算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

一类Caputo型分数阶混沌系统及其同步研究

国家自然科学基金

0+阅读 · 2014年12月31日

变换结构方程模型的非参数贝叶斯分析

国家自然科学基金

4+阅读 · 2014年12月31日

非线性混合效应模型的最优与稳健设计

国家自然科学基金

0+阅读 · 2014年12月31日

复杂数据下含指标项半参数模型结构的统计推断及应用

国家自然科学基金

0+阅读 · 2014年12月31日

Particle-based algorithm for stochastic optimal control

Arxiv

0+阅读 · 2023年12月3日

Is stochastic thermodynamics the key to understanding the energy costs of computation?

Arxiv

0+阅读 · 2023年11月30日

Tucker tensor factor models: matricization and mode-wise PCA estimation

Arxiv

0+阅读 · 2023年11月30日

In search of the perfect fit: interpretation, flexible modelling, and the existing generalisations of the normal distribution

Arxiv

0+阅读 · 2023年11月29日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

218+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

482+阅读 · 2023年3月31日

A survey and taxonomy of loss functions in machine learning

Arxiv

26+阅读 · 2023年1月13日

VIP会员

相关主题

宽度神经网络

相关VIP内容

【NeurIPS2023】大型预训练模型的等变自适应

【NeurIPS2023】大型预训练模型的等变自适应

专知会员服务

32+阅读 · 2023年10月4日

【KDD2023】GraphGLOW：面向图神经网络的通用和可泛化的结构学习

【KDD2023】GraphGLOW：面向图神经网络的通用和可泛化的结构学习

专知会员服务

30+阅读 · 2023年6月24日

张量神经网络是什么？香港城市大学最新《张量网络与神经网络结合》综述

张量神经网络是什么？香港城市大学最新《张量网络与神经网络结合》综述

专知会员服务

42+阅读 · 2023年2月28日

【KDD2022】基于对抗性知识蒸馏的深度图神经网络压缩

【KDD2022】基于对抗性知识蒸馏的深度图神经网络压缩

专知会员服务

24+阅读 · 2022年6月10日

【TPAMI2022】双曲深度神经网络研究综述

【TPAMI2022】双曲深度神经网络研究综述

专知会员服务

66+阅读 · 2021年12月29日

【KDD2021】深度图卷积网络混合归一化的精确和多样化推荐

专知会员服务

22+阅读 · 2021年8月23日

【KDD2021】图神经网络的自适应迁移学习

专知会员服务

66+阅读 · 2021年7月25日

WWW2021 | 同源共流：一个优化框架统一与解释图神经网络

专知会员服务

30+阅读 · 2021年2月26日

【UC伯克利-清华】隐式图神经网络

专知会员服务

24+阅读 · 2020年9月15日

【KDD2020】Connecting the Dots: 基于图神经网络的多元时间序列预测

【KDD2020】Connecting the Dots: 基于图神经网络的多元时间序列预测

专知会员服务

130+阅读 · 2020年7月6日

热门VIP内容

开通专知VIP会员享更多权益服务

新型数字杀伤链：理解综合战术网络对野战炮兵体系的能力与效益

《对抗环境中运用数字孪生技术优化预测性维护与后勤保障》2025最新93页

《任务式指挥十六个案例研究》232页

《幻觉还是事实：国防大型语言模型的可信度评估研究》2025最新109页

相关资讯

【CVPR2023】自异构融合知识挖掘的长尾视觉识别

【CVPR2023】自异构融合知识挖掘的长尾视觉识别

专知

5+阅读 · 2023年4月6日

【AAAI2023】面向领域自适应语义分割的几何感知网络

【AAAI2023】面向领域自适应语义分割的几何感知网络

专知

8+阅读 · 2022年12月7日

图神经网络及其在电力系统中的应用综述，12页pdf

图神经网络及其在电力系统中的应用综述，12页pdf

专知

29+阅读 · 2021年1月28日

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知

29+阅读 · 2021年1月25日

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知

17+阅读 · 2021年1月24日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

17+阅读 · 2020年6月7日

【CVPR2020-清华大学】渐进对抗网络的细粒度域适应，Progressive Adversarial Networks

【CVPR2020-清华大学】渐进对抗网络的细粒度域适应，Progressive Adversarial Networks

专知

31+阅读 · 2020年4月4日

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

专知

13+阅读 · 2020年4月1日

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

专知

41+阅读 · 2020年3月25日

相关基金

含非正态及缺失数据的结构方程模型分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于低秩表示的鲁棒特征抽取和分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于神经网络的无约束0-1二次规划全局最优算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

故障互连网络中含经过指定边的无错误哈密顿圈问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

扩散过程离散化形式下的若干统计问题的大偏差原理

国家自然科学基金

0+阅读 · 2014年12月31日

图的随机p-中心和中位问题的理论和算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

一类Caputo型分数阶混沌系统及其同步研究

国家自然科学基金

0+阅读 · 2014年12月31日

变换结构方程模型的非参数贝叶斯分析

国家自然科学基金

4+阅读 · 2014年12月31日

非线性混合效应模型的最优与稳健设计

国家自然科学基金

0+阅读 · 2014年12月31日

复杂数据下含指标项半参数模型结构的统计推断及应用

国家自然科学基金

0+阅读 · 2014年12月31日

相关论文

Particle-based algorithm for stochastic optimal control

Arxiv

0+阅读 · 2023年12月3日

Is stochastic thermodynamics the key to understanding the energy costs of computation?

Arxiv

0+阅读 · 2023年11月30日

Tucker tensor factor models: matricization and mode-wise PCA estimation

Arxiv

0+阅读 · 2023年11月30日

In search of the perfect fit: interpretation, flexible modelling, and the existing generalisations of the normal distribution

Arxiv

0+阅读 · 2023年11月29日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

218+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

482+阅读 · 2023年3月31日

A survey and taxonomy of loss functions in machine learning

Arxiv

26+阅读 · 2023年1月13日

微信扫码咨询专知VIP会员