【ICML2021】神经切线核训练动力学的架构通用性 - 专知VIP

会员服务 ·

2

ICML 2021 · 神经切线核 ·

2021 年 5 月 26 日

【ICML2021】神经切线核训练动力学的架构通用性

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

Yang (2020a)最近指出，神经切线核(NTK)在初始化时具有无限宽的限制，适用于许多架构，包括现代的主要架构，如ResNet和Transformer。然而，他们的分析并不适用于训练。在这里，我们展示了同样的神经网络(在所谓的NTK参数化中)在训练过程中遵循函数空间中的核梯度下降动力学，其中核是无限宽NTK。这就完成了NTK行为体系结构通用性的证明。为了得到这个结果，我们运用张量程序技术:在一个张量程序中编写整个SGD动态，并通过主定理分析它。为了便于证明，我们开发了一个张量程序的图形符号。

成为VIP会员查看完整内容

12

相关内容

ICML 2021

【ICML2021】弹性图神经网络

专知会员服务

37+阅读 · 2021年7月17日

【ICML2021】贝叶斯注意力信念网络

专知会员服务

39+阅读 · 2021年6月11日

【ICML2021】深度残差网络的可扩展特性

专知会员服务

20+阅读 · 2021年5月30日

【ICML2021】为开放博弈中的学习建模行为多样性。

专知会员服务

37+阅读 · 2021年5月29日

【ICML2021】有向图网络

专知会员服务

82+阅读 · 2021年5月10日

【ICLR2021】对未标记数据进行深度网络自训练的理论分析

【ICLR2021】对未标记数据进行深度网络自训练的理论分析

专知会员服务

26+阅读 · 2021年2月22日

多伦多大学2021《机器学习》课程，讲述深度学习理论中的神经网络训练动力学

多伦多大学2021《机器学习》课程，讲述深度学习理论中的神经网络训练动力学

专知会员服务

59+阅读 · 2021年1月29日

【Cell 2020】神经网络中的持续学习

【Cell 2020】神经网络中的持续学习

专知会员服务

62+阅读 · 2020年11月7日

【2020新书】Pharo中的敏捷人工智能，实现神经网络、遗传算法和神经进化，394页pdf

【2020新书】Pharo中的敏捷人工智能，实现神经网络、遗传算法和神经进化，394页pdf

专知会员服务

41+阅读 · 2020年6月23日

【干货书】高级应用深度学习，294页pdf

【干货书】高级应用深度学习，294页pdf

专知会员服务

154+阅读 · 2020年6月20日

【AAAI2021】近似梯度下降的学习图神经网络

【AAAI2021】近似梯度下降的学习图神经网络

专知

8+阅读 · 2020年12月9日

图神经网络架构，稳定性，可迁移性

图神经网络架构，稳定性，可迁移性

专知

5+阅读 · 2020年8月8日

【ICML2020】持续图神经网络，Continuous Graph Neural Networks

【ICML2020】持续图神经网络，Continuous Graph Neural Networks

专知

75+阅读 · 2020年6月29日

【神经网络】怎样设计最优的卷积神经网络架构？卷积神经网络的训练过程

【神经网络】怎样设计最优的卷积神经网络架构？卷积神经网络的训练过程

产业智能官

6+阅读 · 2019年8月8日

学界 | 神经网络的气宗与剑宗之争：先验强大的网络甚至不需要训练

学界 | 神经网络的气宗与剑宗之争：先验强大的网络甚至不需要训练

AI研习社

6+阅读 · 2019年6月15日

田渊栋博士:求道之人，不问寒暑—理解ReLU深度网络训练动态

田渊栋博士:求道之人，不问寒暑—理解ReLU深度网络训练动态

极市平台

7+阅读 · 2019年6月5日

如何训练你的ResNet（三）：正则化

如何训练你的ResNet（三）：正则化

论智

5+阅读 · 2018年11月13日

OpenAI提出Reptile：可扩展的元学习算法

OpenAI提出Reptile：可扩展的元学习算法

深度学习世界

7+阅读 · 2018年3月9日

训练深度神经网络失败的罪魁祸首不是梯度消失，而是退化

训练深度神经网络失败的罪魁祸首不是梯度消失，而是退化

机器之心

4+阅读 · 2018年1月7日

生成对抗网络综述：从架构到训练技巧，看这篇论文就够了

生成对抗网络综述：从架构到训练技巧，看这篇论文就够了

机器之心

8+阅读 · 2017年10月22日

CLeaR: An Adaptive Continual Learning Framework for Regression Tasks

Arxiv

0+阅读 · 2021年7月16日

Fine-Tuning the Odds in Bayesian Networks

Arxiv

0+阅读 · 2021年7月16日

On Achieving Fairness and Stability in Many-to-One Matchings

Arxiv

0+阅读 · 2021年7月15日

Inverse Reinforcement Learning Based Stochastic Driver Behavior Learning

Arxiv

0+阅读 · 2021年7月15日

Do RNN and LSTM have Long Memory?

Do RNN and LSTM have Long Memory?

Arxiv

19+阅读 · 2020年6月10日

Lipschitz Lifelong Reinforcement Learning

Arxiv

4+阅读 · 2020年1月17日

Generalization and Regularization in DQN

Generalization and Regularization in DQN

Arxiv

6+阅读 · 2019年1月30日

Towards Understanding Regularization in Batch Normalization

Towards Understanding Regularization in Batch Normalization

Arxiv

4+阅读 · 2018年9月27日

LARNN: Linear Attention Recurrent Neural Network

LARNN: Linear Attention Recurrent Neural Network

Arxiv

5+阅读 · 2018年8月16日

Arxiv

8+阅读 · 2018年1月25日

VIP会员

相关主题

神经切线核

相关VIP内容

【ICML2021】弹性图神经网络

专知会员服务

37+阅读 · 2021年7月17日

【ICML2021】贝叶斯注意力信念网络

专知会员服务

39+阅读 · 2021年6月11日

【ICML2021】深度残差网络的可扩展特性

专知会员服务

20+阅读 · 2021年5月30日

【ICML2021】为开放博弈中的学习建模行为多样性。

专知会员服务

37+阅读 · 2021年5月29日

【ICML2021】有向图网络

专知会员服务

82+阅读 · 2021年5月10日

【ICLR2021】对未标记数据进行深度网络自训练的理论分析

【ICLR2021】对未标记数据进行深度网络自训练的理论分析

专知会员服务

26+阅读 · 2021年2月22日

多伦多大学2021《机器学习》课程，讲述深度学习理论中的神经网络训练动力学

多伦多大学2021《机器学习》课程，讲述深度学习理论中的神经网络训练动力学

专知会员服务

59+阅读 · 2021年1月29日

【Cell 2020】神经网络中的持续学习

【Cell 2020】神经网络中的持续学习

专知会员服务

62+阅读 · 2020年11月7日

【2020新书】Pharo中的敏捷人工智能，实现神经网络、遗传算法和神经进化，394页pdf

【2020新书】Pharo中的敏捷人工智能，实现神经网络、遗传算法和神经进化，394页pdf

专知会员服务

41+阅读 · 2020年6月23日

【干货书】高级应用深度学习，294页pdf

【干货书】高级应用深度学习，294页pdf

专知会员服务

154+阅读 · 2020年6月20日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

【AAAI2021】近似梯度下降的学习图神经网络

【AAAI2021】近似梯度下降的学习图神经网络

专知

8+阅读 · 2020年12月9日

图神经网络架构，稳定性，可迁移性

图神经网络架构，稳定性，可迁移性

专知

5+阅读 · 2020年8月8日

【ICML2020】持续图神经网络，Continuous Graph Neural Networks

【ICML2020】持续图神经网络，Continuous Graph Neural Networks

专知

75+阅读 · 2020年6月29日

【神经网络】怎样设计最优的卷积神经网络架构？卷积神经网络的训练过程

【神经网络】怎样设计最优的卷积神经网络架构？卷积神经网络的训练过程

产业智能官

6+阅读 · 2019年8月8日

学界 | 神经网络的气宗与剑宗之争：先验强大的网络甚至不需要训练

学界 | 神经网络的气宗与剑宗之争：先验强大的网络甚至不需要训练

AI研习社

6+阅读 · 2019年6月15日

田渊栋博士:求道之人，不问寒暑—理解ReLU深度网络训练动态

田渊栋博士:求道之人，不问寒暑—理解ReLU深度网络训练动态

极市平台

7+阅读 · 2019年6月5日

如何训练你的ResNet（三）：正则化

如何训练你的ResNet（三）：正则化

论智

5+阅读 · 2018年11月13日

OpenAI提出Reptile：可扩展的元学习算法

OpenAI提出Reptile：可扩展的元学习算法

深度学习世界

7+阅读 · 2018年3月9日

训练深度神经网络失败的罪魁祸首不是梯度消失，而是退化

训练深度神经网络失败的罪魁祸首不是梯度消失，而是退化

机器之心

4+阅读 · 2018年1月7日

生成对抗网络综述：从架构到训练技巧，看这篇论文就够了

生成对抗网络综述：从架构到训练技巧，看这篇论文就够了

机器之心

8+阅读 · 2017年10月22日

相关论文

CLeaR: An Adaptive Continual Learning Framework for Regression Tasks

Arxiv

0+阅读 · 2021年7月16日

Fine-Tuning the Odds in Bayesian Networks

Arxiv

0+阅读 · 2021年7月16日

On Achieving Fairness and Stability in Many-to-One Matchings

Arxiv

0+阅读 · 2021年7月15日

Inverse Reinforcement Learning Based Stochastic Driver Behavior Learning

Arxiv

0+阅读 · 2021年7月15日

Do RNN and LSTM have Long Memory?

Do RNN and LSTM have Long Memory?

Arxiv

19+阅读 · 2020年6月10日

Lipschitz Lifelong Reinforcement Learning

Arxiv

4+阅读 · 2020年1月17日

Generalization and Regularization in DQN

Generalization and Regularization in DQN

Arxiv

6+阅读 · 2019年1月30日

Towards Understanding Regularization in Batch Normalization

Towards Understanding Regularization in Batch Normalization

Arxiv

4+阅读 · 2018年9月27日

LARNN: Linear Attention Recurrent Neural Network

LARNN: Linear Attention Recurrent Neural Network

Arxiv

5+阅读 · 2018年8月16日

Arxiv

8+阅读 · 2018年1月25日

微信扫码咨询专知VIP会员