【ICML2022】张量卷积神经网络的统一权值初始化范式 - 专知

会员服务 ·

0

【ICML2022】张量卷积神经网络的统一权值初始化范式

2022 年 6 月 8 日 专知

张量卷积神经网络(Tensorial Convolutional Neural Networks, TCNNs)因其在减小模型参数或提高泛化能力方面的优势而受到广泛的研究。然而，甚至权重初始化方法也阻碍了tcnn的探索。具体来说，一般的初始化方法，如Xavier或Kaiming初始化，通常无法为TCNN生成合适的权值。同时，虽然有针对特定架构的特别方法(如张量环网)，但它们不适用于具有其他张量分解方法的TCNN(如CP或Tucker分解)。为了解决这一问题，我们提出了一种通用的权值初始化范式，推广了Xavier和Kaiming方法，可广泛应用于任意的TCNN。具体来说，我们首先提出了再现变换，将TCNNs中的逆向过程转换为等效的卷积过程。然后，基于前向和后向过程中的卷积算子，构建统一的范式来控制TCNN中的特征和梯度方差。因此，我们可以推导出各种TCNN的扇入和扇出初始化。我们证明，我们的范式可以稳定TCNNs的训练，导致更快的收敛和更好的结果。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“TCNN” 就可以获取《【ICML2022】张量卷积神经网络的统一权值初始化范式》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取100000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取100000+AI主题知识资料

登录查看更多

2

相关内容

初始化

【KDD2022】基于知识增强提示学习的统一会话推荐系统

【KDD2022】基于知识增强提示学习的统一会话推荐系统

专知会员服务

29+阅读 · 2022年6月26日

【ICML2022】CtrlFormer: 通过Transformer学习视觉控制的可迁移状态表示

【ICML2022】CtrlFormer: 通过Transformer学习视觉控制的可迁移状态表示

专知会员服务

16+阅读 · 2022年6月21日

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

专知会员服务

10+阅读 · 2022年5月28日

【NeurIPS2021】未见深度架构参数预测

【NeurIPS2021】未见深度架构参数预测

专知会员服务

10+阅读 · 2021年10月27日

【ICML2021】通过文本生成统一视觉和语言任务

专知会员服务

19+阅读 · 2021年9月13日

【ICML2021】基于子网络推理的贝叶斯深度学习

专知会员服务

36+阅读 · 2021年8月17日

【ICML2021】统一鲁棒半监督变分自编码器

专知会员服务

27+阅读 · 2021年7月11日

【ICML2021】随机迭代图匹配

专知会员服务

25+阅读 · 2021年6月8日

【ICML2021】基于小波变换的图神经网络

专知会员服务

51+阅读 · 2021年5月19日

【ICML2021】有向图网络

专知会员服务

82+阅读 · 2021年5月10日

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知

0+阅读 · 2022年7月8日

【ICML2022】通过能量最小化学习迭代推理

【ICML2022】通过能量最小化学习迭代推理

专知

0+阅读 · 2022年7月3日

【ICML2022】基于元语义正则化的介入性对比学习

【ICML2022】基于元语义正则化的介入性对比学习

专知

0+阅读 · 2022年7月1日

【ICML2022】蛋白质适应度预测与自回归transformers和推理时间检索

【ICML2022】蛋白质适应度预测与自回归transformers和推理时间检索

专知

0+阅读 · 2022年6月4日

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

专知

0+阅读 · 2022年5月28日

【CVPR2022】通过特征Mixing进行主动学习

【CVPR2022】通过特征Mixing进行主动学习

专知

0+阅读 · 2022年3月15日

【NeurIPS2021】用于文本图表示学习的 GNN 嵌套 Transformer 模型：GraphFormers

【NeurIPS2021】用于文本图表示学习的 GNN 嵌套 Transformer 模型：GraphFormers

专知

0+阅读 · 2021年11月24日

【ICML2021】从DNN中解释和解分不同复杂度的特征分量

【ICML2021】从DNN中解释和解分不同复杂度的特征分量

专知

1+阅读 · 2021年7月22日

【ICML2021】统一鲁棒半监督变分自编码器

【ICML2021】统一鲁棒半监督变分自编码器

专知

1+阅读 · 2021年7月12日

【ICML2021】加速异构数据的分散式深度学习

【ICML2021】加速异构数据的分散式深度学习

专知

0+阅读 · 2021年7月7日

含非正态及缺失数据的结构方程模型分析

国家自然科学基金

0+阅读 · 2015年12月31日

方差正则化的分类模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

带稀疏约束不适定问题的算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于概率图的文本检索模型及算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

空间随机前沿模型估计及设定检验研究

国家自然科学基金

0+阅读 · 2013年12月31日

框架的冗余度

国家自然科学基金

0+阅读 · 2012年12月31日

点集曲面的偏差控制及尖锐特征构造

国家自然科学基金

0+阅读 · 2012年12月31日

流行病学中若干统计分析模型的推断

国家自然科学基金

2+阅读 · 2012年12月31日

约束无导数最优化问题的理论与方法及其应用

国家自然科学基金

0+阅读 · 2012年12月31日

基于可信性理论的动态投资组合模型及决策研究

国家自然科学基金

1+阅读 · 2008年12月31日

On the fast convergence of minibatch heavy ball momentum

Arxiv

0+阅读 · 2022年7月28日

A Repulsive Force Unit for Garment Collision Handling in Neural Networks

Arxiv

0+阅读 · 2022年7月28日

Federated Selective Aggregation for Knowledge Amalgamation

Arxiv

0+阅读 · 2022年7月27日

Exploring Adversarial Examples and Adversarial Robustness of Convolutional Neural Networks by Mutual Information

Arxiv

0+阅读 · 2022年7月26日

Exponential Consistency of the M-estimators of Regression Coefficients with Multivariate Responses

Arxiv

0+阅读 · 2022年7月25日

On Neural Differential Equations

Arxiv

23+阅读 · 2022年2月4日

Invariant Information Bottleneck for Domain Generalization

Invariant Information Bottleneck for Domain Generalization

Arxiv

15+阅读 · 2021年12月10日

Dynamic Neural Networks: A Survey

Arxiv

37+阅读 · 2021年2月10日

Counterfactual VQA: A Cause-Effect Look at Language Bias

Arxiv

16+阅读 · 2020年12月28日

Additive Margin Softmax for Face Verification

Arxiv

11+阅读 · 2018年1月18日

VIP会员

相关主题

张量卷积神经网络

卷积神经网络

相关VIP内容

【KDD2022】基于知识增强提示学习的统一会话推荐系统

【KDD2022】基于知识增强提示学习的统一会话推荐系统

专知会员服务

29+阅读 · 2022年6月26日

【ICML2022】CtrlFormer: 通过Transformer学习视觉控制的可迁移状态表示

【ICML2022】CtrlFormer: 通过Transformer学习视觉控制的可迁移状态表示

专知会员服务

16+阅读 · 2022年6月21日

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

专知会员服务

10+阅读 · 2022年5月28日

【NeurIPS2021】未见深度架构参数预测

【NeurIPS2021】未见深度架构参数预测

专知会员服务

10+阅读 · 2021年10月27日

【ICML2021】通过文本生成统一视觉和语言任务

专知会员服务

19+阅读 · 2021年9月13日

【ICML2021】基于子网络推理的贝叶斯深度学习

专知会员服务

36+阅读 · 2021年8月17日

【ICML2021】统一鲁棒半监督变分自编码器

专知会员服务

27+阅读 · 2021年7月11日

【ICML2021】随机迭代图匹配

专知会员服务

25+阅读 · 2021年6月8日

【ICML2021】基于小波变换的图神经网络

专知会员服务

51+阅读 · 2021年5月19日

【ICML2021】有向图网络

专知会员服务

82+阅读 · 2021年5月10日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知

0+阅读 · 2022年7月8日

【ICML2022】通过能量最小化学习迭代推理

【ICML2022】通过能量最小化学习迭代推理

专知

0+阅读 · 2022年7月3日

【ICML2022】基于元语义正则化的介入性对比学习

【ICML2022】基于元语义正则化的介入性对比学习

专知

0+阅读 · 2022年7月1日

【ICML2022】蛋白质适应度预测与自回归transformers和推理时间检索

【ICML2022】蛋白质适应度预测与自回归transformers和推理时间检索

专知

0+阅读 · 2022年6月4日

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

专知

0+阅读 · 2022年5月28日

【CVPR2022】通过特征Mixing进行主动学习

【CVPR2022】通过特征Mixing进行主动学习

专知

0+阅读 · 2022年3月15日

【NeurIPS2021】用于文本图表示学习的 GNN 嵌套 Transformer 模型：GraphFormers

【NeurIPS2021】用于文本图表示学习的 GNN 嵌套 Transformer 模型：GraphFormers

专知

0+阅读 · 2021年11月24日

【ICML2021】从DNN中解释和解分不同复杂度的特征分量

【ICML2021】从DNN中解释和解分不同复杂度的特征分量

专知

1+阅读 · 2021年7月22日

【ICML2021】统一鲁棒半监督变分自编码器

【ICML2021】统一鲁棒半监督变分自编码器

专知

1+阅读 · 2021年7月12日

【ICML2021】加速异构数据的分散式深度学习

【ICML2021】加速异构数据的分散式深度学习

专知

0+阅读 · 2021年7月7日

相关基金

含非正态及缺失数据的结构方程模型分析

国家自然科学基金

0+阅读 · 2015年12月31日

方差正则化的分类模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

带稀疏约束不适定问题的算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于概率图的文本检索模型及算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

空间随机前沿模型估计及设定检验研究

国家自然科学基金

0+阅读 · 2013年12月31日

框架的冗余度

国家自然科学基金

0+阅读 · 2012年12月31日

点集曲面的偏差控制及尖锐特征构造

国家自然科学基金

0+阅读 · 2012年12月31日

流行病学中若干统计分析模型的推断

国家自然科学基金

2+阅读 · 2012年12月31日

约束无导数最优化问题的理论与方法及其应用

国家自然科学基金

0+阅读 · 2012年12月31日

基于可信性理论的动态投资组合模型及决策研究

国家自然科学基金

1+阅读 · 2008年12月31日

相关论文

On the fast convergence of minibatch heavy ball momentum

Arxiv

0+阅读 · 2022年7月28日

A Repulsive Force Unit for Garment Collision Handling in Neural Networks

Arxiv

0+阅读 · 2022年7月28日

Federated Selective Aggregation for Knowledge Amalgamation

Arxiv

0+阅读 · 2022年7月27日

Exploring Adversarial Examples and Adversarial Robustness of Convolutional Neural Networks by Mutual Information

Arxiv

0+阅读 · 2022年7月26日

Exponential Consistency of the M-estimators of Regression Coefficients with Multivariate Responses

Arxiv

0+阅读 · 2022年7月25日

On Neural Differential Equations

Arxiv

23+阅读 · 2022年2月4日

Invariant Information Bottleneck for Domain Generalization

Invariant Information Bottleneck for Domain Generalization

Arxiv

15+阅读 · 2021年12月10日

Dynamic Neural Networks: A Survey

Arxiv

37+阅读 · 2021年2月10日

Counterfactual VQA: A Cause-Effect Look at Language Bias

Arxiv

16+阅读 · 2020年12月28日

Additive Margin Softmax for Face Verification

Arxiv

11+阅读 · 2018年1月18日

大家都在搜

久别重逢话双塔

大型语言模型

CMU博士论文

国防科技创新

软件无线电

无人机航拍交通事故现场勘查处置系统——行业第一的警用事故处理软件

微信扫码咨询专知VIP会员