【ICLR2022】Vision Transformer 模型工作机制的最新理论 - 专知

会员服务 ·

0

【ICLR2022】Vision Transformer 模型工作机制的最新理论

2022 年 2 月 19 日 专知

在深度神经网络之后，以多头自注意力机制为核心的Vision Transformer因其对输入全局关联的强大建模能力得到了广泛应用和研究。尽管现有研究在模型结构、损失函数、训练机制等方面提出了诸多改进，但少有研究对Vision Transformer的工作机制进行了深入探索。本文为ICLR 2022中的亮点论文之一，提供了不同解释来帮助理解Vision Transformer (ViT)的优良特性：1）多头自注意力机制不仅提高了精度，而且通过使损失的超平面变得平坦，提高了泛化程度；2）多头自注意力机制和卷积模块表现出相反的行为。例如，多头自注意力机制是低通滤波器，而卷积模块是高通滤波器；3）多层的神经网络的行为就像一系列小的个体模型的串联；4）最后阶段的卷积模块在预测中起着关键作用。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“VT22” 就可以获取《【ICLR2022】Vision Transformer 模型工作机制的最新理论》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取70000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取70000+AI主题知识资源

登录查看更多

0

相关内容

多头自注意力

多头自注意力

「深度学习视觉注意力」最新2022研究综述，概述50种软硬注意力机制方法

「深度学习视觉注意力」最新2022研究综述，概述50种软硬注意力机制方法

专知会员服务

112+阅读 · 2022年4月20日

中科院计算所最新「视觉Transformer」综述论文，带你全面了解最新CV分类、检测/分割方法

中科院计算所最新「视觉Transformer」综述论文，带你全面了解最新CV分类、检测/分割方法

专知会员服务

99+阅读 · 2021年11月16日

【Tutorial】计算机视觉中的Transformer，98页ppt

【Tutorial】计算机视觉中的Transformer，98页ppt

专知会员服务

151+阅读 · 2021年10月25日

卷积神经网络中的注意力机制综述

卷积神经网络中的注意力机制综述

专知会员服务

77+阅读 · 2021年10月22日

【ICCV 2021 】Vision Transformer中的相对位置编码

专知会员服务

30+阅读 · 2021年7月30日

复旦最新「Transformers全面综述」论文，40页pdf概述Transformers各种变体模型与应用

复旦最新「Transformers全面综述」论文，40页pdf概述Transformers各种变体模型与应用

专知会员服务

194+阅读 · 2021年6月10日

【ICLR2021】常识人工智能，77页ppt

【ICLR2021】常识人工智能，77页ppt

专知会员服务

78+阅读 · 2021年5月11日

ICLR2021 | 初探GNN的表示能力

专知会员服务

28+阅读 · 2021年5月2日

最新6篇ICLR2021篇图神经网络论文推荐

专知会员服务

57+阅读 · 2021年1月26日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知会员服务

107+阅读 · 2020年8月30日

【CVPR2022】EDTER：基于Transformer的边缘检测

【CVPR2022】EDTER：基于Transformer的边缘检测

专知

2+阅读 · 2022年3月18日

【ICLR2022】分布外泛化的不确定性建模

【ICLR2022】分布外泛化的不确定性建模

专知

2+阅读 · 2022年2月11日

自然语言处理中的文本表示研究

自然语言处理中的文本表示研究

专知

0+阅读 · 2022年1月10日

【AAAI2022】基于分层随机注意的Transformer 不确定性估计

【AAAI2022】基于分层随机注意的Transformer 不确定性估计

专知

0+阅读 · 2021年12月29日

【NeurIPS 2021】流形上的注意力机制：规范等变的Transformer

【NeurIPS 2021】流形上的注意力机制：规范等变的Transformer

专知

3+阅读 · 2021年12月2日

【NeurIPS 2021】如何使用 Transformer 模型在图表示任务中胜过 GNN

【NeurIPS 2021】如何使用 Transformer 模型在图表示任务中胜过 GNN

专知

1+阅读 · 2021年11月21日

【Tutorial】计算机视觉中的Transformer，98页ppt

【Tutorial】计算机视觉中的Transformer，98页ppt

专知

21+阅读 · 2021年10月25日

【CVPR2021】基于Transformers 从序列到序列的角度重新思考语义分割

【CVPR2021】基于Transformers 从序列到序列的角度重新思考语义分割

专知

0+阅读 · 2021年3月15日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

深度学习可解释性研究进展

深度学习可解释性研究进展

专知

19+阅读 · 2020年6月26日

结合前馈和反馈机制的自然场景文本识别技术

国家自然科学基金

0+阅读 · 2014年12月31日

奖赏学习对基本认知过程的调节机制

国家自然科学基金

4+阅读 · 2014年12月31日

基于嵌入性理论的中小企业开放式创新风险控制研究

国家自然科学基金

0+阅读 · 2014年12月31日

生物认知机制和特性启发的视觉计算模型与方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

生物启发设计中产品创意造型生成机制及其演化模型研究

国家自然科学基金

0+阅读 · 2013年12月31日

供应链网络知识转移与合作创新机制研究

国家自然科学基金

1+阅读 · 2012年12月31日

可信可控路由机制的研究

国家自然科学基金

0+阅读 · 2009年12月31日

动态自适应协同进化的学习机制研究

国家自然科学基金

0+阅读 · 2009年12月31日

作物生长模拟模型资源构建机制与集成模式

国家自然科学基金

1+阅读 · 2009年12月31日

台湾及邻区地幔底部的地震各向异性及其动力学启示

国家自然科学基金

0+阅读 · 2009年12月31日

Image Captioning In the Transformer Age

Arxiv

1+阅读 · 2022年4月15日

LaMemo: Language Modeling with Look-Ahead Memory

Arxiv

0+阅读 · 2022年4月15日

Transformers in Time Series: A Survey

Arxiv

34+阅读 · 2022年2月15日

Attention Mechanisms in Computer Vision: A Survey

Arxiv

58+阅读 · 2021年11月15日

A Survey of Transformers

Arxiv

103+阅读 · 2021年6月8日

SiT: Self-supervised vIsion Transformer

Arxiv

19+阅读 · 2021年4月8日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Less is More: ClipBERT for Video-and-Language Learning via Sparse Sampling

Arxiv

10+阅读 · 2021年2月11日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

Heterogeneous Graph Transformer

Heterogeneous Graph Transformer

Arxiv

27+阅读 · 2020年3月3日

VIP会员

相关主题

多头自注意力

自注意力机制

相关VIP内容

「深度学习视觉注意力」最新2022研究综述，概述50种软硬注意力机制方法

「深度学习视觉注意力」最新2022研究综述，概述50种软硬注意力机制方法

专知会员服务

112+阅读 · 2022年4月20日

中科院计算所最新「视觉Transformer」综述论文，带你全面了解最新CV分类、检测/分割方法

中科院计算所最新「视觉Transformer」综述论文，带你全面了解最新CV分类、检测/分割方法

专知会员服务

99+阅读 · 2021年11月16日

【Tutorial】计算机视觉中的Transformer，98页ppt

【Tutorial】计算机视觉中的Transformer，98页ppt

专知会员服务

151+阅读 · 2021年10月25日

卷积神经网络中的注意力机制综述

卷积神经网络中的注意力机制综述

专知会员服务

77+阅读 · 2021年10月22日

【ICCV 2021 】Vision Transformer中的相对位置编码

专知会员服务

30+阅读 · 2021年7月30日

复旦最新「Transformers全面综述」论文，40页pdf概述Transformers各种变体模型与应用

复旦最新「Transformers全面综述」论文，40页pdf概述Transformers各种变体模型与应用

专知会员服务

194+阅读 · 2021年6月10日

【ICLR2021】常识人工智能，77页ppt

【ICLR2021】常识人工智能，77页ppt

专知会员服务

78+阅读 · 2021年5月11日

ICLR2021 | 初探GNN的表示能力

专知会员服务

28+阅读 · 2021年5月2日

最新6篇ICLR2021篇图神经网络论文推荐

专知会员服务

57+阅读 · 2021年1月26日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知会员服务

107+阅读 · 2020年8月30日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

【CVPR2022】EDTER：基于Transformer的边缘检测

【CVPR2022】EDTER：基于Transformer的边缘检测

专知

2+阅读 · 2022年3月18日

【ICLR2022】分布外泛化的不确定性建模

【ICLR2022】分布外泛化的不确定性建模

专知

2+阅读 · 2022年2月11日

自然语言处理中的文本表示研究

自然语言处理中的文本表示研究

专知

0+阅读 · 2022年1月10日

【AAAI2022】基于分层随机注意的Transformer 不确定性估计

【AAAI2022】基于分层随机注意的Transformer 不确定性估计

专知

0+阅读 · 2021年12月29日

【NeurIPS 2021】流形上的注意力机制：规范等变的Transformer

【NeurIPS 2021】流形上的注意力机制：规范等变的Transformer

专知

3+阅读 · 2021年12月2日

【NeurIPS 2021】如何使用 Transformer 模型在图表示任务中胜过 GNN

【NeurIPS 2021】如何使用 Transformer 模型在图表示任务中胜过 GNN

专知

1+阅读 · 2021年11月21日

【Tutorial】计算机视觉中的Transformer，98页ppt

【Tutorial】计算机视觉中的Transformer，98页ppt

专知

21+阅读 · 2021年10月25日

【CVPR2021】基于Transformers 从序列到序列的角度重新思考语义分割

【CVPR2021】基于Transformers 从序列到序列的角度重新思考语义分割

专知

0+阅读 · 2021年3月15日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

深度学习可解释性研究进展

深度学习可解释性研究进展

专知

19+阅读 · 2020年6月26日

相关基金

结合前馈和反馈机制的自然场景文本识别技术

国家自然科学基金

0+阅读 · 2014年12月31日

奖赏学习对基本认知过程的调节机制

国家自然科学基金

4+阅读 · 2014年12月31日

基于嵌入性理论的中小企业开放式创新风险控制研究

国家自然科学基金

0+阅读 · 2014年12月31日

生物认知机制和特性启发的视觉计算模型与方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

生物启发设计中产品创意造型生成机制及其演化模型研究

国家自然科学基金

0+阅读 · 2013年12月31日

供应链网络知识转移与合作创新机制研究

国家自然科学基金

1+阅读 · 2012年12月31日

可信可控路由机制的研究

国家自然科学基金

0+阅读 · 2009年12月31日

动态自适应协同进化的学习机制研究

国家自然科学基金

0+阅读 · 2009年12月31日

作物生长模拟模型资源构建机制与集成模式

国家自然科学基金

1+阅读 · 2009年12月31日

台湾及邻区地幔底部的地震各向异性及其动力学启示

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Image Captioning In the Transformer Age

Arxiv

1+阅读 · 2022年4月15日

LaMemo: Language Modeling with Look-Ahead Memory

Arxiv

0+阅读 · 2022年4月15日

Transformers in Time Series: A Survey

Arxiv

34+阅读 · 2022年2月15日

Attention Mechanisms in Computer Vision: A Survey

Arxiv

58+阅读 · 2021年11月15日

A Survey of Transformers

Arxiv

103+阅读 · 2021年6月8日

SiT: Self-supervised vIsion Transformer

Arxiv

19+阅读 · 2021年4月8日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Less is More: ClipBERT for Video-and-Language Learning via Sparse Sampling

Arxiv

10+阅读 · 2021年2月11日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

Heterogeneous Graph Transformer

Heterogeneous Graph Transformer

Arxiv

27+阅读 · 2020年3月3日

大家都在搜

CMU博士论文

无人机集群

国防科技创新

软件无线电

无人机航拍交通事故现场勘查处置系统——行业第一的警用事故处理软件

微信扫码咨询专知VIP会员