清华大学提出ACmix | 这才是Self-Attention与CNN正确的融合范式，性能速度全面提升 - 专知VIP

会员服务 ·

5

自注意力机制 · 卷积神经网络 · 论文 ·

2021 年 12 月 3 日

清华大学提出ACmix | 这才是Self-Attention与CNN正确的融合范式，性能速度全面提升

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

近年来，卷积和Self-Attention在计算机视觉领域得到了长足的发展。卷积神经网络广泛应用于图像识别、语义分割和目标检测，并在各种基准上实现了最先进的性能。最近，随着Vision Transformer的出现，基于Self-Attention的模块在许多视觉任务上取得了与CNN对应模块相当甚至更好的表现。

尽管这两种方法都取得了巨大的成功，但卷积和Self-Attention模块通常遵循不同的设计范式。传统卷积根据卷积的权值在局部感受野上利用一个聚合函数，这些权值在整个特征图中共享。固有的特征为图像处理带来了至关重要的归纳偏差。

相比之下，Self-Attention模块采用基于输入特征上下文的加权平均操作，通过相关像素对之间的相似函数动态计算注意力权重。这种灵活性使注意力模块能够适应地关注不同的区域，并捕捉更多的特征。

考虑到卷积和Self-Attention的不同和互补性质，通过集成这些模块，存在从两种范式中受益的潜在可能性。先前的工作从几个不同的角度探讨了Self-Attention和卷积的结合。

早期的研究，如SENet、CBAM，表明Self-Attention可以作为卷积模块的增强。最近，Self-Attention被提出作为独立的块来替代CNN模型中的传统卷积，如SAN、BoTNet。

另一种研究侧重于将Self-Attention和卷积结合在单个Block中，如 AA-ResNet、Container，而该体系结构限于为每个模块设计独立的路径。因此，现有的方法仍然将Self-Attention和卷积作为不同的部分，并没有充分利用它们之间的内在关系。

在这篇论文中，作者试图揭示Self-Attention和卷积之间更为密切的关系。通过分解这两个模块的操作表明它们在很大程度上依赖于相同的卷积操作。作者基于这一观察结果开发了一个混合模型，名为ACmix，并以最小的计算开销优雅地集成了Self-Attention和卷积。

具体地说：

首先，通过使用1*1卷积对输入特征进行映射，获得丰富的中间特征集；
然后，按照不同的模式(分别以Self-Attention方式和卷积方式)重用和聚合中间特征。通过这种方式，ACmix既享受了两个模块的优点，又有效地避免了两次昂贵的投影操作。

成为VIP会员查看完整内容

27

相关内容

自注意力机制

自注意力机制

【AAAI2022】基于对比学习的预训练语言模型剪枝压缩

【AAAI2022】基于对比学习的预训练语言模型剪枝压缩

专知会员服务

29+阅读 · 2022年1月24日

【AAAI2022】基于双流更新的视觉Transformer动态加速方法

【AAAI2022】基于双流更新的视觉Transformer动态加速方法

专知会员服务

24+阅读 · 2021年12月11日

基于大型预训练语言模型的自然语言处理研究进展综述

基于大型预训练语言模型的自然语言处理研究进展综述

专知会员服务

96+阅读 · 2021年11月4日

CNN/MLP/Transformer, 究竟谁行？中科大&微软实证三大网络结构公平比较，各有可取之处

专知会员服务

34+阅读 · 2021年9月18日

基于粗粒度数据流架构的稀疏卷积神经网络加速

专知会员服务

23+阅读 · 2021年7月15日

【CVPR2021】双图层实例分割，大幅提升遮挡处理性能

专知会员服务

18+阅读 · 2021年5月23日

【AAAI2021】时空融合图神经网络的交通流预测

专知会员服务

110+阅读 · 2020年12月22日

【CVPR2020】通过获取高质量的关键点对来提升目标检测性能

【CVPR2020】通过获取高质量的关键点对来提升目标检测性能

专知会员服务

44+阅读 · 2020年6月30日

【CVPR2020-港中文】图像识别中的自注意力探索

【CVPR2020-港中文】图像识别中的自注意力探索

专知会员服务

56+阅读 · 2020年4月29日

深度神经网络模型压缩与加速综述

深度神经网络模型压缩与加速综述

专知会员服务

129+阅读 · 2019年10月12日

CNN网络结构的发展（最全整理）

CNN网络结构的发展（最全整理）

极市平台

73+阅读 · 2019年11月2日

性能大幅度提升（速度&遮挡） | 基于区域分解&集成的目标检测

性能大幅度提升（速度&遮挡） | 基于区域分解&集成的目标检测

计算机视觉战队

4+阅读 · 2019年9月16日

用自注意力增强卷积：这是新老两代神经网络的对话（附实现）

用自注意力增强卷积：这是新老两代神经网络的对话（附实现）

机器之心

18+阅读 · 2019年4月26日

新卷积运算 | 倍频程卷积降低CNNs的空间冗余（文末提供源码）

新卷积运算 | 倍频程卷积降低CNNs的空间冗余（文末提供源码）

计算机视觉战队

15+阅读 · 2019年4月25日

比CNN表现更好，CV领域全新卷积操作OctConv厉害在哪里？

比CNN表现更好，CV领域全新卷积操作OctConv厉害在哪里？

大数据文摘

13+阅读 · 2019年4月23日

【学界】完美代替传统卷积！Facebook等提出全新卷积操作OctConv，速度接近理论极限

【学界】完美代替传统卷积！Facebook等提出全新卷积操作OctConv，速度接近理论极限

GAN生成式对抗网络

14+阅读 · 2019年4月18日

微软亚研：对深度神经网络中空间注意力机制的经验性研究

微软亚研：对深度神经网络中空间注意力机制的经验性研究

机器之心

6+阅读 · 2019年4月15日

ResNet架构可逆！多大等提出性能优越的可逆残差网络

ResNet架构可逆！多大等提出性能优越的可逆残差网络

机器之心

5+阅读 · 2019年2月3日

94页论文综述卷积神经网络：从基础技术到研究前景

94页论文综述卷积神经网络：从基础技术到研究前景

机器之心

60+阅读 · 2018年4月7日

三种减少卷积神经网络复杂度同时不降低性能的新方法

三种减少卷积神经网络复杂度同时不降低性能的新方法

统计学习与视觉计算组

3+阅读 · 2017年5月26日

Survey: Transformer based Video-Language Pre-training

Arxiv

20+阅读 · 2021年9月21日

$FM^2$: Field-matrixed Factorization Machines for Recommender Systems

Arxiv

16+阅读 · 2021年2月20日

Convolutional Self-Attention Network

Arxiv

6+阅读 · 2019年4月8日

Convolutional Collaborative Filter Network for Video Based Recommendation Systems

Arxiv

5+阅读 · 2018年10月18日

Next Item Recommendation with Self-Attention

Next Item Recommendation with Self-Attention

Arxiv

5+阅读 · 2018年8月25日

Interpretable Active Learning

Interpretable Active Learning

Arxiv

3+阅读 · 2018年6月24日

MARS: Memory Attention-Aware Recommender System

Arxiv

6+阅读 · 2018年5月18日

Attention-based Group Recommendation

Arxiv

14+阅读 · 2018年4月18日

Fine-Grained Attention Mechanism for Neural Machine Translation

Arxiv

4+阅读 · 2018年4月3日

Distance-based Self-Attention Network for Natural Language Inference

Arxiv

10+阅读 · 2017年12月6日

VIP会员

相关主题

自注意力机制

卷积神经网络

相关VIP内容

【AAAI2022】基于对比学习的预训练语言模型剪枝压缩

【AAAI2022】基于对比学习的预训练语言模型剪枝压缩

专知会员服务

29+阅读 · 2022年1月24日

【AAAI2022】基于双流更新的视觉Transformer动态加速方法

【AAAI2022】基于双流更新的视觉Transformer动态加速方法

专知会员服务

24+阅读 · 2021年12月11日

基于大型预训练语言模型的自然语言处理研究进展综述

基于大型预训练语言模型的自然语言处理研究进展综述

专知会员服务

96+阅读 · 2021年11月4日

CNN/MLP/Transformer, 究竟谁行？中科大&微软实证三大网络结构公平比较，各有可取之处

专知会员服务

34+阅读 · 2021年9月18日

基于粗粒度数据流架构的稀疏卷积神经网络加速

专知会员服务

23+阅读 · 2021年7月15日

【CVPR2021】双图层实例分割，大幅提升遮挡处理性能

专知会员服务

18+阅读 · 2021年5月23日

【AAAI2021】时空融合图神经网络的交通流预测

专知会员服务

110+阅读 · 2020年12月22日

【CVPR2020】通过获取高质量的关键点对来提升目标检测性能

【CVPR2020】通过获取高质量的关键点对来提升目标检测性能

专知会员服务

44+阅读 · 2020年6月30日

【CVPR2020-港中文】图像识别中的自注意力探索

【CVPR2020-港中文】图像识别中的自注意力探索

专知会员服务

56+阅读 · 2020年4月29日

深度神经网络模型压缩与加速综述

深度神经网络模型压缩与加速综述

专知会员服务

129+阅读 · 2019年10月12日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

CNN网络结构的发展（最全整理）

CNN网络结构的发展（最全整理）

极市平台

73+阅读 · 2019年11月2日

性能大幅度提升（速度&遮挡） | 基于区域分解&集成的目标检测

性能大幅度提升（速度&遮挡） | 基于区域分解&集成的目标检测

计算机视觉战队

4+阅读 · 2019年9月16日

用自注意力增强卷积：这是新老两代神经网络的对话（附实现）

用自注意力增强卷积：这是新老两代神经网络的对话（附实现）

机器之心

18+阅读 · 2019年4月26日

新卷积运算 | 倍频程卷积降低CNNs的空间冗余（文末提供源码）

新卷积运算 | 倍频程卷积降低CNNs的空间冗余（文末提供源码）

计算机视觉战队

15+阅读 · 2019年4月25日

比CNN表现更好，CV领域全新卷积操作OctConv厉害在哪里？

比CNN表现更好，CV领域全新卷积操作OctConv厉害在哪里？

大数据文摘

13+阅读 · 2019年4月23日

【学界】完美代替传统卷积！Facebook等提出全新卷积操作OctConv，速度接近理论极限

【学界】完美代替传统卷积！Facebook等提出全新卷积操作OctConv，速度接近理论极限

GAN生成式对抗网络

14+阅读 · 2019年4月18日

微软亚研：对深度神经网络中空间注意力机制的经验性研究

微软亚研：对深度神经网络中空间注意力机制的经验性研究

机器之心

6+阅读 · 2019年4月15日

ResNet架构可逆！多大等提出性能优越的可逆残差网络

ResNet架构可逆！多大等提出性能优越的可逆残差网络

机器之心

5+阅读 · 2019年2月3日

94页论文综述卷积神经网络：从基础技术到研究前景

94页论文综述卷积神经网络：从基础技术到研究前景

机器之心

60+阅读 · 2018年4月7日

三种减少卷积神经网络复杂度同时不降低性能的新方法

三种减少卷积神经网络复杂度同时不降低性能的新方法

统计学习与视觉计算组

3+阅读 · 2017年5月26日

相关论文

Survey: Transformer based Video-Language Pre-training

Arxiv

20+阅读 · 2021年9月21日

$FM^2$: Field-matrixed Factorization Machines for Recommender Systems

Arxiv

16+阅读 · 2021年2月20日

Convolutional Self-Attention Network

Arxiv

6+阅读 · 2019年4月8日

Convolutional Collaborative Filter Network for Video Based Recommendation Systems

Arxiv

5+阅读 · 2018年10月18日

Next Item Recommendation with Self-Attention

Next Item Recommendation with Self-Attention

Arxiv

5+阅读 · 2018年8月25日

Interpretable Active Learning

Interpretable Active Learning

Arxiv

3+阅读 · 2018年6月24日

MARS: Memory Attention-Aware Recommender System

Arxiv

6+阅读 · 2018年5月18日

Attention-based Group Recommendation

Arxiv

14+阅读 · 2018年4月18日

Fine-Grained Attention Mechanism for Neural Machine Translation

Arxiv

4+阅读 · 2018年4月3日

Distance-based Self-Attention Network for Natural Language Inference

Arxiv

10+阅读 · 2017年12月6日

微信扫码咨询专知VIP会员