【CVPR2021】坐标注意力的高效移动网络设计 - 专知

会员服务 ·

0

【CVPR2021】坐标注意力的高效移动网络设计

2021 年 3 月 9 日 专知

paper:

https://www.zhuanzhi.ai/paper/cc9fa0af60aee58e256bce07f15065a0

code: https://github.com/Andrew-Qibin/CoordAttention（待开源）

本文是新加坡国立大学Qinbin Hou&Jiashi Feng等人在注意力机制方面的一次探索，针对如何有效提升移动网络的卷积特征表达能力，以及通道注意力(如SE)机制能够有效建模通道间相关性但忽视了位置信息的问题，提出了一种的新颖的注意力机制：Coordinate Attention。

Coordinate Attention通过水平与垂直方向注意力图捕获特征的远程依赖关系，而且水平与垂直注意力还可以有效保持精确的位置信息。所提注意力集中的精确位置信息无论对于分类，还是检测与分割而言都是一种非常重要的性能，因而所提注意力机制在图像分类、目标检测以及语义分割方面均取得了显著的性能提升，尤其需要注意的是，所提注意力尤其适合于语义分割等稠密预测任务

移动网络设计的近期研究表明：通道注意力(如Squeeze-and-Excitation)机制对于提升模型性能极为有效，但是忽略了位置信息，这对于生成空间选择注意力图非常重要。

针对通道注意力机制存在的上述问题，我们提出了一种用于移动网络的新颖注意力机制：它将位置信息嵌入到通道注意力中，我们将其称之为Coordinate Attention。不同于通道注意力将特征张量通过GAP转换为特征向量，坐标注意力将通道注意力拆分为两个1D特征编码过程，分别沿着两个空间方向集成特征。

通过这种处理，远程相关性可以通过空间方向捕获，于此同时，精确的位置信息可以通过另一个空间方向得以保持。所得到的特征图分辨编码为成对的方向相关注意力图与通道注意力图(两者具有互补性)，并用于增强输入特征以增广目标的表达能力。

所提坐标注意力机制极为简单，可以灵活嵌入到现有移动网络(比如MobileNetV2, MobileN2Xt, EfficientNet)中，且几乎不会导致额外的计算负载。

我们通过实验证实：坐标注意力不仅有助于ImageNet分类，在下游任务(比如目标检测、语义分割)上表达更佳。下图给出了所提注意力与SE/CBAM在不同任务上的性能对比。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“CAMD” 就可以获取《【CVPR2021】坐标注意力的高效移动网络设计》专知下载链接

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

11

相关内容

坐标注意力

坐标注意力

（CVPR2021）基于结构保持的弱监督目标定位

专知会员服务

21+阅读 · 2021年5月1日

【CVPR2021】无监督时空表示学习的大规模研究

专知会员服务

23+阅读 · 2021年5月1日

【CVPR2021】通道注意力的高效移动网络设计

【CVPR2021】通道注意力的高效移动网络设计

专知会员服务

20+阅读 · 2021年4月27日

【CVPR2021】探索图像超分辨率中的稀疏性以实现高效推理

【CVPR2021】探索图像超分辨率中的稀疏性以实现高效推理

专知会员服务

28+阅读 · 2021年4月17日

【CVPR2021】端到端的全卷积目标检测器

专知会员服务

30+阅读 · 2021年4月5日

【CVPR2021】动态区域注意卷积

专知会员服务

21+阅读 · 2021年4月2日

【CVPR2021】动态度量学习

【CVPR2021】动态度量学习

专知会员服务

41+阅读 · 2021年3月30日

【CVPR2021】空间一致性表示学习

专知会员服务

63+阅读 · 2021年3月12日

【CVPR2021】自监督几何感知

【CVPR2021】自监督几何感知

专知会员服务

46+阅读 · 2021年3月6日

【CVPR2021】基于反事实推断的视觉问答框架

【CVPR2021】基于反事实推断的视觉问答框架

专知会员服务

27+阅读 · 2021年3月4日

【CVPR2021】半监督迁移学习的自适应一致性正则化

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知

41+阅读 · 2021年3月7日

【CVPR2021】基于反事实推断的视觉问答框架

【CVPR2021】基于反事实推断的视觉问答框架

专知

38+阅读 · 2021年3月4日

【AAAI2021】自监督对应学习的对比转换

【AAAI2021】自监督对应学习的对比转换

专知

12+阅读 · 2020年12月11日

【ECCV2020】EfficientFCN：语义分割中的整体引导解码器

【ECCV2020】EfficientFCN：语义分割中的整体引导解码器

专知

3+阅读 · 2020年8月23日

做目标检测，这6篇就够了：CVPR 2020目标检测论文盘点

做目标检测，这6篇就够了：CVPR 2020目标检测论文盘点

机器之心

23+阅读 · 2020年7月27日

【SIGIR2020】LightGCN: 简化和增强图卷积网络推荐

【SIGIR2020】LightGCN: 简化和增强图卷积网络推荐

专知

5+阅读 · 2020年6月1日

【WWW2020论文-香港中文大学】MAGNN:异构图嵌入的集合图神经网络

【WWW2020论文-香港中文大学】MAGNN:异构图嵌入的集合图神经网络

专知

33+阅读 · 2020年2月13日

图像超分辨率网络：RCAN

图像超分辨率网络：RCAN

极市平台

7+阅读 · 2019年8月18日

无需预训练分类器，清华&旷视提出专用于目标检测的骨干网络DetNet

无需预训练分类器，清华&旷视提出专用于目标检测的骨干网络DetNet

机器之心

8+阅读 · 2018年4月19日

深度 | 语义分割网络DeepLab-v3的架构设计思想和TensorFlow实现

深度 | 语义分割网络DeepLab-v3的架构设计思想和TensorFlow实现

机器之心

11+阅读 · 2018年3月26日

Learning Dynamic Routing for Semantic Segmentation

Learning Dynamic Routing for Semantic Segmentation

Arxiv

8+阅读 · 2020年3月23日

Investigating Meta-Learning Algorithms for Low-Resource Natural Language Understanding Tasks

Arxiv

5+阅读 · 2019年8月27日

Multi-Task Deep Neural Networks for Natural Language Understanding

Multi-Task Deep Neural Networks for Natural Language Understanding

Arxiv

3+阅读 · 2019年1月31日

Salience Biased Loss for Object Detection in Aerial Images

Arxiv

5+阅读 · 2018年10月18日

Dynamic Self-Attention : Computing Attention over Words Dynamically for Sentence Embedding

Dynamic Self-Attention : Computing Attention over Words Dynamically for Sentence Embedding

Arxiv

8+阅读 · 2018年8月22日

A 3D Coarse-to-Fine Framework for Volumetric Medical Image Segmentation

A 3D Coarse-to-Fine Framework for Volumetric Medical Image Segmentation

Arxiv

15+阅读 · 2018年8月2日

End-to-End Multi-Task Learning with Attention

Arxiv

19+阅读 · 2018年3月28日

Leveraging Unlabeled Data for Crowd Counting by Learning to Rank

Arxiv

6+阅读 · 2018年3月8日

An Iterative Spanning Forest Framework for Superpixel Segmentation

Arxiv

9+阅读 · 2018年1月30日

Integrating semi-supervised label propagation and random forests for multi-atlas based hippocampus segmentation

Arxiv

3+阅读 · 2017年12月31日

VIP会员

相关主题

坐标注意力

高效移动网络

通道注意力

注意力机制

相关VIP内容

（CVPR2021）基于结构保持的弱监督目标定位

专知会员服务

21+阅读 · 2021年5月1日

【CVPR2021】无监督时空表示学习的大规模研究

专知会员服务

23+阅读 · 2021年5月1日

【CVPR2021】通道注意力的高效移动网络设计

【CVPR2021】通道注意力的高效移动网络设计

专知会员服务

20+阅读 · 2021年4月27日

【CVPR2021】探索图像超分辨率中的稀疏性以实现高效推理

【CVPR2021】探索图像超分辨率中的稀疏性以实现高效推理

专知会员服务

28+阅读 · 2021年4月17日

【CVPR2021】端到端的全卷积目标检测器

专知会员服务

30+阅读 · 2021年4月5日

【CVPR2021】动态区域注意卷积

专知会员服务

21+阅读 · 2021年4月2日

【CVPR2021】动态度量学习

【CVPR2021】动态度量学习

专知会员服务

41+阅读 · 2021年3月30日

【CVPR2021】空间一致性表示学习

专知会员服务

63+阅读 · 2021年3月12日

【CVPR2021】自监督几何感知

【CVPR2021】自监督几何感知

专知会员服务

46+阅读 · 2021年3月6日

【CVPR2021】基于反事实推断的视觉问答框架

【CVPR2021】基于反事实推断的视觉问答框架

专知会员服务

27+阅读 · 2021年3月4日

热门VIP内容

开通专知VIP会员享更多权益服务

《俄乌战争背景下俄罗斯的战略性海军分析（2022-2025年）》最新100页报告

【斯坦福博士论文】数据、决策与依赖：构建可信人工智能的挑战

人工智能时代背景下的未来海战

接触战中的无人机优势：美军旅级部队面临的小型无人机系统挑战与调整

相关资讯

【CVPR2021】半监督迁移学习的自适应一致性正则化

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知

41+阅读 · 2021年3月7日

【CVPR2021】基于反事实推断的视觉问答框架

【CVPR2021】基于反事实推断的视觉问答框架

专知

38+阅读 · 2021年3月4日

【AAAI2021】自监督对应学习的对比转换

【AAAI2021】自监督对应学习的对比转换

专知

12+阅读 · 2020年12月11日

【ECCV2020】EfficientFCN：语义分割中的整体引导解码器

【ECCV2020】EfficientFCN：语义分割中的整体引导解码器

专知

3+阅读 · 2020年8月23日

做目标检测，这6篇就够了：CVPR 2020目标检测论文盘点

做目标检测，这6篇就够了：CVPR 2020目标检测论文盘点

机器之心

23+阅读 · 2020年7月27日

【SIGIR2020】LightGCN: 简化和增强图卷积网络推荐

【SIGIR2020】LightGCN: 简化和增强图卷积网络推荐

专知

5+阅读 · 2020年6月1日

【WWW2020论文-香港中文大学】MAGNN:异构图嵌入的集合图神经网络

【WWW2020论文-香港中文大学】MAGNN:异构图嵌入的集合图神经网络

专知

33+阅读 · 2020年2月13日

图像超分辨率网络：RCAN

图像超分辨率网络：RCAN

极市平台

7+阅读 · 2019年8月18日

无需预训练分类器，清华&旷视提出专用于目标检测的骨干网络DetNet

无需预训练分类器，清华&旷视提出专用于目标检测的骨干网络DetNet

机器之心

8+阅读 · 2018年4月19日

深度 | 语义分割网络DeepLab-v3的架构设计思想和TensorFlow实现

深度 | 语义分割网络DeepLab-v3的架构设计思想和TensorFlow实现

机器之心

11+阅读 · 2018年3月26日

相关论文

Learning Dynamic Routing for Semantic Segmentation

Learning Dynamic Routing for Semantic Segmentation

Arxiv

8+阅读 · 2020年3月23日

Investigating Meta-Learning Algorithms for Low-Resource Natural Language Understanding Tasks

Arxiv

5+阅读 · 2019年8月27日

Multi-Task Deep Neural Networks for Natural Language Understanding

Multi-Task Deep Neural Networks for Natural Language Understanding

Arxiv

3+阅读 · 2019年1月31日

Salience Biased Loss for Object Detection in Aerial Images

Arxiv

5+阅读 · 2018年10月18日

Dynamic Self-Attention : Computing Attention over Words Dynamically for Sentence Embedding

Dynamic Self-Attention : Computing Attention over Words Dynamically for Sentence Embedding

Arxiv

8+阅读 · 2018年8月22日

A 3D Coarse-to-Fine Framework for Volumetric Medical Image Segmentation

A 3D Coarse-to-Fine Framework for Volumetric Medical Image Segmentation

Arxiv

15+阅读 · 2018年8月2日

End-to-End Multi-Task Learning with Attention

Arxiv

19+阅读 · 2018年3月28日

Leveraging Unlabeled Data for Crowd Counting by Learning to Rank

Arxiv

6+阅读 · 2018年3月8日

An Iterative Spanning Forest Framework for Superpixel Segmentation

Arxiv

9+阅读 · 2018年1月30日

Integrating semi-supervised label propagation and random forests for multi-atlas based hippocampus segmentation

Arxiv

3+阅读 · 2017年12月31日

大家都在搜

大型语言模型

朱克爱德华兹家族

蓝牙安全攻防

冷启动，0预算，如何借助分销裂变引爆私域用户增长？

微信扫码咨询专知VIP会员