【CVPR2023】BiFormer:基于双层路由注意力的视觉Transformer - 专知VIP

会员服务 ·

17

CVPR 2023 · BiFormer · Transformer · 计算机视觉 · 注意力机制 ·

2023 年 3 月 20 日

【CVPR2023】BiFormer:基于双层路由注意力的视觉Transformer

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

作为视觉transformer的核心构建模块，注意力是捕捉长程依赖关系的强大工具。然而，这种能力是有代价的:它会带来巨大的计算负担和内存占用，因为要计算所有空间位置上的成对token交互。一系列工作试图通过将手工制作的和内容无关的稀疏性引入注意力来缓解这个问题，例如将注意力操作限制在局部窗口、轴向条纹或膨胀窗口内。与这些方法相比，本文提出了一种新的通过双层路由的动态稀疏注意力，以实现具有内容感知的更灵活的计算分配。具体来说，对于一个查询，首先在粗粒度的区域级别上过滤掉不相关的键值对，然后在剩余的候选区域(即路由区域)中应用细粒度的token-to-token attention。本文提供了所提出的双层路由注意力的一个简单而有效的实现，利用稀疏性来节省计算和内存，同时只涉及GPU友好的密集矩阵乘法。用所提出的双层路由注意力建立了一个新的通用视觉transformer，称为BiFormer。由于BiFormer以查询自适应的方式关注一小部分相关标记，而不会分散其他不相关标记的注意力，因此它具有良好的性能和较高的计算效率，特别是在密集预测任务中。在图像分类、目标检测和语义分割等计算机视觉任务中的经验结果验证了所设计的有效性。代码可以在https://github.com/rayleizhu/BiFormer上找到。

成为VIP会员查看完整内容

35

相关内容

CVPR 2023

CVPR 2023大会将于 6 月 18 日至 22 日在温哥华会议中心举行。CVPR是IEEE Conference on Computer Vision and Pattern Recognition的缩写，即IEEE国际计算机视觉与模式识别会议。该会议是由IEEE举办的计算机视觉和模式识别领域的顶级会议，会议的主要内容是计算机视觉与模式识别技术。 CVPR 2023 共收到 9155 份提交，比去年增加了 12%，创下新纪录，今年接收了 2360 篇论文，接收率为 25.78%。作为对比，去年有 8100 多篇有效投稿，大会接收了 2067 篇，接收率为 25%。

【NeurIPS2022】不用微调的加速大规模视觉Transformer的密集预测

【NeurIPS2022】不用微调的加速大规模视觉Transformer的密集预测

专知会员服务

14+阅读 · 2022年10月5日

【ECCV2022】对比视觉Transformer的在线持续学习

【ECCV2022】对比视觉Transformer的在线持续学习

专知会员服务

23+阅读 · 2022年7月29日

【ICML2022】基于自适应上下文池化的高效表示学习

【ICML2022】基于自适应上下文池化的高效表示学习

专知会员服务

20+阅读 · 2022年7月9日

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

专知会员服务

36+阅读 · 2022年4月2日

【AAAI2022】基于双流更新的视觉Transformer动态加速方法

【AAAI2022】基于双流更新的视觉Transformer动态加速方法

专知会员服务

24+阅读 · 2021年12月11日

NeurIPS 2021 | 又一超强视觉Transformer主干！HRFormer：学习高分辨率表征

NeurIPS 2021 | 又一超强视觉Transformer主干！HRFormer：学习高分辨率表征

专知会员服务

18+阅读 · 2021年12月8日

【CVPR2021】通道注意力的高效移动网络设计

【CVPR2021】通道注意力的高效移动网络设计

专知会员服务

20+阅读 · 2021年4月27日

SiT: 自监督视觉Transformer

专知会员服务

65+阅读 · 2021年4月11日

【CVPR2021】坐标注意力的高效移动网络设计

专知会员服务

23+阅读 · 2021年3月9日

【CVPR2020-哈工大-京东】自监督结构建模的目标识别，Self-supervised Structure Modeling

【CVPR2020-哈工大-京东】自监督结构建模的目标识别，Self-supervised Structure Modeling

专知会员服务

43+阅读 · 2020年4月1日

CVPR 2023 | 正则化方法DropKey: 两行代码高效缓解视觉Transformer过拟合

CVPR 2023 | 正则化方法DropKey: 两行代码高效缓解视觉Transformer过拟合

PaperWeekly

0+阅读 · 2023年4月11日

CVPR 2023｜两行代码高效缓解视觉Transformer过拟合，美图&国科大联合提出正则化方法DropKey

CVPR 2023｜两行代码高效缓解视觉Transformer过拟合，美图&国科大联合提出正则化方法DropKey

机器之心

0+阅读 · 2023年4月10日

ECCV2022｜一个Trick 搞定 CNN与Transformer，即插即涨点即提速！

ECCV2022｜一个Trick 搞定 CNN与Transformer，即插即涨点即提速！

极市平台

0+阅读 · 2022年10月19日

【NeurIPS2022】不用微调的加速大规模视觉Transformer的密集预测

【NeurIPS2022】不用微调的加速大规模视觉Transformer的密集预测

专知

0+阅读 · 2022年10月5日

ECCV 2022 | 在视觉Transformer上进行递归，不增参数，计算量还少

ECCV 2022 | 在视觉Transformer上进行递归，不增参数，计算量还少

机器之心

0+阅读 · 2022年7月28日

【ICML2022】基于自适应上下文池化的高效表示学习

【ICML2022】基于自适应上下文池化的高效表示学习

专知

0+阅读 · 2022年7月9日

新注意力机制！LITv2：具有HiLo注意力的快速视觉Transformer

新注意力机制！LITv2：具有HiLo注意力的快速视觉Transformer

CVer

0+阅读 · 2022年6月2日

CVPR 2022 | 清华开源DAT：具有可变形注意力的视觉Transformer

CVPR 2022 | 清华开源DAT：具有可变形注意力的视觉Transformer

CVer

1+阅读 · 2022年5月24日

（CVPR2021）基于结构保持的弱监督目标定位

（CVPR2021）基于结构保持的弱监督目标定位

专知

18+阅读 · 2021年5月1日

近期必读的5篇顶会CVPR 2021【视频理解】相关论文和代码

近期必读的5篇顶会CVPR 2021【视频理解】相关论文和代码

专知

11+阅读 · 2021年3月31日

基于矩阵分解的图像表示方法及其应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

判别式表观建模方法

国家自然科学基金

1+阅读 · 2014年12月31日

基于快速视觉注意模型和深度学习的视觉跟踪

国家自然科学基金

8+阅读 · 2013年12月31日

基于有监督学习的自然图像中骨架提取和物体识别研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于两级颜色通道的图像高保真分色研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于深度学习的层次化视觉注意模型研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于社会标签的图像标注与标签推荐

国家自然科学基金

0+阅读 · 2012年12月31日

基于协作机制的无线多媒体网络效用提升方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

语义知识驱动的网络上下文广告投放高效方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于二维随机映射和一范数优化的有监督图像分类研究

国家自然科学基金

3+阅读 · 2011年12月31日

Arxiv

0+阅读 · 2023年5月8日

Vision Transformer Off-the-Shelf: A Surprising Baseline for Few-Shot Class-Agnostic Counting

Arxiv

0+阅读 · 2023年5月8日

On High-dimensional and Low-rank Tensor Bandits

Arxiv

0+阅读 · 2023年5月6日

HSCNet++: Hierarchical Scene Coordinate Classification and Regression for Visual Localization with Transformer

Arxiv

0+阅读 · 2023年5月5日

Deep Learning for Weakly-Supervised Object Detection and Object Localization: A Survey

Deep Learning for Weakly-Supervised Object Detection and Object Localization: A Survey

Arxiv

16+阅读 · 2021年5月26日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Deep Learning on Image Denoising: An overview

Arxiv

13+阅读 · 2020年8月3日

CURL: Contrastive Unsupervised Representations for Reinforcement Learning

Arxiv

17+阅读 · 2020年4月28日

Self-Attention Graph Pooling

Self-Attention Graph Pooling

Arxiv

13+阅读 · 2019年6月13日

Weakly Supervised One-Shot Detection with Attention Siamese Networks

Arxiv

14+阅读 · 2018年1月12日

VIP会员

相关主题

计算机视觉

注意力机制

相关VIP内容

【NeurIPS2022】不用微调的加速大规模视觉Transformer的密集预测

【NeurIPS2022】不用微调的加速大规模视觉Transformer的密集预测

专知会员服务

14+阅读 · 2022年10月5日

【ECCV2022】对比视觉Transformer的在线持续学习

【ECCV2022】对比视觉Transformer的在线持续学习

专知会员服务

23+阅读 · 2022年7月29日

【ICML2022】基于自适应上下文池化的高效表示学习

【ICML2022】基于自适应上下文池化的高效表示学习

专知会员服务

20+阅读 · 2022年7月9日

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

专知会员服务

36+阅读 · 2022年4月2日

【AAAI2022】基于双流更新的视觉Transformer动态加速方法

【AAAI2022】基于双流更新的视觉Transformer动态加速方法

专知会员服务

24+阅读 · 2021年12月11日

NeurIPS 2021 | 又一超强视觉Transformer主干！HRFormer：学习高分辨率表征

NeurIPS 2021 | 又一超强视觉Transformer主干！HRFormer：学习高分辨率表征

专知会员服务

18+阅读 · 2021年12月8日

【CVPR2021】通道注意力的高效移动网络设计

【CVPR2021】通道注意力的高效移动网络设计

专知会员服务

20+阅读 · 2021年4月27日

SiT: 自监督视觉Transformer

专知会员服务

65+阅读 · 2021年4月11日

【CVPR2021】坐标注意力的高效移动网络设计

专知会员服务

23+阅读 · 2021年3月9日

【CVPR2020-哈工大-京东】自监督结构建模的目标识别，Self-supervised Structure Modeling

【CVPR2020-哈工大-京东】自监督结构建模的目标识别，Self-supervised Structure Modeling

专知会员服务

43+阅读 · 2020年4月1日

热门VIP内容

开通专知VIP会员享更多权益服务

《美国海军陆战队软件定义网络应用案例：分布式防火墙自动化系统》148页

《多体环境下定位导航授时（PNT）系统研究》228页

软件定义无线电（SDR）：商业与军事领域的技术、应用及未来趋势

《攻势防空作战中无人追击者/规避者最优轨迹研究（含动态交战区建模）》95页

相关资讯

CVPR 2023 | 正则化方法DropKey: 两行代码高效缓解视觉Transformer过拟合

CVPR 2023 | 正则化方法DropKey: 两行代码高效缓解视觉Transformer过拟合

PaperWeekly

0+阅读 · 2023年4月11日

CVPR 2023｜两行代码高效缓解视觉Transformer过拟合，美图&国科大联合提出正则化方法DropKey

CVPR 2023｜两行代码高效缓解视觉Transformer过拟合，美图&国科大联合提出正则化方法DropKey

机器之心

0+阅读 · 2023年4月10日

ECCV2022｜一个Trick 搞定 CNN与Transformer，即插即涨点即提速！

ECCV2022｜一个Trick 搞定 CNN与Transformer，即插即涨点即提速！

极市平台

0+阅读 · 2022年10月19日

【NeurIPS2022】不用微调的加速大规模视觉Transformer的密集预测

【NeurIPS2022】不用微调的加速大规模视觉Transformer的密集预测

专知

0+阅读 · 2022年10月5日

ECCV 2022 | 在视觉Transformer上进行递归，不增参数，计算量还少

ECCV 2022 | 在视觉Transformer上进行递归，不增参数，计算量还少

机器之心

0+阅读 · 2022年7月28日

【ICML2022】基于自适应上下文池化的高效表示学习

【ICML2022】基于自适应上下文池化的高效表示学习

专知

0+阅读 · 2022年7月9日

新注意力机制！LITv2：具有HiLo注意力的快速视觉Transformer

新注意力机制！LITv2：具有HiLo注意力的快速视觉Transformer

CVer

0+阅读 · 2022年6月2日

CVPR 2022 | 清华开源DAT：具有可变形注意力的视觉Transformer

CVPR 2022 | 清华开源DAT：具有可变形注意力的视觉Transformer

CVer

1+阅读 · 2022年5月24日

（CVPR2021）基于结构保持的弱监督目标定位

（CVPR2021）基于结构保持的弱监督目标定位

专知

18+阅读 · 2021年5月1日

近期必读的5篇顶会CVPR 2021【视频理解】相关论文和代码

近期必读的5篇顶会CVPR 2021【视频理解】相关论文和代码

专知

11+阅读 · 2021年3月31日

相关基金

基于矩阵分解的图像表示方法及其应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

判别式表观建模方法

国家自然科学基金

1+阅读 · 2014年12月31日

基于快速视觉注意模型和深度学习的视觉跟踪

国家自然科学基金

8+阅读 · 2013年12月31日

基于有监督学习的自然图像中骨架提取和物体识别研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于两级颜色通道的图像高保真分色研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于深度学习的层次化视觉注意模型研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于社会标签的图像标注与标签推荐

国家自然科学基金

0+阅读 · 2012年12月31日

基于协作机制的无线多媒体网络效用提升方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

语义知识驱动的网络上下文广告投放高效方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于二维随机映射和一范数优化的有监督图像分类研究

国家自然科学基金

3+阅读 · 2011年12月31日

相关论文

Arxiv

0+阅读 · 2023年5月8日

Vision Transformer Off-the-Shelf: A Surprising Baseline for Few-Shot Class-Agnostic Counting

Arxiv

0+阅读 · 2023年5月8日

On High-dimensional and Low-rank Tensor Bandits

Arxiv

0+阅读 · 2023年5月6日

HSCNet++: Hierarchical Scene Coordinate Classification and Regression for Visual Localization with Transformer

Arxiv

0+阅读 · 2023年5月5日

Deep Learning for Weakly-Supervised Object Detection and Object Localization: A Survey

Deep Learning for Weakly-Supervised Object Detection and Object Localization: A Survey

Arxiv

16+阅读 · 2021年5月26日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Deep Learning on Image Denoising: An overview

Arxiv

13+阅读 · 2020年8月3日

CURL: Contrastive Unsupervised Representations for Reinforcement Learning

Arxiv

17+阅读 · 2020年4月28日

Self-Attention Graph Pooling

Self-Attention Graph Pooling

Arxiv

13+阅读 · 2019年6月13日

Weakly Supervised One-Shot Detection with Attention Siamese Networks

Arxiv

14+阅读 · 2018年1月12日

微信扫码咨询专知VIP会员