【CVPR2021】基于Transformers 从序列到序列的角度重新思考语义分割 - 专知VIP

会员服务 ·

5

Transformer · 语义分割 ·

2021 年 3 月 15 日

【CVPR2021】基于Transformers 从序列到序列的角度重新思考语义分割

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

基于Transformers 从序列到序列的角度重新思考语义分割

Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspective with Transformers

我们希望为语义分割方法提供另一种思路，将语义分割转变为序列到序列的预测任务。在本文中，我们使用transformer（不使用卷积和降低分辨率）将图像编码为一系列patch序列。transformer的每一层都进行了全局的上下文建模，结合常规的Decoder模块，我们得到了一个强大的语义分割模型，称之为Segmentation transformer（SETR）。大量实验表明，SETR在ADE20K（50.28％mIoU），Pascal Context（55.83％mIoU）上达到SOTA，并在Cityscapes上取得了较好结果。

成为VIP会员查看完整内容

44

相关内容

Transformer

Transformer是谷歌发表的论文《Attention Is All You Need》提出一种完全基于Attention的翻译架构

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【CVPR2021】重新思考BiSeNet让语义分割模型速度起飞

【CVPR2021】重新思考BiSeNet让语义分割模型速度起飞

专知会员服务

34+阅读 · 2021年5月5日

（CVPR2021）基于结构保持的弱监督目标定位

专知会员服务

21+阅读 · 2021年5月1日

【CVPR2021】通道注意力的高效移动网络设计

【CVPR2021】通道注意力的高效移动网络设计

专知会员服务

20+阅读 · 2021年4月27日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知会员服务

38+阅读 · 2021年4月16日

【CVPR2021】端到端的全卷积目标检测器

专知会员服务

30+阅读 · 2021年4月5日

【CVPR2021】用随机标签的神经架构搜索

专知会员服务

12+阅读 · 2021年3月21日

【CVPR2021】坐标注意力的高效移动网络设计

专知会员服务

23+阅读 · 2021年3月9日

【CVPR2021】自监督几何感知

【CVPR2021】自监督几何感知

专知会员服务

46+阅读 · 2021年3月6日

【CVPR2021】用Transformers无监督预训练进行目标检测

【CVPR2021】用Transformers无监督预训练进行目标检测

专知会员服务

58+阅读 · 2021年3月3日

【ECCV2020】EfficientFCN：语义分割中的整体引导解码器

【ECCV2020】EfficientFCN：语义分割中的整体引导解码器

专知会员服务

18+阅读 · 2020年8月23日

【ECCV2020】EfficientFCN：语义分割中的整体引导解码器

【ECCV2020】EfficientFCN：语义分割中的整体引导解码器

专知

3+阅读 · 2020年8月23日

【ACMMM2020-北航】KBGN:用于视觉对话中自适应视觉-文本推理的知识桥图网络

【ACMMM2020-北航】KBGN:用于视觉对话中自适应视觉-文本推理的知识桥图网络

专知

10+阅读 · 2020年8月12日

AAAI 2020 | 快手：重新审视图像美学评估 & 寻找精彩片段聚焦点

AAAI 2020 | 快手：重新审视图像美学评估 & 寻找精彩片段聚焦点

AI科技评论

6+阅读 · 2020年1月17日

【泡泡图灵智库】点云序列的语义分割数据集

【泡泡图灵智库】点云序列的语义分割数据集

泡泡机器人SLAM

9+阅读 · 2019年9月20日

深入探究深度卷积语义分割网络和 Deeplab_V3

深入探究深度卷积语义分割网络和 Deeplab_V3

AI研习社

6+阅读 · 2019年4月13日

【泡泡一分钟】RNFNet: 用于室内语义分割的RGB-D多层级残差特征融合（ICCV2017-523）

【泡泡一分钟】RNFNet: 用于室内语义分割的RGB-D多层级残差特征融合（ICCV2017-523）

泡泡机器人SLAM

10+阅读 · 2018年12月21日

【泡泡一分钟】预测未来更深层次的语义分割 (ICCV2017-63)

【泡泡一分钟】预测未来更深层次的语义分割 (ICCV2017-63)

泡泡机器人SLAM

5+阅读 · 2018年8月4日

【泡泡图灵智库】用于单目深度估计的深度有序回归网络

【泡泡图灵智库】用于单目深度估计的深度有序回归网络

泡泡机器人SLAM

5+阅读 · 2018年6月28日

深度 | 语义分割网络DeepLab-v3的架构设计思想和TensorFlow实现

深度 | 语义分割网络DeepLab-v3的架构设计思想和TensorFlow实现

机器之心

11+阅读 · 2018年3月26日

利用DeepLab在Tensorflow中进行语义图像分割

利用DeepLab在Tensorflow中进行语义图像分割

机器学习研究会

9+阅读 · 2018年3月22日

End-to-End Video Instance Segmentation with Transformers

Arxiv

10+阅读 · 2021年3月24日

Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspective with Transformers

Arxiv

10+阅读 · 2020年12月31日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

Kernel Graph Attention Network for Fact Verification

Kernel Graph Attention Network for Fact Verification

Arxiv

3+阅读 · 2019年10月23日

Inverse Visual Question Answering with Multi-Level Attentions

Inverse Visual Question Answering with Multi-Level Attentions

Arxiv

4+阅读 · 2019年9月17日

Universal Transformers

Universal Transformers

Arxiv

5+阅读 · 2019年3月5日

Efficient Dense Modules of Asymmetric Convolution for Real-Time Semantic Segmentation

Efficient Dense Modules of Asymmetric Convolution for Real-Time Semantic Segmentation

Arxiv

9+阅读 · 2018年9月17日

Doubly Attentive Transformer Machine Translation

Doubly Attentive Transformer Machine Translation

Arxiv

4+阅读 · 2018年7月30日

Syllable-Based Sequence-to-Sequence Speech Recognition with the Transformer in Mandarin Chinese

Arxiv

5+阅读 · 2018年6月4日

Semantic Segmentation via Highly Fused Convolutional Network with Multiple Soft Cost Functions

Arxiv

3+阅读 · 2018年1月4日

VIP会员

相关主题

相关VIP内容

【CVPR2021】重新思考BiSeNet让语义分割模型速度起飞

【CVPR2021】重新思考BiSeNet让语义分割模型速度起飞

专知会员服务

34+阅读 · 2021年5月5日

（CVPR2021）基于结构保持的弱监督目标定位

专知会员服务

21+阅读 · 2021年5月1日

【CVPR2021】通道注意力的高效移动网络设计

【CVPR2021】通道注意力的高效移动网络设计

专知会员服务

20+阅读 · 2021年4月27日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知会员服务

38+阅读 · 2021年4月16日

【CVPR2021】端到端的全卷积目标检测器

专知会员服务

30+阅读 · 2021年4月5日

【CVPR2021】用随机标签的神经架构搜索

专知会员服务

12+阅读 · 2021年3月21日

【CVPR2021】坐标注意力的高效移动网络设计

专知会员服务

23+阅读 · 2021年3月9日

【CVPR2021】自监督几何感知

【CVPR2021】自监督几何感知

专知会员服务

46+阅读 · 2021年3月6日

【CVPR2021】用Transformers无监督预训练进行目标检测

【CVPR2021】用Transformers无监督预训练进行目标检测

专知会员服务

58+阅读 · 2021年3月3日

【ECCV2020】EfficientFCN：语义分割中的整体引导解码器

【ECCV2020】EfficientFCN：语义分割中的整体引导解码器

专知会员服务

18+阅读 · 2020年8月23日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

【ECCV2020】EfficientFCN：语义分割中的整体引导解码器

【ECCV2020】EfficientFCN：语义分割中的整体引导解码器

专知

3+阅读 · 2020年8月23日

【ACMMM2020-北航】KBGN:用于视觉对话中自适应视觉-文本推理的知识桥图网络

【ACMMM2020-北航】KBGN:用于视觉对话中自适应视觉-文本推理的知识桥图网络

专知

10+阅读 · 2020年8月12日

AAAI 2020 | 快手：重新审视图像美学评估 & 寻找精彩片段聚焦点

AAAI 2020 | 快手：重新审视图像美学评估 & 寻找精彩片段聚焦点

AI科技评论

6+阅读 · 2020年1月17日

【泡泡图灵智库】点云序列的语义分割数据集

【泡泡图灵智库】点云序列的语义分割数据集

泡泡机器人SLAM

9+阅读 · 2019年9月20日

深入探究深度卷积语义分割网络和 Deeplab_V3

深入探究深度卷积语义分割网络和 Deeplab_V3

AI研习社

6+阅读 · 2019年4月13日

【泡泡一分钟】RNFNet: 用于室内语义分割的RGB-D多层级残差特征融合（ICCV2017-523）

【泡泡一分钟】RNFNet: 用于室内语义分割的RGB-D多层级残差特征融合（ICCV2017-523）

泡泡机器人SLAM

10+阅读 · 2018年12月21日

【泡泡一分钟】预测未来更深层次的语义分割 (ICCV2017-63)

【泡泡一分钟】预测未来更深层次的语义分割 (ICCV2017-63)

泡泡机器人SLAM

5+阅读 · 2018年8月4日

【泡泡图灵智库】用于单目深度估计的深度有序回归网络

【泡泡图灵智库】用于单目深度估计的深度有序回归网络

泡泡机器人SLAM

5+阅读 · 2018年6月28日

深度 | 语义分割网络DeepLab-v3的架构设计思想和TensorFlow实现

深度 | 语义分割网络DeepLab-v3的架构设计思想和TensorFlow实现

机器之心

11+阅读 · 2018年3月26日

利用DeepLab在Tensorflow中进行语义图像分割

利用DeepLab在Tensorflow中进行语义图像分割

机器学习研究会

9+阅读 · 2018年3月22日

相关论文

End-to-End Video Instance Segmentation with Transformers

Arxiv

10+阅读 · 2021年3月24日

Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspective with Transformers

Arxiv

10+阅读 · 2020年12月31日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

Kernel Graph Attention Network for Fact Verification

Kernel Graph Attention Network for Fact Verification

Arxiv

3+阅读 · 2019年10月23日

Inverse Visual Question Answering with Multi-Level Attentions

Inverse Visual Question Answering with Multi-Level Attentions

Arxiv

4+阅读 · 2019年9月17日

Universal Transformers

Universal Transformers

Arxiv

5+阅读 · 2019年3月5日

Efficient Dense Modules of Asymmetric Convolution for Real-Time Semantic Segmentation

Efficient Dense Modules of Asymmetric Convolution for Real-Time Semantic Segmentation

Arxiv

9+阅读 · 2018年9月17日

Doubly Attentive Transformer Machine Translation

Doubly Attentive Transformer Machine Translation

Arxiv

4+阅读 · 2018年7月30日

Syllable-Based Sequence-to-Sequence Speech Recognition with the Transformer in Mandarin Chinese

Arxiv

5+阅读 · 2018年6月4日

Semantic Segmentation via Highly Fused Convolutional Network with Multiple Soft Cost Functions

Arxiv

3+阅读 · 2018年1月4日

微信扫码咨询专知VIP会员