【CVPR 2022-UCSD&英伟达】GroupViT:从文本监督中产生语义分割，Semantic Segmentation Emerges from Text Supervision - 专知VIP

会员服务 ·

3

CVPR 2022 · GroupViT · 语义分割 · 文本监督 · 论文 ·

2022 年 3 月 9 日

【CVPR 2022-UCSD&英伟达】GroupViT:从文本监督中产生语义分割，Semantic Segmentation Emerges from Text Supervision

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

分组和识别是视觉场景理解的重要组成部分，例如对象检测和语义分割。在端到端深度学习系统中，图像区域的分组通常通过像素级识别标签的自顶向下的监督隐式进行。相反，在本文中，我们提出将分组机制引入到深度网络中，允许语义段在只有文本监督的情况下自动出现。我们提出了一种分层的分组视觉Transformer (GroupViT)，它超越了规则的网格结构表示，学习将图像区域分组成逐渐增大的任意形状的片段。我们通过对比损失在大规模图像-文本数据集上联合训练GroupViT和文本编码器。GroupViT只有文本监督，没有任何像素级的注释，它学会了将语义区域组合在一起，并以零样本的方式成功地迁移到语义分割的任务中，即没有任何进一步的微调。它在PASCAL VOC 2012上实现了51.2%的mIoU的零样本学习精度，在PASCAL上下文数据集上实现了22.3%的mIoU，并与需要更高水平监督的最先进的迁移学习方法相匹配。

成为VIP会员查看完整内容

12

相关内容

CVPR 2022

CVPR 2022 将于2022年 6 月 21-24 日在美国的新奥尔良举行。CVPR是IEEE Conference on Computer Vision and Pattern Recognition的缩写，即IEEE国际计算机视觉与模式识别会议。该会议是由IEEE举办的计算机视觉和模式识别领域的顶级会议，会议的主要内容是计算机视觉与模式识别技术。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【CVPR 2022】基于元内存传输的跨域少镜头语义分割，Remember the Difference: Cross-Domain Few-Shot Semantic Segmentation via Meta-Memory Transfer

【CVPR 2022】基于元内存传输的跨域少镜头语义分割，Remember the Difference: Cross-Domain Few-Shot Semantic Segmentation via Meta-Memory Transfer

专知会员服务

13+阅读 · 2022年3月12日

【CVPR 2022】可控图像合成与编辑的合成生成先验学习，SemanticStyleGAN: Learning Compositonal Generative Priors for Controllable Image Synthesis and Editing

【CVPR 2022】可控图像合成与编辑的合成生成先验学习，SemanticStyleGAN: Learning Compositonal Generative Priors for Controllable Image Synthesis and Editing

专知会员服务

23+阅读 · 2022年3月3日

【CVPR 2022】使用多模态Transformer的端到端视频对象分割，End-to-End Referring Video Object Segmentation with Multimodal Transformer

【CVPR 2022】使用多模态Transformer的端到端视频对象分割，End-to-End Referring Video Object Segmentation with Multimodal Transformer

专知会员服务

28+阅读 · 2022年3月3日

【NeurIPS 2021 】 K-Net-大统一图像分割任务：语义、实例乃至全景分割

【NeurIPS 2021 】 K-Net-大统一图像分割任务：语义、实例乃至全景分割

专知会员服务

21+阅读 · 2021年12月14日

NeurIPS 2021丨K-Net: 迈向统一的图像分割

NeurIPS 2021丨K-Net: 迈向统一的图像分割

专知会员服务

17+阅读 · 2021年11月25日

深度卷积神经网络图像语义分割研究进展

专知会员服务

86+阅读 · 2021年1月7日

【ECCV2020】EfficientFCN：语义分割中的整体引导解码器

【ECCV2020】EfficientFCN：语义分割中的整体引导解码器

专知会员服务

18+阅读 · 2020年8月23日

【CVPR2020-Oral】无监督域内自适应语义分割，Unsupervised Intra-domain Adaptation

【CVPR2020-Oral】无监督域内自适应语义分割，Unsupervised Intra-domain Adaptation

专知会员服务

71+阅读 · 2020年4月20日

【CVPR2020-中科院计算所】弱监督语义分割的自监督等价注意力机制，Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation

【CVPR2020-中科院计算所】弱监督语义分割的自监督等价注意力机制，Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation

专知会员服务

76+阅读 · 2020年4月10日

【Google AI】开源NoisyStudent：自监督图像分类

【Google AI】开源NoisyStudent：自监督图像分类

专知会员服务

55+阅读 · 2020年2月18日

CVPR 2022 | 做语义分割不用任何像素标签！英伟达提出GroupViT：基于文本监督的语义分割

CVPR 2022 | 做语义分割不用任何像素标签！英伟达提出GroupViT：基于文本监督的语义分割

CVer

1+阅读 · 2022年3月16日

做语义分割不用任何像素标签，UCSD、英伟达在ViT中加入分组模块，入选CVPR2022

做语义分割不用任何像素标签，UCSD、英伟达在ViT中加入分组模块，入选CVPR2022

机器之心

0+阅读 · 2022年3月14日

CVPR 2021 | 9篇精选论文，一览微软亚洲研究院视觉研究前沿进展

CVPR 2021 | 9篇精选论文，一览微软亚洲研究院视觉研究前沿进展

微软研究院AI头条

0+阅读 · 2021年6月22日

CVPR 2021 | 中科院自动化所、字节跳动提出高性能的指代性分割基准模型

CVPR 2021 | 中科院自动化所、字节跳动提出高性能的指代性分割基准模型

机器之心

2+阅读 · 2021年5月1日

从 CVPR 2019 一览小样本学习研究进展

从 CVPR 2019 一览小样本学习研究进展

AI科技评论

11+阅读 · 2019年7月25日

PyTorch语义分割开源库semseg

PyTorch语义分割开源库semseg

极市平台

25+阅读 · 2019年6月6日

李飞飞团队新作 - 有限标签的场景图预测

李飞飞团队新作 - 有限标签的场景图预测

专知

27+阅读 · 2019年5月6日

《pyramid Attention Network for Semantic Segmentation》

《pyramid Attention Network for Semantic Segmentation》

统计学习与视觉计算组

44+阅读 · 2018年8月30日

语义分割和转置卷积

语义分割和转置卷积

AI研习社

11+阅读 · 2018年6月22日

Facebook人工智能实验室提出「全景分割」，实现实例分割和语义分割的统一

Facebook人工智能实验室提出「全景分割」，实现实例分割和语义分割的统一

人工智能学家

11+阅读 · 2018年1月6日

基于IFC的建筑信息模型(BIM)语义检索技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于弱监督学习的图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

基于深度置信网络的图像分类方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

基于深度学习的遥感图像分类及其CPU/GPU异构并行系统结构研究

国家自然科学基金

3+阅读 · 2013年12月31日

大尺寸高分辨率差异图像的结构化分层细分配准研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于知识迁移的多时相高分辨率遥感影像分类方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

图像标签关联性模型研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于蚁群算法面向对象的遥感图像分类方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

中国明清时期气候灾害时空演变特征挖掘研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向网络弱标记图像的视觉对象模型在线学习方法

国家自然科学基金

0+阅读 · 2011年12月31日

Situational Perception Guided Image Matting

Arxiv

0+阅读 · 2022年4月20日

Dual-Domain Image Synthesis using Segmentation-Guided GAN

Arxiv

0+阅读 · 2022年4月19日

Core Box Image Recognition and its Improvement with a New Augmentation Technique

Arxiv

0+阅读 · 2022年4月19日

NAFSSR: Stereo Image Super-Resolution Using NAFNet

Arxiv

0+阅读 · 2022年4月19日

INSTA-BNN: Binary Neural Network with INSTAnce-aware Threshold

INSTA-BNN: Binary Neural Network with INSTAnce-aware Threshold

Arxiv

0+阅读 · 2022年4月18日

Unsupervised Contrastive Domain Adaptation for Semantic Segmentation

Arxiv

0+阅读 · 2022年4月18日

TSception: Capturing Temporal Dynamics and Spatial Asymmetry from EEG for Emotion Recognition

Arxiv

0+阅读 · 2022年4月18日

Decoupling Zero-Shot Semantic Segmentation

Arxiv

0+阅读 · 2022年4月15日

K-Net: Towards Unified Image Segmentation

Arxiv

12+阅读 · 2021年11月1日

Cross-Modal Self-Attention Network for Referring Image Segmentation

Cross-Modal Self-Attention Network for Referring Image Segmentation

Arxiv

18+阅读 · 2019年4月9日

VIP会员

相关主题

相关VIP内容

【CVPR 2022】基于元内存传输的跨域少镜头语义分割，Remember the Difference: Cross-Domain Few-Shot Semantic Segmentation via Meta-Memory Transfer

【CVPR 2022】基于元内存传输的跨域少镜头语义分割，Remember the Difference: Cross-Domain Few-Shot Semantic Segmentation via Meta-Memory Transfer

专知会员服务

13+阅读 · 2022年3月12日

【CVPR 2022】可控图像合成与编辑的合成生成先验学习，SemanticStyleGAN: Learning Compositonal Generative Priors for Controllable Image Synthesis and Editing

【CVPR 2022】可控图像合成与编辑的合成生成先验学习，SemanticStyleGAN: Learning Compositonal Generative Priors for Controllable Image Synthesis and Editing

专知会员服务

23+阅读 · 2022年3月3日

【CVPR 2022】使用多模态Transformer的端到端视频对象分割，End-to-End Referring Video Object Segmentation with Multimodal Transformer

【CVPR 2022】使用多模态Transformer的端到端视频对象分割，End-to-End Referring Video Object Segmentation with Multimodal Transformer

专知会员服务

28+阅读 · 2022年3月3日

【NeurIPS 2021 】 K-Net-大统一图像分割任务：语义、实例乃至全景分割

【NeurIPS 2021 】 K-Net-大统一图像分割任务：语义、实例乃至全景分割

专知会员服务

21+阅读 · 2021年12月14日

NeurIPS 2021丨K-Net: 迈向统一的图像分割

NeurIPS 2021丨K-Net: 迈向统一的图像分割

专知会员服务

17+阅读 · 2021年11月25日

深度卷积神经网络图像语义分割研究进展

专知会员服务

86+阅读 · 2021年1月7日

【ECCV2020】EfficientFCN：语义分割中的整体引导解码器

【ECCV2020】EfficientFCN：语义分割中的整体引导解码器

专知会员服务

18+阅读 · 2020年8月23日

【CVPR2020-Oral】无监督域内自适应语义分割，Unsupervised Intra-domain Adaptation

【CVPR2020-Oral】无监督域内自适应语义分割，Unsupervised Intra-domain Adaptation

专知会员服务

71+阅读 · 2020年4月20日

【CVPR2020-中科院计算所】弱监督语义分割的自监督等价注意力机制，Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation

【CVPR2020-中科院计算所】弱监督语义分割的自监督等价注意力机制，Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation

专知会员服务

76+阅读 · 2020年4月10日

【Google AI】开源NoisyStudent：自监督图像分类

【Google AI】开源NoisyStudent：自监督图像分类

专知会员服务

55+阅读 · 2020年2月18日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

CVPR 2022 | 做语义分割不用任何像素标签！英伟达提出GroupViT：基于文本监督的语义分割

CVPR 2022 | 做语义分割不用任何像素标签！英伟达提出GroupViT：基于文本监督的语义分割

CVer

1+阅读 · 2022年3月16日

做语义分割不用任何像素标签，UCSD、英伟达在ViT中加入分组模块，入选CVPR2022

做语义分割不用任何像素标签，UCSD、英伟达在ViT中加入分组模块，入选CVPR2022

机器之心

0+阅读 · 2022年3月14日

CVPR 2021 | 9篇精选论文，一览微软亚洲研究院视觉研究前沿进展

CVPR 2021 | 9篇精选论文，一览微软亚洲研究院视觉研究前沿进展

微软研究院AI头条

0+阅读 · 2021年6月22日

CVPR 2021 | 中科院自动化所、字节跳动提出高性能的指代性分割基准模型

CVPR 2021 | 中科院自动化所、字节跳动提出高性能的指代性分割基准模型

机器之心

2+阅读 · 2021年5月1日

从 CVPR 2019 一览小样本学习研究进展

从 CVPR 2019 一览小样本学习研究进展

AI科技评论

11+阅读 · 2019年7月25日

PyTorch语义分割开源库semseg

PyTorch语义分割开源库semseg

极市平台

25+阅读 · 2019年6月6日

李飞飞团队新作 - 有限标签的场景图预测

李飞飞团队新作 - 有限标签的场景图预测

专知

27+阅读 · 2019年5月6日

《pyramid Attention Network for Semantic Segmentation》

《pyramid Attention Network for Semantic Segmentation》

统计学习与视觉计算组

44+阅读 · 2018年8月30日

语义分割和转置卷积

语义分割和转置卷积

AI研习社

11+阅读 · 2018年6月22日

Facebook人工智能实验室提出「全景分割」，实现实例分割和语义分割的统一

Facebook人工智能实验室提出「全景分割」，实现实例分割和语义分割的统一

人工智能学家

11+阅读 · 2018年1月6日

相关基金

基于IFC的建筑信息模型(BIM)语义检索技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于弱监督学习的图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

基于深度置信网络的图像分类方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

基于深度学习的遥感图像分类及其CPU/GPU异构并行系统结构研究

国家自然科学基金

3+阅读 · 2013年12月31日

大尺寸高分辨率差异图像的结构化分层细分配准研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于知识迁移的多时相高分辨率遥感影像分类方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

图像标签关联性模型研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于蚁群算法面向对象的遥感图像分类方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

中国明清时期气候灾害时空演变特征挖掘研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向网络弱标记图像的视觉对象模型在线学习方法

国家自然科学基金

0+阅读 · 2011年12月31日

相关论文

Situational Perception Guided Image Matting

Arxiv

0+阅读 · 2022年4月20日

Dual-Domain Image Synthesis using Segmentation-Guided GAN

Arxiv

0+阅读 · 2022年4月19日

Core Box Image Recognition and its Improvement with a New Augmentation Technique

Arxiv

0+阅读 · 2022年4月19日

NAFSSR: Stereo Image Super-Resolution Using NAFNet

Arxiv

0+阅读 · 2022年4月19日

INSTA-BNN: Binary Neural Network with INSTAnce-aware Threshold

INSTA-BNN: Binary Neural Network with INSTAnce-aware Threshold

Arxiv

0+阅读 · 2022年4月18日

Unsupervised Contrastive Domain Adaptation for Semantic Segmentation

Arxiv

0+阅读 · 2022年4月18日

TSception: Capturing Temporal Dynamics and Spatial Asymmetry from EEG for Emotion Recognition

Arxiv

0+阅读 · 2022年4月18日

Decoupling Zero-Shot Semantic Segmentation

Arxiv

0+阅读 · 2022年4月15日

K-Net: Towards Unified Image Segmentation

Arxiv

12+阅读 · 2021年11月1日

Cross-Modal Self-Attention Network for Referring Image Segmentation

Cross-Modal Self-Attention Network for Referring Image Segmentation

Arxiv

18+阅读 · 2019年4月9日

微信扫码咨询专知VIP会员