带有MaskCLIP的开放球面截面 (Open-Vocabulary Panoptic Segmentation with MaskCLIP) - 专知论文

会员服务 ·

0

Performer · MoDELS · 掩码 · 示例 · Attention ·

2022 年 8 月 18 日

Open-Vocabulary Panoptic Segmentation with MaskCLIP

翻译：带有MaskCLIP的开放球面截面

Zheng Ding,Jieke Wang,Zhuowen Tu

In this paper, we tackle a new computer vision task, open-vocabulary panoptic segmentation, that aims to perform panoptic segmentation (background semantic labeling + foreground instance segmentation) for arbitrary categories of text-based descriptions. We first build a baseline method without finetuning nor distillation to utilize the knowledge in the existing CLIP model. We then develop a new method, MaskCLIP, that is a Transformer-based approach using mask queries with the ViT-based CLIP backbone to perform semantic segmentation and object instance segmentation. Here we design a Relative Mask Attention (RMA) module to account for segmentations as additional tokens to the ViT CLIP model. MaskCLIP learns to efficiently and effectively utilize pre-trained dense/local CLIP features by avoiding the time-consuming operation to crop image patches and compute feature from an external CLIP image model. We obtain encouraging results for open-vocabulary panoptic segmentation and state-of-the-art results for open-vocabulary semantic segmentation on ADE20K and PASCAL datasets. We show qualitative illustration for MaskCLIP with custom categories.

翻译：在本文中,我们处理一种新的计算机视觉任务,即开放的单词孔全光截面,目的是对任意类型的基于文本的描述进行全光分解(后台语义标签+前景光谱分解),我们首先在没有微调或蒸馏的情况下建立一个基线方法,以便利用现有的CLIP模型的知识;然后我们开发一种新的方法,即MaskCLIP,这是一种以变换器为基础的方法,使用VIT为基础的 CLIP主干线的遮罩查询进行语义分解和对象实例分解。我们在这里设计了一个相对遮罩注意模块(RMA),用于核算作为VIT CLIP模型的额外代号的分块。MusCLIP学会了高效和有效利用预先训练的密度/本地的 CLIP特性,避免了作物图像补接和从外部 CLIP 图像模型中计算特征的耗时操作。我们获得了令人鼓舞的结果,以开放的词汇截面截面截面截面截面截面截面截面截面段和物体分块结果,用于在ADE20K和MACLS上显示定性图解的系统。

0

相关内容

Performer

【CVPR 2022】使用多模态Transformer的端到端视频对象分割，End-to-End Referring Video Object Segmentation with Multimodal Transformer

【CVPR 2022】使用多模态Transformer的端到端视频对象分割，End-to-End Referring Video Object Segmentation with Multimodal Transformer

专知会员服务

28+阅读 · 2022年3月3日

【NeurIPS 2021 】 K-Net-大统一图像分割任务：语义、实例乃至全景分割

【NeurIPS 2021 】 K-Net-大统一图像分割任务：语义、实例乃至全景分割

专知会员服务

21+阅读 · 2021年12月14日

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

专知会员服务

165+阅读 · 2020年3月18日

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

专知会员服务

95+阅读 · 2020年3月12日

【图像分割| 2019最新综述】自然图像和医学图像的深层语义分割，附21页PDF（Deep Semantic Segmentation of Natural and Medical Images: A Review）

【图像分割| 2019最新综述】自然图像和医学图像的深层语义分割，附21页PDF（Deep Semantic Segmentation of Natural and Medical Images: A Review）

专知会员服务

54+阅读 · 2019年11月16日

Deep Learning Based Detection and Correction of Cardiac MR Motion Artefacts During Reconstruction for High-Quality Segmentation

Deep Learning Based Detection and Correction of Cardiac MR Motion Artefacts During Reconstruction for High-Quality Segmentation

专知会员服务

59+阅读 · 2019年10月17日

Keras François Chollet 《Deep Learning with Python 》, 386页pdf

Keras François Chollet 《Deep Learning with Python 》, 386页pdf

专知会员服务

160+阅读 · 2019年10月12日

[综述]深度学习下的场景文本检测与识别

[综述]深度学习下的场景文本检测与识别

专知会员服务

78+阅读 · 2019年10月10日

计算机视觉最佳实践、代码示例和相关文档

计算机视觉最佳实践、代码示例和相关文档

专知会员服务

20+阅读 · 2019年10月9日

最新BERT相关论文清单，BERT-related Papers

最新BERT相关论文清单，BERT-related Papers

专知会员服务

53+阅读 · 2019年9月29日

VCIP 2022 Call for Demos

VCIP 2022 Call for Demos

CCF多媒体专委会

1+阅读 · 2022年6月6日

VCIP 2022 Call for Special Session Proposals

VCIP 2022 Call for Special Session Proposals

CCF多媒体专委会

1+阅读 · 2022年4月1日

RoBERTa中文预训练模型：RoBERTa for Chinese

RoBERTa中文预训练模型：RoBERTa for Chinese

PaperWeekly

57+阅读 · 2019年9月16日

BERT/Transformer/迁移学习NLP资源大列表

BERT/Transformer/迁移学习NLP资源大列表

专知

19+阅读 · 2019年6月9日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Github项目推荐 | 语义分割、实例分割、全景分割和视频分割的论文和基准列表

Github项目推荐 | 语义分割、实例分割、全景分割和视频分割的论文和基准列表

AI研习社

32+阅读 · 2019年4月5日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

【论文推荐】最新5篇图像分割（Image Segmentation）相关论文—多重假设、超像素分割、自监督、图、生成对抗网络

【论文推荐】最新5篇图像分割（Image Segmentation）相关论文—多重假设、超像素分割、自监督、图、生成对抗网络

专知

27+阅读 · 2018年2月7日

【推荐】深度学习目标检测概览

【推荐】深度学习目标检测概览

机器学习研究会

10+阅读 · 2017年9月1日

多离合器ISG混合动力汽车分层多模式切换协调控制与优化

国家自然科学基金

1+阅读 · 2014年12月31日

神经元凋亡时GSK-3/Egr-1上调PUMA的作用及其机制

国家自然科学基金

0+阅读 · 2013年12月31日

基于银-半导体鸟笼状纳米结构对太阳光降解工业染料废水的催化性能研究

国家自然科学基金

0+阅读 · 2013年12月31日

转录因子Egr2/Egr3在类风湿关节炎寒证中的作用机制研究

国家自然科学基金

0+阅读 · 2013年12月31日

具有抗肿瘤活性愈创木烷型倍半萜类天然产物全合成

国家自然科学基金

0+阅读 · 2012年12月31日

DNMT1在哮喘气道平滑肌细胞表型转化及气道重塑中的作用与机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

大花旋覆花内酯抗肿瘤衍生物合成、构效关系和作用机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

五倍子与升麻配伍活性成分抗根面龋细菌生物膜作用及机理研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于NF-κB通路的荔枝果皮原花青素抗动脉粥样硬化机制

国家自然科学基金

0+阅读 · 2011年12月31日

双通道EGER/CMC法及两种“#19971;药”#20013;抗癌活性成分筛选研究

国家自然科学基金

0+阅读 · 2010年12月31日

Robust Double-Encoder Network for RGB-D Panoptic Segmentation

Arxiv

0+阅读 · 2022年10月6日

Learning with Free Object Segments for Long-Tailed Instance Segmentation

Arxiv

0+阅读 · 2022年10月5日

Masked Supervised Learning for Semantic Segmentation

Arxiv

0+阅读 · 2022年10月3日

Concurrent Recognition and Segmentation with Adaptive Segment Tokens

Arxiv

0+阅读 · 2022年10月1日

F-VLM: Open-Vocabulary Object Detection upon Frozen Vision and Language Models

Arxiv

0+阅读 · 2022年9月30日

Dual Progressive Transformations for Weakly Supervised Semantic Segmentation

Arxiv

0+阅读 · 2022年9月30日

Deep Learning for Medical Image Segmentation: Tricks, Challenges and Future Directions

Arxiv

21+阅读 · 2022年9月21日

Masked Autoencoders Are Scalable Vision Learners

Arxiv

27+阅读 · 2021年11月11日

nnU-Net: Self-adapting Framework for U-Net-Based Medical Image Segmentation

Arxiv

12+阅读 · 2018年9月27日

W-net: Bridged U-net for 2D Medical Image Segmentation

W-net: Bridged U-net for 2D Medical Image Segmentation

Arxiv

20+阅读 · 2018年7月12日

VIP会员

文章信息

相关主题

相关VIP内容

【CVPR 2022】使用多模态Transformer的端到端视频对象分割，End-to-End Referring Video Object Segmentation with Multimodal Transformer

【CVPR 2022】使用多模态Transformer的端到端视频对象分割，End-to-End Referring Video Object Segmentation with Multimodal Transformer

专知会员服务

28+阅读 · 2022年3月3日

【NeurIPS 2021 】 K-Net-大统一图像分割任务：语义、实例乃至全景分割

【NeurIPS 2021 】 K-Net-大统一图像分割任务：语义、实例乃至全景分割

专知会员服务

21+阅读 · 2021年12月14日

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

专知会员服务

165+阅读 · 2020年3月18日

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

专知会员服务

95+阅读 · 2020年3月12日

【图像分割| 2019最新综述】自然图像和医学图像的深层语义分割，附21页PDF（Deep Semantic Segmentation of Natural and Medical Images: A Review）

【图像分割| 2019最新综述】自然图像和医学图像的深层语义分割，附21页PDF（Deep Semantic Segmentation of Natural and Medical Images: A Review）

专知会员服务

54+阅读 · 2019年11月16日

Deep Learning Based Detection and Correction of Cardiac MR Motion Artefacts During Reconstruction for High-Quality Segmentation

Deep Learning Based Detection and Correction of Cardiac MR Motion Artefacts During Reconstruction for High-Quality Segmentation

专知会员服务

59+阅读 · 2019年10月17日

Keras François Chollet 《Deep Learning with Python 》, 386页pdf

Keras François Chollet 《Deep Learning with Python 》, 386页pdf

专知会员服务

160+阅读 · 2019年10月12日

[综述]深度学习下的场景文本检测与识别

[综述]深度学习下的场景文本检测与识别

专知会员服务

78+阅读 · 2019年10月10日

计算机视觉最佳实践、代码示例和相关文档

计算机视觉最佳实践、代码示例和相关文档

专知会员服务

20+阅读 · 2019年10月9日

最新BERT相关论文清单，BERT-related Papers

最新BERT相关论文清单，BERT-related Papers

专知会员服务

53+阅读 · 2019年9月29日

热门VIP内容

开通专知VIP会员享更多权益服务

《物联网（IoT）中的无人机通信高效控制》135页

《在GNSS信号降级环境中利用共识实现无人机集群稳健协调》

中程单向攻击无人机的战略意义：俄乌战争启示

《面向无人机集群的避障动态传感器覆盖算法》最新38页

相关资讯

VCIP 2022 Call for Demos

VCIP 2022 Call for Demos

CCF多媒体专委会

1+阅读 · 2022年6月6日

VCIP 2022 Call for Special Session Proposals

VCIP 2022 Call for Special Session Proposals

CCF多媒体专委会

1+阅读 · 2022年4月1日

RoBERTa中文预训练模型：RoBERTa for Chinese

RoBERTa中文预训练模型：RoBERTa for Chinese

PaperWeekly

57+阅读 · 2019年9月16日

BERT/Transformer/迁移学习NLP资源大列表

BERT/Transformer/迁移学习NLP资源大列表

专知

19+阅读 · 2019年6月9日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Github项目推荐 | 语义分割、实例分割、全景分割和视频分割的论文和基准列表

Github项目推荐 | 语义分割、实例分割、全景分割和视频分割的论文和基准列表

AI研习社

32+阅读 · 2019年4月5日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

【论文推荐】最新5篇图像分割（Image Segmentation）相关论文—多重假设、超像素分割、自监督、图、生成对抗网络

【论文推荐】最新5篇图像分割（Image Segmentation）相关论文—多重假设、超像素分割、自监督、图、生成对抗网络

专知

27+阅读 · 2018年2月7日

【推荐】深度学习目标检测概览

【推荐】深度学习目标检测概览

机器学习研究会

10+阅读 · 2017年9月1日

相关论文

Robust Double-Encoder Network for RGB-D Panoptic Segmentation

Arxiv

0+阅读 · 2022年10月6日

Learning with Free Object Segments for Long-Tailed Instance Segmentation

Arxiv

0+阅读 · 2022年10月5日

Masked Supervised Learning for Semantic Segmentation

Arxiv

0+阅读 · 2022年10月3日

Concurrent Recognition and Segmentation with Adaptive Segment Tokens

Arxiv

0+阅读 · 2022年10月1日

F-VLM: Open-Vocabulary Object Detection upon Frozen Vision and Language Models

Arxiv

0+阅读 · 2022年9月30日

Dual Progressive Transformations for Weakly Supervised Semantic Segmentation

Arxiv

0+阅读 · 2022年9月30日

Deep Learning for Medical Image Segmentation: Tricks, Challenges and Future Directions

Arxiv

21+阅读 · 2022年9月21日

Masked Autoencoders Are Scalable Vision Learners

Arxiv

27+阅读 · 2021年11月11日

nnU-Net: Self-adapting Framework for U-Net-Based Medical Image Segmentation

Arxiv

12+阅读 · 2018年9月27日

W-net: Bridged U-net for 2D Medical Image Segmentation

W-net: Bridged U-net for 2D Medical Image Segmentation

Arxiv

20+阅读 · 2018年7月12日

相关基金

多离合器ISG混合动力汽车分层多模式切换协调控制与优化

国家自然科学基金

1+阅读 · 2014年12月31日

神经元凋亡时GSK-3/Egr-1上调PUMA的作用及其机制

国家自然科学基金

0+阅读 · 2013年12月31日

基于银-半导体鸟笼状纳米结构对太阳光降解工业染料废水的催化性能研究

国家自然科学基金

0+阅读 · 2013年12月31日

转录因子Egr2/Egr3在类风湿关节炎寒证中的作用机制研究

国家自然科学基金

0+阅读 · 2013年12月31日

具有抗肿瘤活性愈创木烷型倍半萜类天然产物全合成

国家自然科学基金

0+阅读 · 2012年12月31日

DNMT1在哮喘气道平滑肌细胞表型转化及气道重塑中的作用与机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

大花旋覆花内酯抗肿瘤衍生物合成、构效关系和作用机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

五倍子与升麻配伍活性成分抗根面龋细菌生物膜作用及机理研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于NF-κB通路的荔枝果皮原花青素抗动脉粥样硬化机制

国家自然科学基金

0+阅读 · 2011年12月31日

双通道EGER/CMC法及两种“#19971;药”#20013;抗癌活性成分筛选研究

国家自然科学基金

0+阅读 · 2010年12月31日

微信扫码咨询专知VIP会员