We introduce a new image segmentation task, called Entity Segmentation (ES), which aims to segment all visual entities (objects and stuffs) in an image without predicting their semantic labels. By removing the need of class label prediction, the models trained for such task can focus more on improving segmentation quality. It has many practical applications such as image manipulation and editing where the quality of segmentation masks is crucial but class labels are less important. We conduct the first-ever study to investigate the feasibility of convolutional center-based representation to segment things and stuffs in a unified manner, and show that such representation fits exceptionally well in the context of ES. More specifically, we propose a CondInst-like fully-convolutional architecture with two novel modules specifically designed to exploit the class-agnostic and non-overlapping requirements of ES. Experiments show that the models designed and trained for ES significantly outperforms popular class-specific panoptic segmentation models in terms of segmentation quality. Moreover, an ES model can be easily trained on a combination of multiple datasets without the need to resolve label conflicts in dataset merging, and the model trained for ES on one or more datasets can generalize very well to other test datasets of unseen domains. The code has been released at https://github.com/dvlab-research/Entity.


翻译:我们引入了一个新的图像分割任务,名为“实体分割部分”,其目的是在不预测其语义标签的情况下在图像中将所有视觉实体(物体和物品)进行分解,而不必预测其语义标签。通过消除类标签预测的需要,为这种任务培训的模型可以更加注重改善分解质量。它有许多实际应用,例如图像操纵和编辑,其中分解面面面罩的质量至关重要,但类类标签则不太重要。我们进行了有史以来第一次研究,以研究以统一的方式对分解内容和物品进行横向中央代表的可行性,并表明这种代表在ES背景下非常适合。更具体地说,我们建议采用一个类似全革命结构的 Condinst-cent-contralal 结构,其中有两个新模块专门设计来利用ES类的分解和不重叠要求。实验表明,为ES设计和培训的模型在分解质量方面大大优于流行的类分解分解模式。此外,可以很容易地对多种数据集组合进行培训,而无需解决数据分类的相互冲突。我们提议了一个类似于全局全局的全局结构结构结构结构。 用于对ESservibbreal 数据进行常规测试。

0
下载
关闭预览

相关内容

【2021新书】ApachePulsar 实战,402页pdf
专知会员服务
70+阅读 · 2021年12月29日
斯坦福2020硬课《分布式算法与优化》
专知会员服务
120+阅读 · 2020年5月6日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
154+阅读 · 2019年10月12日
MIT新书《强化学习与最优控制》
专知会员服务
278+阅读 · 2019年10月9日
已删除
将门创投
5+阅读 · 2019年9月10日
TorchSeg:基于pytorch的语义分割算法开源了
极市平台
20+阅读 · 2019年1月28日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
计算机视觉的不同任务
专知
5+阅读 · 2018年8月27日
最佳实践:深度学习用于自然语言处理(三)
待字闺中
3+阅读 · 2017年8月20日
Arxiv
0+阅读 · 2022年2月1日
Arxiv
8+阅读 · 2021年6月1日
Arxiv
6+阅读 · 2020年2月15日
TensorMask: A Foundation for Dense Object Segmentation
Arxiv
10+阅读 · 2019年3月28日
VIP会员
相关资讯
已删除
将门创投
5+阅读 · 2019年9月10日
TorchSeg:基于pytorch的语义分割算法开源了
极市平台
20+阅读 · 2019年1月28日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
计算机视觉的不同任务
专知
5+阅读 · 2018年8月27日
最佳实践:深度学习用于自然语言处理(三)
待字闺中
3+阅读 · 2017年8月20日
Top
微信扫码咨询专知VIP会员