We propose a simple yet effective framework for instance and panoptic segmentation, termed CondInst (conditional convolutions for instance and panoptic segmentation). In the literature, top-performing instance segmentation methods typically follow the paradigm of Mask R-CNN and rely on ROI operations (typically ROIAlign) to attend to each instance. In contrast, we propose to attend to the instances with dynamic conditional convolutions. Instead of using instance-wise ROIs as inputs to the instance mask head of fixed weights, we design dynamic instance-aware mask heads, conditioned on the instances to be predicted. CondInst enjoys three advantages: 1.) Instance and panoptic segmentation are unified into a fully convolutional network, eliminating the need for ROI cropping and feature alignment. 2.) The elimination of the ROI cropping also significantly improves the output instance mask resolution. 3.) Due to the much improved capacity of dynamically-generated conditional convolutions, the mask head can be very compact (e.g., 3 conv. layers, each having only 8 channels), leading to significantly faster inference time per instance and making the overall inference time almost constant, irrelevant to the number of instances. We demonstrate a simpler method that can achieve improved accuracy and inference speed on both instance and panoptic segmentation tasks. On the COCO dataset, we outperform a few state-of-the-art methods. We hope that CondInst can be a strong baseline for instance and panoptic segmentation. Code is available at: https://git.io/AdelaiDet


翻译:我们建议一个简单而有效的框架,例如和光学截面,称为CondInst。在文献中,高性能截面方法通常遵循Mask R-CNN的范式,并依赖ROI的运行(通常为ROI)来应对每个实例。相反,我们提议以动态有条件的反光截面来应对这些实例。我们不使用以实例为根据的模型作为固定重量掩码的输入,而是设计动态的、有纯度的掩面头,以要预测的事例为条件。CondInst享有三个优势:1)事件和全性截面截面截面法通常遵循Mask R-CNN的范式,并依赖ROI的运行操作(通常为ROI)来应对每个实例。我们建议用动态生成的有条件反光谱解面图解面来应对这些实例。由于动态生成的模拟能力大大提高,遮面头可以非常紧凑(e.g. 3 conv. 层,每层仅有8个频道),从而大大加速。Cretating cretating a prefirate time a prience a prefrience agentitudeal ex

0
下载
关闭预览

相关内容

图像分割方法综述
专知会员服务
54+阅读 · 2020年11月22日
最新《医学图像深度语义分割》综述论文
专知会员服务
94+阅读 · 2020年6月7日
【新书】Python编程基础,669页pdf
专知会员服务
193+阅读 · 2019年10月10日
基于显著性的图像分割
AI研习社
7+阅读 · 2019年4月21日
TorchSeg:基于pytorch的语义分割算法开源了
极市平台
20+阅读 · 2019年1月28日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
《pyramid Attention Network for Semantic Segmentation》
统计学习与视觉计算组
44+阅读 · 2018年8月30日
DeepLab V3
计算机视觉战队
9+阅读 · 2018年4月2日
ResNet, AlexNet, VGG, Inception:各种卷积网络架构的理解
全球人工智能
19+阅读 · 2017年12月17日
【推荐】全卷积语义分割综述
机器学习研究会
19+阅读 · 2017年8月31日
Arxiv
8+阅读 · 2021年6月1日
S4Net: Single Stage Salient-Instance Segmentation
Arxiv
10+阅读 · 2019年4月10日
UPSNet: A Unified Panoptic Segmentation Network
Arxiv
4+阅读 · 2019年1月12日
Panoptic Feature Pyramid Networks
Arxiv
3+阅读 · 2019年1月8日
Arxiv
8+阅读 · 2018年5月15日
Arxiv
3+阅读 · 2018年3月5日
VIP会员
Top
微信扫码咨询专知VIP会员