Moving object segmentation is a crucial task for autonomous vehicles as it can be used to segment objects in a class agnostic manner based on their motion cues. It enables the detection of unseen objects during training (e.g., moose or a construction truck) based on their motion and independent of their appearance. Although pixel-wise motion segmentation has been studied in autonomous driving literature, it has been rarely addressed at the instance level, which would help separate connected segments of moving objects leading to better trajectory planning. As the main issue is the lack of large public datasets, we create a new InstanceMotSeg dataset comprising of 12.9K samples improving upon our KITTIMoSeg dataset. In addition to providing instance level annotations, we have added 4 additional classes which is crucial for studying class agnostic motion segmentation. We adapt YOLACT and implement a motion-based class agnostic instance segmentation model which would act as a baseline for the dataset. We also extend it to an efficient multi-task model which additionally provides semantic instance segmentation sharing the encoder. The model then learns separate prototype coefficients within the class agnostic and semantic heads providing two independent paths of object detection for redundant safety. To obtain real-time performance, we study different efficient encoders and obtain 39 fps on a Titan Xp GPU using MobileNetV2 with an improvement of 10% mAP relative to the baseline. Our model improves the previous state of the art motion segmentation method by 3.3%. The dataset and qualitative results video are shared in our website at https://sites.google.com/view/instancemotseg/.


翻译:移动对象分割是自动车辆的一项关键任务, 因为它可以用来根据运动提示以类中不可知的方式分割物体。 它可以在训练期间根据运动和外观来探测看不见的物体( 如 moose 或 建筑卡车 ) 。 虽然在自主驱动文献中已经研究了像素一样的动动动分割部分, 但是它很少在例一级得到处理, 这有助于分离移动对象的连接部分, 从而导致更好的轨迹规划。 由于主要问题是缺少大型公共数据集, 我们创造了一个新的 CentralMotSeg 数据集, 其中包括12.9K 样本, 改进了我们KITTIMoSeg数据集。 除了提供实例级别说明外, 我们还增加了4个对研究类中运动运动分解至关重要的类别。 我们调整了YOLACT, 并实施了一个基于运动的分类的突变分解模式, 它将起到模型的基线作用。 我们还将它推广到一个高效的多塔克模型, 它将提供与我们相共享的语义区段部分, 分享我们 KITOal- real real- dia real lialal laction laction laction laction laction lavel.

0
下载
关闭预览

相关内容

视觉目标跟踪十年研究进展
专知会员服务
87+阅读 · 2021年3月10日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
80+阅读 · 2020年7月26日
最新《生成式对抗网络》简介,25页ppt
专知会员服务
175+阅读 · 2020年6月28日
专知会员服务
110+阅读 · 2020年3月12日
PyTorch语义分割开源库semseg
极市平台
25+阅读 · 2019年6月6日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
TorchSeg:基于pytorch的语义分割算法开源了
极市平台
20+阅读 · 2019年1月28日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
(TensorFlow)实时语义分割比较研究
机器学习研究会
9+阅读 · 2018年3月12日
语义分割+视频分割开源代码集合
极市平台
35+阅读 · 2018年3月5日
Monocular Plan View Networks for Autonomous Driving
Arxiv
6+阅读 · 2019年5月16日
Arxiv
7+阅读 · 2018年12月10日
Joint Monocular 3D Vehicle Detection and Tracking
Arxiv
8+阅读 · 2018年12月2日
Arxiv
6+阅读 · 2018年6月21日
VIP会员
相关资讯
Top
微信扫码咨询专知VIP会员