Manually annotating object segmentation masks is very time-consuming. While interactive segmentation methods offer a more efficient alternative, they become unaffordable at a large scale because the cost grows linearly with the number of annotated masks. In this paper, we propose a highly efficient annotation scheme for building large datasets with object segmentation masks. At a large scale, images contain many object instances with similar appearance. We exploit these similarities by using hierarchical clustering on mask predictions made by a segmentation model. We propose a scheme that efficiently searches through the hierarchy of clusters and selects which clusters to annotate. Humans manually verify only a few masks per cluster, and the labels are propagated to the whole cluster. Through a large-scale experiment to populate 1M unlabeled images with object segmentation masks for 80 object classes, we show that (1) we obtain 1M object segmentation masks with an total annotation time of only 290 hours; (2) we reduce annotation time by 76x compared to manual annotation; (3) the segmentation quality of our masks is on par with those from manually annotated datasets. Code, data, and models are available online.


翻译:手工说明物体分割面罩非常耗时。 虽然互动分割面罩提供了一种效率更高的替代方法, 但由于成本随着附加说明的面罩数量增长而线性增长, 互动分割面罩变得非常昂贵。 在本文中, 我们提出一个高效的批注计划, 用于用物体分割面罩建立大型数据集。 大规模图像包含许多类似外观的物体。 我们利用这些相似之处, 使用分块模型对遮罩预测进行等级分组; 我们提议一个计划, 高效地搜索组群的等级, 并选择组群到批中进行批注。 人类手动核查每个组组中只有几个面罩, 并将标签传播到整个组群中。 通过大规模实验, 将一个带有物体分割面罩的1M无标签图像在80个物体类别中, 我们显示:(1) 我们获得1M物体分割面罩, 总共只有290小时的注解时间; (2) 我们比人工注时减少76x; (3) 我们的面罩的分解质量与手动注释式数据集的相近。 代码、 数据和模型是在线提供的。

0
下载
关闭预览

相关内容

【Manning新书】TensorFlow机器学习,454页pdf
专知会员服务
104+阅读 · 2021年11月14日
专知会员服务
43+阅读 · 2021年8月20日
【DeepMind】强化学习教程,83页ppt
专知会员服务
154+阅读 · 2020年8月7日
【MIT】反偏差对比学习,Debiased Contrastive Learning
专知会员服务
91+阅读 · 2020年7月4日
【Manning新书】现代Java实战,592页pdf
专知会员服务
100+阅读 · 2020年5月22日
Yann Lecun 纽约大学《深度学习(PyTorch)》课程(2020)PPT
专知会员服务
181+阅读 · 2020年3月16日
专知会员服务
110+阅读 · 2020年3月12日
最新!Yann Lecun 纽约大学Spring2020深度学习课程,附PPT下载
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
TorchSeg:基于pytorch的语义分割算法开源了
极市平台
20+阅读 · 2019年1月28日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
下载 | 114页自监督学习指南【PPT By Yann Lecun】
机器学习算法与Python学习
4+阅读 · 2018年12月24日
【SIGIR2018】五篇对抗训练文章
专知
12+阅读 · 2018年7月9日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
(TensorFlow)实时语义分割比较研究
机器学习研究会
9+阅读 · 2018年3月12日
【推荐】全卷积语义分割综述
机器学习研究会
19+阅读 · 2017年8月31日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Neural Belief Propagation for Scene Graph Generation
Arxiv
0+阅读 · 2021年12月10日
Arxiv
0+阅读 · 2021年12月7日
Arxiv
0+阅读 · 2021年12月6日
Arxiv
14+阅读 · 2019年9月11日
VIP会员
相关VIP内容
【Manning新书】TensorFlow机器学习,454页pdf
专知会员服务
104+阅读 · 2021年11月14日
专知会员服务
43+阅读 · 2021年8月20日
【DeepMind】强化学习教程,83页ppt
专知会员服务
154+阅读 · 2020年8月7日
【MIT】反偏差对比学习,Debiased Contrastive Learning
专知会员服务
91+阅读 · 2020年7月4日
【Manning新书】现代Java实战,592页pdf
专知会员服务
100+阅读 · 2020年5月22日
Yann Lecun 纽约大学《深度学习(PyTorch)》课程(2020)PPT
专知会员服务
181+阅读 · 2020年3月16日
专知会员服务
110+阅读 · 2020年3月12日
最新!Yann Lecun 纽约大学Spring2020深度学习课程,附PPT下载
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
相关资讯
TorchSeg:基于pytorch的语义分割算法开源了
极市平台
20+阅读 · 2019年1月28日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
下载 | 114页自监督学习指南【PPT By Yann Lecun】
机器学习算法与Python学习
4+阅读 · 2018年12月24日
【SIGIR2018】五篇对抗训练文章
专知
12+阅读 · 2018年7月9日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
(TensorFlow)实时语义分割比较研究
机器学习研究会
9+阅读 · 2018年3月12日
【推荐】全卷积语义分割综述
机器学习研究会
19+阅读 · 2017年8月31日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员