在计算机视觉领域,全景分割是一个新颖且重要的研究问题,它是机器感知、自动驾驶等新兴前沿技术的基石,有着十分重要的研究意义. 本文综述了基于深度学习的全景分割研究的最新进展,总结了全景分割任务的基本处理流程,并对已发表的全景分割工作基于其网络结构特点进行分类,并作了全面的介绍与分析,最后对全景分割任务目前面临的问题以及未来的发展趋势做出了分析,并针对所面临的问题提出了一些切实可行的解决思路.

全景分割[1]是将图像划分为语义区域(stuff)和 对象实例(things)的任务,是近年来新兴起的一个研 究方向,也是计算机视觉中一个重要的研究问题. 随着图像处理技术的发展,数字图像已经成为日常 生活中不可缺少的媒介,每时每刻都在产生图像数 据. 对图像中的物体进行快速准确的分割变得愈发重要.

全景分割包含语义分割和实例分割两大任务. 语义分割是将类别标签按图像中物体类别分配给 每个像素,即将输入图像中的像素分为不同的语义 类别. 传统的语义分割方法多数基于模型驱动,模 型驱动方法可分为生成式和判别式[2] . 生成式模型 首先学习图像的特征和标签概率,然后计算输入图 像特征时各个标签的后验概率,依据此概率对图像 进行标注. 马尔科夫随机场(Markov Random Field, MRF)是一种应用广泛的生成式模型[3],它利用先验上下文信息和训练得到的结果,提高分割性能. 但 是当图像较大时,分割速度和精度会大幅下降. 判 别式模型假设图像特征与标签之间存在某种映射 关系,然后从历史数据学习该映射关系的相关参数 [2] . 典型的判别式模型包括支持向量机(Support Vector Machine, SVM)、条件随机场(Conditional Random Field, CRF)等. SVM 因其可处理非线性且 具有良好的泛化能力,在语义分割研究中得到了广 泛应用[3]. CRF 不仅可以利用图像上下文信息,还 可学习从局部到全局的上下文信息,已经成功应用 于图像标记[4] . 然而,判别式模型存在收敛速度慢无法解决存在隐变量的情况等不容忽视的问题.

近年来,随着硬件计算能力的提高,语义分割 得到快速发展. 随着全卷积网络(fully convolutional network, FCN)的出现[5],深度学习推动语义分割任 务快速发展,并且在自动驾驶、人脸识别等领域得 到应用.

实例分割实质上是目标检测和语义分割的结合,目的是将输入图像中的目标检测出来,并且对 每个像素分配类别标签. 实例分割能够对前景语义 类别相同的不同实例进行区分,这是它与语义分割 的最大区别. 相比语义分割,实例分割发展较晚, 因此实例分割模型主要基于深度学习技术,但它也 是图像分割一个重要的组成部分. 随着深度学习的 发展,实例分割相继出现了 SDS [6]、DeepMask [7]、 MultiPath Network [8]等方法,分割精度和效率逐渐 得到提升.

全景分割是语义分割和实例分割的综合. 全景 分割任务不仅要求区分输入图像中的背景语义类 别和前景语义类别,还要将同一类别前景语义中的 不同实例分割出来,因此全景分割任务比语义分 割、实例分割任务的难度更高. 全景分割由 Kirillov 等人[1]于 2018 年提出,已经得到计算机视觉学界的 高度重视,涌现出 JSIS-Net[9]、TASCNet[10]、AUNet[11] 等方法,显著推动了全景分割的发展. 但是在真实 环境下,全景分割经常遇到以下挑战:

(1) 分支融合冲突 全景分割任务是语义分割与实例分割两个任务的综合,在网络结构方面,现有大部分方法将输 入图像的特征输入到语义分支与实例分支,然后融 合两个分支的输出,得到全景输出. 但是在融合时 会出现像素分配冲突,影响全景预测质量.

(2) 小物体检测分割 数据集中的图像会出现大小、距离不一的许多 物体,对于大物体,诸多全景分割方法能够对其进 行准确分割,当小物体出现时,经常伴随被忽略或 者分割不准确的问题,这导致全景分割精度较低, 直接增加了全景分割的难度.

(3) 分割对象交叠 在图像采集过程中,会因为季节、天气、光照、 距离等条件的变化,出现不同的场景,图像中物体 会出现遮挡交叠等情况,这使得分割方法无法准确 判断像素的归属,导致分割不精确. 为了克服上述挑战,已经出现了一些全景分割 方法,它们在分支融合、小物体检测、遮挡处理方 面提出了不同的应对策略,在一定程度上解决了这 些问题.

本文首先介绍全景分割的流程,然后重点 介绍深度学习在全景分割领域的研究进展. 本文内容安排如下:第 1 节介绍全景分割的基 本流程;第 2 节对语义分割、实例分割等相关知识 以及全景分割数据集进行介绍;第 3 节介绍深度学 习在全景分割领域的研究进展;第 4 节讨论全景分 割研究面临的挑战,并对今后的发展趋势进行展 望;第 5 节对本文进行总结.

成为VIP会员查看完整内容
32

相关内容

专知会员服务
93+阅读 · 2021年2月6日
专知会员服务
68+阅读 · 2021年1月16日
专知会员服务
109+阅读 · 2021年1月11日
小目标检测技术研究综述
专知会员服务
113+阅读 · 2020年12月7日
图像分割方法综述
专知会员服务
52+阅读 · 2020年11月22日
专知会员服务
217+阅读 · 2020年8月1日
深度学习目标检测方法综述
专知会员服务
257+阅读 · 2020年8月1日
专知会员服务
154+阅读 · 2020年4月21日
零样本图像分类综述 : 十年进展
专知会员服务
122+阅读 · 2019年11月16日
【文献综述】图像分割综述,224篇参考文献,附58页PDF
专知会员服务
115+阅读 · 2019年6月16日
综述 | 语义分割经典网络及轻量化模型盘点
计算机视觉life
51+阅读 · 2019年7月23日
最全综述 | 图像目标检测
计算机视觉life
30+阅读 · 2019年6月24日
最全综述 | 图像分割算法
计算机视觉life
13+阅读 · 2019年6月20日
病理图像的全景分割
人工智能前沿讲习班
16+阅读 · 2019年6月1日
CVPR2019目标检测方法进展综述
极市平台
45+阅读 · 2019年3月20日
DL | 语义分割综述
机器学习算法与Python学习
58+阅读 · 2019年3月13日
全景分割这一年,端到端之路
机器之心
14+阅读 · 2018年12月24日
全景分割任务介绍及其最新进展【附PPT与视频资料】
人工智能前沿讲习班
11+阅读 · 2018年12月5日
超像素、语义分割、实例分割、全景分割 傻傻分不清?
计算机视觉life
19+阅读 · 2018年11月27日
Meta-Transfer Learning for Zero-Shot Super-Resolution
Arxiv
43+阅读 · 2020年2月27日
Arxiv
5+阅读 · 2019年4月8日
Few-shot Adaptive Faster R-CNN
Arxiv
3+阅读 · 2019年3月22日
Panoptic Feature Pyramid Networks
Arxiv
3+阅读 · 2019年1月8日
Arxiv
7+阅读 · 2018年12月5日
Arxiv
135+阅读 · 2018年10月8日
Arxiv
4+阅读 · 2018年3月19日
Arxiv
4+阅读 · 2016年12月29日
VIP会员
相关VIP内容
专知会员服务
93+阅读 · 2021年2月6日
专知会员服务
68+阅读 · 2021年1月16日
专知会员服务
109+阅读 · 2021年1月11日
小目标检测技术研究综述
专知会员服务
113+阅读 · 2020年12月7日
图像分割方法综述
专知会员服务
52+阅读 · 2020年11月22日
专知会员服务
217+阅读 · 2020年8月1日
深度学习目标检测方法综述
专知会员服务
257+阅读 · 2020年8月1日
专知会员服务
154+阅读 · 2020年4月21日
零样本图像分类综述 : 十年进展
专知会员服务
122+阅读 · 2019年11月16日
【文献综述】图像分割综述,224篇参考文献,附58页PDF
专知会员服务
115+阅读 · 2019年6月16日
相关资讯
综述 | 语义分割经典网络及轻量化模型盘点
计算机视觉life
51+阅读 · 2019年7月23日
最全综述 | 图像目标检测
计算机视觉life
30+阅读 · 2019年6月24日
最全综述 | 图像分割算法
计算机视觉life
13+阅读 · 2019年6月20日
病理图像的全景分割
人工智能前沿讲习班
16+阅读 · 2019年6月1日
CVPR2019目标检测方法进展综述
极市平台
45+阅读 · 2019年3月20日
DL | 语义分割综述
机器学习算法与Python学习
58+阅读 · 2019年3月13日
全景分割这一年,端到端之路
机器之心
14+阅读 · 2018年12月24日
全景分割任务介绍及其最新进展【附PPT与视频资料】
人工智能前沿讲习班
11+阅读 · 2018年12月5日
超像素、语义分割、实例分割、全景分割 傻傻分不清?
计算机视觉life
19+阅读 · 2018年11月27日
相关论文
Meta-Transfer Learning for Zero-Shot Super-Resolution
Arxiv
43+阅读 · 2020年2月27日
Arxiv
5+阅读 · 2019年4月8日
Few-shot Adaptive Faster R-CNN
Arxiv
3+阅读 · 2019年3月22日
Panoptic Feature Pyramid Networks
Arxiv
3+阅读 · 2019年1月8日
Arxiv
7+阅读 · 2018年12月5日
Arxiv
135+阅读 · 2018年10月8日
Arxiv
4+阅读 · 2018年3月19日
Arxiv
4+阅读 · 2016年12月29日
微信扫码咨询专知VIP会员