首个镜子分割网络问世,大连理工、鹏城实验室、香港城大出品 | ICCV 2019

2019 年 9 月 17 日 量子位
乾明 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

镜子里的人,是人吗?对于计算机视觉系统来说:是。

大部分系统也不考虑镜子因素,它们很难分清楚镜中人。

镜子作为日常生活中非常重要的物体无处不在,不仅能够反射光线,能呈现出周围物体或者场景的镜像。

这就导致计算机视觉系统或者机器人一旦遇到有镜子的场景,性能就会大幅下降,可以说是遇到了克星。

怎么办?来自大连理工、鹏城实验室和香港城市大学的研究团队提出了一个方法。

他们发表了一篇名为Where Is My Mirror?的论文,已经被ICCV2019收录。

在这篇论文中,他们构建了一个大规模的镜像数据集,并提出了一种从输入图像中分割镜子的新方法。

不仅能够准确识别并分割出场景中的镜子,还能够消除由于镜子反射所导致的对于场景的错误理解,并帮助一些计算机视觉任务(例如深度估计和目标检测)提升鲁棒性。

他们说,这是首个解决镜子分割的方法,经过大量的实验表明,性能表现比最先进的检测和分割方法都要好。

未来,他们的目标是检测出现在城市街道上的镜子,这对户外执行的视觉任务——自动驾驶和无人机导航——都有助益。

Where Is My Mirror?

对于计算机视觉系统来说,镜子反射的内容与镜子外部的内容(即周围环境)非常相似,它们很难区分出来,更不用说从一个背景中自动分割镜子了。

从这点来看,系统是比不上人的。大多数人类,通常能很好地察觉镜子的存在。

向人类学习,成了这篇论文的突破点。研究人员观察到,人们识别镜像中的内容,通常会从边界入手,观察其不连续性。

因此,这个问题的一个直接的解决方案,是应用低层次的特征,比如颜色和纹理变化,来检测镜子边界。

但如果一个镜子前面有物体遮挡,这个方法就不管用了,比如这样的情况:

单靠检测镜子边界很难将对象的反射与对象本身分离开,也需要语义,即上下文对比信息来进行进行分割。

基于此,研究人员从两个方面来解决镜子分割问题:数据和神经网络。

自建数据集

因为这一领域之前并未有太多人关注,自然也没有可用数据集。

于是他们就自己动手,创建数据集MSD,包含4018对包含镜子和相应的手动注释的蒙版图像。

其中,有3677张来自室内场景,341张来自室外场景,基本上涵盖了生活中常见的出现镜子的场景:化妆台、装饰品、浴室、路面镜子、卧室、办公室、花园、街道和停车场。

最后有3063张图像用于训练,955张图像用于测试。

怎么找镜子?

论文中提出的镜子分割网络MirrorNet的架构,以单幅图像为输入,通过特征提取网络(FEN)提取多层特征。

然后,将最深层的、语义丰富的特征输入到所提出的上下文对比特征提取(CCFE)模块中,学习上下文对比特征,通过检测对比出现的分界线,用初始的粗糙的镜子分割图来定位镜子。

这一镜子分割图作为注意力图,用于抑制非镜子区域上一层 FEN 特征的特征噪声,使上一层能够集中学习候选镜子区域的鉴别特征。

通过这种方式,MirrorNet逐步利用上下文对比信息以从粗到精的方式细化镜子区域。最后,对最粗的网络输出进行上行采样,得到原始的图像分辨率作为输出。

镜子在这里

自建数据集提出的MirrorNet效果怎么样?

研究人员采用了相关领域中常用的5个度量(即语义分割、显著目标检测和阴影检测) ,对镜子分割性能进行定量评估。

比较对象也都是目标分割领域先进的模型,比如Mask RCNN、R3Net等等。

从这些指标来看,MirrorNet表现都是最佳。

一次跨越南北的合作

这一论文来自大连理工、鹏城实验室和香港城市大学,是一次跨越南北的合作。

第一作者有两位,分别是杨鑫和梅海洋。

杨鑫,大连理工大学计算机学院副教授、博士生导师、学校学科办建设副主任。本科毕业于吉林大学计算机学院,于浙江大学-美国加州大学戴维斯分校计算机学院进行博士生联合培养,获工学博士学位,香港城市大学博士后。

梅海洋,大连理工大学在读博士生,本科也毕业于大连理工大学。研究兴趣为图像处理、计算机视觉和深度学习。

梅海洋介绍称,他们团队围绕镜子,用了一年半的时间进行课题调研、确定问题、制作数据集、设计模型、优化模型,研究成果最终被ICCV2019接收。

后续将围绕城市间建筑表面的镜子来展开研究,以此来进一步扩展问题,缓解各种场景下镜子对于其他视觉任务的影响,提高应用价值。

最后,梅海洋说,关于这一研究的数据集和代码将会开源,希望广大的研究者们能够一起加入到这个问题的研究中~

如果你对这一研究感兴趣,请收好传送门:
https://mhaiyang.github.io/ICCV2019_MirrorNet/index.html


加入社群 | 与优秀的人交流

小程序 | 全类别AI学习教程


量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !



登录查看更多
4

相关内容

鹏城实验室(深圳网络空间科学与技术省实验室)建设是广东省委、省政府为深入贯彻落实党的十九大精神和习近平总书记对广东工作的重要指示,瞄准新一轮创新驱动发展需要,打造国家实验室“预备队”,建设创新型广东,推进深圳率先建设社会主义现代化先行区的重大部署。

实验室目前是广东省政府批准设立、深圳市政府负责建设的二类事业单位。由政府主导,以哈尔滨工业大学(深圳)为依托单位,与北京大学深圳研究生院、清华大学深圳国际研究生院、深圳大学、南方科技大学、香港中文大学(深圳)、深圳先进院、华为、中兴通讯、腾讯、深圳国家超算中心、中国电子信息产业集团、中国移动、中国电信、中国联通、中国航天科技集团等高校、科研院所和高科技企业等优势单位共建。

实验室以服务国家和区域发展战略为己任,聚合国内外优质创新资源,建设重大科学基础设施和平台,开展区域性多领域、跨学科、大协同的基础研究和应用基础研究,重点布局网络通信、人工智能和网络空间安全等研究方向,努力引领未来学术方向,推动网络信息产业发展,积极推动粤港澳大湾区打造国际科技创新中心。实验室将积极开展符合大科学时代科研规律、发挥新型举国体制优势的科研体制机制创新。

实验室建设目标是:2020年完善基础设施,搭建实施重大战略工程和基础研究的科研平台,初步建成具有全国影响力的科研机构。2030年建立国家科技资源开放共享服务平台,解决网络信息领域一批原创性关键技术和“卡脖子”技术,推动科技成果转化与产业化,实验室迈入国家实验室行列。2050年突破网络信息领域核心前沿技术问题,取得重大原始创新;承担网络信息领域国家重要战略任务,在推动学科发展和解决国家重大科学技术问题方面发挥主导作用;实验室建设成为具有国际领先水平的创新型实验室。

【CMU】基于图神经网络的联合检测与多目标跟踪
专知会员服务
56+阅读 · 2020年6月24日
专知会员服务
109+阅读 · 2020年3月12日
基于深度学习的行人重识别研究进展,自动化学报
专知会员服务
38+阅读 · 2019年12月5日
全景分割这一年,端到端之路
机器之心
14+阅读 · 2018年12月24日
超像素、语义分割、实例分割、全景分割 傻傻分不清?
计算机视觉life
19+阅读 · 2018年11月27日
专栏 | CVPR 2017论文解读:特征金字塔网络FPN
机器之心
8+阅读 · 2017年7月25日
Meta-Learning to Cluster
Arxiv
17+阅读 · 2019年10月30日
Arxiv
6+阅读 · 2019年4月8日
Augmentation for small object detection
Arxiv
11+阅读 · 2019年2月19日
Arxiv
6+阅读 · 2018年7月9日
Arxiv
7+阅读 · 2018年1月24日
Arxiv
11+阅读 · 2018年1月18日
Arxiv
5+阅读 · 2016年10月24日
VIP会员
相关论文
Meta-Learning to Cluster
Arxiv
17+阅读 · 2019年10月30日
Arxiv
6+阅读 · 2019年4月8日
Augmentation for small object detection
Arxiv
11+阅读 · 2019年2月19日
Arxiv
6+阅读 · 2018年7月9日
Arxiv
7+阅读 · 2018年1月24日
Arxiv
11+阅读 · 2018年1月18日
Arxiv
5+阅读 · 2016年10月24日
Top
微信扫码咨询专知VIP会员