北大陈宝权课题组SIGGRAPH 19:多机器人协同三维场景重建

2019 年 6 月 10 日 新智元



  新智元推荐  

来源:北京大学前沿计算研究中心(ID:pku-cfcs)

整理编辑:三石

【新智元导读】本文是北京大学陈宝权课题组联合山东大学等单位将在SIGGRAPH 2019宣读的论文的解读。以室内大规模场景的扫描和重建为目标,提出了基于最优质量传输理论的多机器人协同探索并重建未知室内场景模型的算法。


从机器人领域的移动导航、动作规划和物体抓取等经典问题,到虚拟现实、增强现实和混合现实等图形技术,都离不开对真实场景的三维建模。


随着近几年以微软Kinect、英特尔RealSense等为代表的消费级RGB-D相机的普及,三维重建领域正经历着一场“文艺复兴”。


三维重建涉及计算机图形学、计算机视觉和机器人等多个领域,旨在采集真实世界中的彩色图像和深度图像,并以此重建出真实场景的三维模型。


相比于传统的激光或雷达扫描重建,近几年RGB-D相机扫描(拍照)的重建算法(如KinectFusion、VoxelHashing)近几年取得了巨大进展。


VoxelHashing大规模场景重建


目前的三维重建算法为场景建模带来了很多便利,但是仍存在很多问题。


比如,即使是使用最先进的扫描重建算法,仍然需要训练有素的专业扫描人员执行扫描过程,算法的使用对普通用户并不友好。


这是因为当前实时算法之所以能做到实时响应,是因为其做了很多假设,例如要求扫描设备的移动足够平滑甚至是匀速,要求被扫描物体的表面有明显的纹理或者几何特征。


因此,普通用户扫描过程中,经常会面临算法失败的问题。即使是专业扫描人员,在扫描过程中需要保持合适的移动速度和扫描朝向,这也是枯燥且繁重的工作。


主动式扫描和场景分析


于是,近年来越来越多使用机器人代替人来做扫描重建的工作问世。从单个物体到室内房间,这些工作使用机器人携带扫描设备,根据重建实时反馈,指导机器人扫描并建模。


相关工作


陈宝权老师带领的Visual Computing and Learning 课题组近几年发表了一些使用机器人做主动式扫描和建模的工作。


主动式扫描的现有工作在对于单个物体、房间或公寓等场景的扫描都取得了不错的效果。于是,使用更多机器人进行大规模场景的扫描重建是一个重要的拓展方向。


主动式扫描和物体识别


群体智能是机器人领域的一个重要研究方向。目前已经有一些针对机器人协同合作的研究工作,大部分这些工作研究重点在于机器人之间的坐标定位和导航。也有一些工作基于贪心策略、MTSP(多旅行商问题)和区域分割等算法设计策略指导多个机器人协同工作,虽然取得了一些进展,但是在场景复杂、机器人数量较多情况下其难求解,缺乏灵活性,并没有达到预期的效果。


我们的方法


以室内大规模场景的扫描和重建为目标,我们提出了基于最优质量传输理论(Optimal Mass Transport)的多机器人协同探索并重建未知室内场景模型的算法。


(该论文题为《Multi-Robot Collaborative Dense Scene Reconstruction》,由北京大学客座学生董思言、周强与国防科技大学徐凯副教授,以及谷歌和慕尼黑工业大学等单位学者合作,由前沿计算研究中心执行主任陈宝权教授指导完成。)


最优质量传输理论其实大家都不陌生,最经典的例子是土豆的供给和需求问题,假设有若干地区(下图蓝色)供给土豆,若干地区(下图桔色)需求土豆,不同地区直接运输土豆的代价不同, 那么如何找出这样一个规划,使得所有需求地区都能得到满足其需求的土豆数量,且总的运输代价最低,这就是一个简单的最优质量传输模型。


最优质量传输的例子


最优质量传输理论就是为了研究这类优化问题而提出,其目标是求出两个分布(或者说集合)之间的映射关系,使得该映射在给定的度量下代价最低。


在机器人扫描重建问题中,我们可以把机器人看作是扫描的供给方,未知环境看作是扫描的需求方,而机器人实际执行扫描任务所需要的代价(如移动距离)作为映射的度量。


以此为基础,我们通过求解最优质量传输,就可以得到机器人和扫描任务之间的映射,使扫描代价最低。


机器人扫描的最优质量传输


机器人的空间位置分布可以直接作为扫描的供给分布。那么,如何度量未知环境对扫描的需求分布呢?


首先,所有的未知区域都属于扫描的需求分布,它们需要得到机器人的扫描和重建。


另外,在扫描过程中,对于已扫描和重建的部分区域,我们沿袭最经典的三维重建方法KinectFusion中对扫描重建模型质量的评估方式,如果质量没有达到目标,那么我们把这些区域也加入扫描的需求分布中,这样我们得到了原始的需求分布。


由于扫描任务受扫描视角的影响,我们进一步推算出能扫描覆盖需求分布的最佳扫描视角,这些扫描视角也就是接下来机器人的扫描任务,这些扫描视角的空间分布也就是最终的需求分布。


分析重建结果推算扫描视角作


接下来是对扫描代价度量的研究。


如果一个机器人只映射到了需求分布中的一个扫描任务,我们可以简单地使用机器人到任务的最优路径长度作为其扫描代价;如果一个机器人映射到了多个扫描任务,那么我们使用机器人与这些任务构成的TSP(旅行商问题)路径长度作为其代价。


这样,我们就把多机器人扫描问题公式化成为了最优质量传输模型。在求解优化目标时,TSP的离散性给我们优化问题的求解带来了困难,于是我们进一步研究目标函数近似求解的方法,最终使用基于聚类思想的方法求解,得到了不错的效果。


随着扫描的进行,场景会不断被探索重建,这个过程中最优质量传输的求解也会随之更新,直到完整的场景被高质量地重建出来。


随场景更新而重新计算最优质量传输


我们的结果


我们在模拟器中使用Matterport3D与SUNCG数据集对算法进行了测试,取得了不错的效果。


Matterport3D (上图) 与 SUNCG (下图) 数据集测试结果


同时,我们也在五院的几个房间使用Turtlebot机器人做了真机实验。下面是我们重建的结果。


五院几个房间扫描重建结果


总结


我们提出了一种多个机器人协同扫描的理论和算法。基于最优质量传输理论,使用分而治之的策略,驱动多个机器人高效地探索扫描室内大规模场景,并重建其三维模型。


附:关于SIGGRAPH

SIGGRAPH (Special Interest Group on Computer GRAPHics and Interactive Techniques) 是计算机领域规模最大的顶级会议、CCF A类会议,参加人数达2万余人,每年收录百余篇图形学相关的优秀论文,是计算机图形领域集技术、艺术与展览于一体的盛会。SIGGRAPH 2019将于2019年7月28日-8月1日在美国洛杉矶举行。


本文经授权转载自微信公众号“北京大学前沿计算研究中心”,ID:pku-cfcs


新智元春季招聘开启,一起弄潮 AI 之巅!

岗位详情请戳:


【加入社群】


新智元 AI 技术 + 产业社群招募中,欢迎对 AI 技术 + 产业落地感兴趣的同学,加小助手微信号:aiera2015_2   入群;通过审核后我们将邀请进群,加入社群后务必修改群备注(姓名 - 公司 - 职位;专业群审核较严,敬请谅解)。

登录查看更多
1

相关内容

陈宝权,山东大学计算科学与技术学院与软件学院院长、国家“万人计划”领军人才,长江特聘教授,兼中国科学院深圳先进技术研究院研究员,博士生导师。获电子工程学士(91年西安电子科技大学)、硕士(94 年清华大 学),和计算机科学博士(99 年纽约州立大学石溪分校)。研究领域为计算机图形学与可视化,主要研究方向为基于车载移动激光扫描的大规模城市场景三维建模及海量数据可视化,入选973项目“城市大数据计算理论与方法”首席科学家。在 ACM SIGGRAPH 、 IEEE VIS、ACM TOG等国际会议和刊物发表论文 100 余篇。现任ACM Transactions on Graphics(TOG)编委,并多次任图形与可视化领域几乎所有重要国际会议的PC成员;现任SIGGRAPH ASIA 2014会议主席、SIGGRAPH ASIA指导委员会委员、和IEEE VIS指导委员会委员;曾任IEEE 可视化会议 2005 年主席和 2004 年程序委员会主席。获 2003 美国 NSF CAREER Award, 2005 年 IEEE可视化国际会议最佳论文奖;2008 年入选中科院“百人计划”; 2010 年获国家杰出青年科学基金资助;2013年入选国家“百千万人才”工程计划和“中青年领军人才”,2014年获得"中国计算机图形学大会杰出奖"。任CCF(中国计算机学会)常务理事,第七届教育部科技委信息学部委员,曾任CCF青工委主任。
基于视觉的三维重建关键技术研究综述
专知会员服务
154+阅读 · 2020年5月1日
【人大】图实现算法综述与评测分析
专知会员服务
37+阅读 · 2020年4月28日
3D目标检测进展综述
专知会员服务
187+阅读 · 2020年4月24日
专知会员服务
84+阅读 · 2019年12月13日
基于Siamese网络的多视角三维人脸重建
计算机视觉战队
5+阅读 · 2019年11月28日
3D重建:硬派几何求解vs深度学习打天下?
机器之心
5+阅读 · 2019年7月8日
MaskFusion: 多运动目标实时识别、跟踪和重建
计算机视觉life
11+阅读 · 2019年4月20日
已删除
将门创投
8+阅读 · 2019年1月4日
计算机视觉方向简介 | 室内场景的结构化重建
计算机视觉life
8+阅读 · 2018年11月13日
基于图像的场景三维建模
计算机视觉战队
13+阅读 · 2018年3月17日
Learning Implicit Fields for Generative Shape Modeling
Arxiv
10+阅读 · 2018年12月6日
Arxiv
4+阅读 · 2018年4月30日
Arxiv
4+阅读 · 2017年11月4日
VIP会员
相关资讯
基于Siamese网络的多视角三维人脸重建
计算机视觉战队
5+阅读 · 2019年11月28日
3D重建:硬派几何求解vs深度学习打天下?
机器之心
5+阅读 · 2019年7月8日
MaskFusion: 多运动目标实时识别、跟踪和重建
计算机视觉life
11+阅读 · 2019年4月20日
已删除
将门创投
8+阅读 · 2019年1月4日
计算机视觉方向简介 | 室内场景的结构化重建
计算机视觉life
8+阅读 · 2018年11月13日
基于图像的场景三维建模
计算机视觉战队
13+阅读 · 2018年3月17日
Top
微信扫码咨询专知VIP会员