计算机视觉方向简介 | 从全景图恢复三维结构

2017 年 12 月 26 日 计算机视觉life sixgod

   坚持原创,点击上方蓝字,关注


本公众号计划推出一系列计算机视觉细分方向的简要介绍,包括基本原理、效果、应用、论文,不涉及技术细节,敬请关注,也欢迎投稿(simiter@126.com)。


有什么用?

2017年初,整个全景相机产业经历了一轮小爆发。除了像Insta 360、德图等几家创业公司外,小米、努比亚等几家传统手机厂商在2017年4月份也相继发布了自己的消费级全景相机,紧接着,Facebook、Google互联网巨头也相继发布了自己的第2代专业级全景相机。详情参考《全景相机哪家强?》。到目前为止,市面上已有几十种消费级全景相机产品。全景相机的价格也逐渐趋向平民化。


全景相机硬件在快速发展,但是拍摄的全景图除了传统的自拍、VR影视制作外,还缺乏更多实用的应用场景。本文介绍的就是全景图在室内三维结构方面的应用:用单张室内全景图来对室内场景进行三维结构恢复。


什么原理?

输入:一张水平方向360°(不要求垂直方向180°)的全景室内图片。


输出:无需人工交互,自动输出室内的三维结构(由线段和超像素面片组成)。


算法流程示意图如下所示:


(a) 是输入的室内全景图。可以从互联网上下载或者自己使用全景相机拍摄。

(b) 从全景图中提取的线段。红绿蓝不同颜色线段表示该线段属于不同的三维空间坐标轴方向。

(c) 全景图经过超像素过分割的结果。图中纯红色部分表示水平方向的平面,如地面或者天花板;条纹状的红色区域表示垂直的平面,如墙壁。

(d) 根据以上信息自动推断出的全景图对应的深度图。

(e) 由线段(黑色线条)和超像素面片重建的室内三维结构(两个不同视角)。


算法流程示意图


算法的核心是构建一个约束图结构,图的顶点由不同自由度的有向线段和超像素构成,而它们之间的几何关系构成约束图的边。通过迭代优化约束图结构可以推断出全景图对应的深度图,然后根据深度图信息将线段和超像素面进行空间重建从而得到室内的三维结构。


效果怎么样?

从视觉效果来看,该算法在室内环境简单(如曼哈顿结构、障碍物少,墙壁边界明显)的场景下效果还不错,如下:


较好的效果示例


但是在某些复杂室内环境下,很容易受到室内物体的误导,比如长沙发大面积遮挡住了墙壁和地面的分界线,比如墙壁和地面颜色接近导致分界线不明显,比如室内墙壁的大幅的挂画会被误认为是门外场景。部分恢复失败的例子如下图所示:


失败案例


运行速度:


作者提供了C++代码,在配置为Intel Core i5 CPU (3.1/3.3GHz)的电脑上,一张全景图推断出室内三维结构(不包括预处理步骤)时间需要1分钟。


有什么参考资料?

论文:

Yang H, Zhang H. Efficient 3D Room Shape Recovery from a Single Panorama[C]// Computer Vision and Pattern Recognition. IEEE, 2016:5422-5430.


项目主页:

包含源码、数据集、论文等资料。地址:http://cgcad.thss.tsinghua.edu.cn/yanghao/3droom/


注:原创不易,转载请注明来源,侵权必究。

登录查看更多
3

相关内容

计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
深度学习可解释性研究进展
专知会员服务
96+阅读 · 2020年6月26日
基于视觉的三维重建关键技术研究综述
专知会员服务
154+阅读 · 2020年5月1日
3D目标检测进展综述
专知会员服务
187+阅读 · 2020年4月24日
【CVPR2020】图神经网络中的几何原理连接
专知会员服务
56+阅读 · 2020年4月8日
计算机视觉方向简介 | 多视角立体视觉MVS
计算机视觉life
14+阅读 · 2019年10月10日
计算机视觉方向简介 | 视觉惯性里程计(VIO)
计算机视觉life
63+阅读 · 2019年6月16日
计算机视觉方向简介 | 三维重建技术概述
计算机视觉life
25+阅读 · 2019年6月13日
计算机视觉方向简介 | 基于单目视觉的三维重建算法
计算机视觉life
30+阅读 · 2019年4月9日
超像素、语义分割、实例分割、全景分割 傻傻分不清?
计算机视觉life
19+阅读 · 2018年11月27日
计算机视觉方向简介 | 室内场景的结构化重建
计算机视觉life
8+阅读 · 2018年11月13日
计算机视觉方向简介 | 单目微运动生成深度图
计算机视觉life
7+阅读 · 2018年1月17日
计算机视觉方向简介 | 阵列相机立体全景拼接
计算机视觉life
6+阅读 · 2018年1月3日
干货|全景视频拼接的关键技术分析
全球人工智能
13+阅读 · 2017年7月15日
Arxiv
5+阅读 · 2019年6月5日
Arxiv
6+阅读 · 2018年11月29日
Arxiv
6+阅读 · 2018年4月4日
Arxiv
7+阅读 · 2018年1月21日
Arxiv
5+阅读 · 2018年1月17日
VIP会员
相关资讯
计算机视觉方向简介 | 多视角立体视觉MVS
计算机视觉life
14+阅读 · 2019年10月10日
计算机视觉方向简介 | 视觉惯性里程计(VIO)
计算机视觉life
63+阅读 · 2019年6月16日
计算机视觉方向简介 | 三维重建技术概述
计算机视觉life
25+阅读 · 2019年6月13日
计算机视觉方向简介 | 基于单目视觉的三维重建算法
计算机视觉life
30+阅读 · 2019年4月9日
超像素、语义分割、实例分割、全景分割 傻傻分不清?
计算机视觉life
19+阅读 · 2018年11月27日
计算机视觉方向简介 | 室内场景的结构化重建
计算机视觉life
8+阅读 · 2018年11月13日
计算机视觉方向简介 | 单目微运动生成深度图
计算机视觉life
7+阅读 · 2018年1月17日
计算机视觉方向简介 | 阵列相机立体全景拼接
计算机视觉life
6+阅读 · 2018年1月3日
干货|全景视频拼接的关键技术分析
全球人工智能
13+阅读 · 2017年7月15日
相关论文
Arxiv
5+阅读 · 2019年6月5日
Arxiv
6+阅读 · 2018年11月29日
Arxiv
6+阅读 · 2018年4月4日
Arxiv
7+阅读 · 2018年1月21日
Arxiv
5+阅读 · 2018年1月17日
Top
微信扫码咨询专知VIP会员