干货 | CCCV 2017讲习班笔记-基于图像的大规模场景三维重建(下)

2017 年 11 月 13 日 AI科技评论 究竟灰

AI科技评论按,本文作者究竟灰,本文首发于知乎,AI科技评论获其授权转载。

AI科技评论注:本文为下篇,内容为第三章:稠密重建第四章:稠密重建。第一章和第二章参见CCCV2017讲习班笔记-基于图像的大规模场景三维重建(上)

3.稠密匹配

稠密匹配是MVS.基本思路是:

两视图的一致性。

一致性度量主要包括三个:

  1. SSD(Sum of Squared Differences):平常差的和

  2. SAD(Sum of Absolute Differences):绝对值差的和

  3. NCC(Normalized Cross Correlation):归一化的交叉关系

多视图图像一致性需要考虑相机的可视性问题。

但是:相机可视性需要场景结构、场景结构需要相机可视性

MVS算法主要分为三种:

  1. 基于体素的方法:Voxel based MVS

  2. 基于点云扩散的方法:Feature point growing based MVS

  3. 基于深度图融合的方法:Depth-map merging based MVS

基于体素的方法

体素的表达,并且说明其MVS等价于一个3D空间Voxel的标记问题。

优化方法:用马尔科夫随机场优化。

离散空间的Labeling是典型的MRF优化问题。其中的两项分别是一致性项和气球膨胀。

一致性项表达两点一致。气球膨胀表达的是强制倾向于把点分成内点。因为如果不加气球膨胀,一致性项会把点都分成外点,所以要加一个反向的力量。

两视图一致性计算:

其中如何鲁棒投票寻找局部极值集中的点很重要。

MRF优化问题求解:Graph-cuts

重建结果:

体素问题是占内存,即使很小的体素也要很大内存。于是提出以下方法,主要思路是自适应多分辨率网格,在物体表面高分辨率、其他区域低分辨率。

基于体素方法MVS的并行分布Graph-cuts

基于体素方法的优缺点:

基于特征点扩散的MVS

方法顾名思义。

讲了3D点的Patch形式表达。patch在图像上有投影。

步骤:

  1. 生成初始点云:检测Harris与DoG,其中Harris偏向检测外侧的角点,而DoG偏向于检测内部纹理丰富的点

  2. 点云扩散:3D点投影到图像,并向投影点周围区域扩散

  3. 点云过滤:去除深度值不一致且一致性较低的点,意思是如果扩散的点云在其他图特征点的点云前面了,通过比较各自的一致性来剔除;如果扩散点云跑到后边去了,也比较一致性。这样就能去除深度值不一致且一致性较低的点了。

结果:

优缺点:

基于深度图融合的MVS

人的左右眼的立体视觉和深度图。

转到CV

基于深度图融合的MVS方法步骤:

  1. 为每一幅图选择领域图像构成立体图像组:关键如何选择邻域图像组

  2. 计算每一幅图像的深度图:关键如何计算深度图

  3. 深度图融合

  4. 抽取物体表面

每一幅图中的深度图计算:

聚合:对比了SAD聚合和Adaptive weight

对比:

这里讲了Oriented plane方法,估计空间平面方向

空间平面方向估计PathMatch,相机坐标系下空间面片表达为d深度的一个自由度,n法向量的两个自由度。

接着讲了两视图PathMatch Stereo,先随机申城像素深度和法向量,然后传播。

主要用了随机的思想,检测领域点的深度和法向量,检测加了扰动之后的点,检测立体图像对对应点是否更好,检测前后帧同一位置是否更好。反复几次。

这种方法是基于大数定律的。

多视图PathMatch MVS:

多视图PathMatch中领域图像组的选择:视线夹角、物距、覆盖度、分散度等。主要通过稀疏点云计算。领域图像组选择是一个NP-hard问题。

逐像素点领域选择:

通过EM算法来做逐像素点选择领域图像组(最大化后验概率)

基于深度图融合的MVS优缺点:

稠密重建总结

4.资源

主要是算法、数据集和应用

AI科技评论编辑整理


—————  AI 科技评论招人啦!  —————

我们诚招学术编辑 1 名(全职,坐标北京)

你即将从事的工作内容:

  • 报道海内外人工智能相关学术会议,形成具有影响力的报道内容;

  • 采访高校学术青年领袖,输出人工智能领域的深度观点;

  • 跟进国内外学术热点,深入剖析学术动态;

我们希望你是这样的小伙伴:

  • 英语好,有阅读英文科技网站的习惯;

  • 兴趣广,对人工智能有关注及了解;

  • 态度佳,有求知欲,善于学习;

欢迎发送简历到 guoyixin@leiphone.com

—————  给爱学习的你的福利  —————

不要等到算法出现accuracy不好、loss很高、模型overfitting时,

才后悔没有掌握基础数学理论!

线性代数及矩阵论, 概率论与统计, 凸优化

AI慕课学院机器学习之数学基础课程即将上线!

扫码进入课程咨询群,组队享团购优惠!

详细了解点击文末阅读原文

————————————————————

登录查看更多
13

相关内容

在计算机视觉中, 三维重建是指根据单视图或者多视图的图像重建三维信息的过程. 由于单视频的信息不完全,因此三维重建需要利用经验知识. 而多视图的三维重建(类似人的双目定位)相对比较容易, 其方法是先对摄像机进行标定, 即计算出摄像机的图象坐标系与世界坐标系的关系.然后利用多个二维图象中的信息重建出三维信息。 物体三维重建是计算机辅助几何设计(CAGD)、计算机图形学(CG)、计算机动画、计算机视觉、医学图像处理、科学计算和虚拟现实、数字媒体创作等领域的共性科学问题和核心技术。在计算机内生成物体三维表示主要有两类方法。一类是使用几何建模软件通过人机交互生成人为控制下的物体三维几何模型,另一类是通过一定的手段获取真实物体的几何形状。前者实现技术已经十分成熟,现有若干软件支持,比如:3DMAX、Maya、AutoCAD、UG等等,它们一般使用具有数学表达式的曲线曲面表示几何形状。后者一般称为三维重建过程,三维重建是指利用二维投影恢复物体三维信息(形状等)的数学过程和计算机技术,包括数据获取、预处理、点云拼接和特征分析等步骤。
【CMU】基于图神经网络的联合检测与多目标跟踪
专知会员服务
56+阅读 · 2020年6月24日
基于视觉的三维重建关键技术研究综述
专知会员服务
160+阅读 · 2020年5月1日
【天津大学】风格线条画生成技术综述
专知会员服务
31+阅读 · 2020年4月26日
基于深度神经网络的少样本学习综述
专知会员服务
169+阅读 · 2020年4月22日
计算机视觉方向简介 | 多视角立体视觉MVS
计算机视觉life
14+阅读 · 2019年10月10日
已删除
将门创投
5+阅读 · 2019年9月10日
ICCV2019 | 高精度,高效率点云三维重建 PointMVSNet
计算机视觉life
23+阅读 · 2019年9月5日
基于几何特征的激光雷达地面点云分割
泡泡机器人SLAM
15+阅读 · 2018年4月1日
基于图像的场景三维建模
计算机视觉战队
13+阅读 · 2018年3月17日
计算机视觉方向简介 | 单目微运动生成深度图
计算机视觉life
7+阅读 · 2018年1月17日
Angular-Based Word Meta-Embedding Learning
Arxiv
3+阅读 · 2018年8月13日
Arxiv
7+阅读 · 2018年3月22日
VIP会员
相关资讯
计算机视觉方向简介 | 多视角立体视觉MVS
计算机视觉life
14+阅读 · 2019年10月10日
已删除
将门创投
5+阅读 · 2019年9月10日
ICCV2019 | 高精度,高效率点云三维重建 PointMVSNet
计算机视觉life
23+阅读 · 2019年9月5日
基于几何特征的激光雷达地面点云分割
泡泡机器人SLAM
15+阅读 · 2018年4月1日
基于图像的场景三维建模
计算机视觉战队
13+阅读 · 2018年3月17日
计算机视觉方向简介 | 单目微运动生成深度图
计算机视觉life
7+阅读 · 2018年1月17日
Top
微信扫码咨询专知VIP会员