会员服务 ·

0

CVPR2019 | R-MVSNet: 一个高精度高效率的三维重建网络

2019 年 3 月 21 日 极市平台

加入极市专业CV交流群，与6000+来自腾讯，华为，百度，北大，清华，中科院等名企名校视觉开发者互动交流！更有机会与李开复老师等大牛群内互动！

同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总，行业技术交流。点击文末“阅读原文”立刻申请入群~

ps.CVPR2019 accepted list已经放出，极市已将目前收集到的公开论文总结到github上（目前已收集212篇），后续会不断更新，欢迎关注，也欢迎大家提交自己的论文：

https://github.com/extreme-assistant/cvpr2019

今日分享一篇CVPR2019论文，本文提出了R-MVSNet——一个高精度高效率的三维重建网络。

作者 | flow

来源 | 计算机视觉life

本文授权转自计算机视觉Life，未经允许不得二次转载。

1. 导读

目标读者：对MVS（multi-view stereo，多视几何）问题感兴趣的人群。MVS旨在利用多张影像（影像及对应的相机几何）恢复出三维场景。
论文作者：香港科技大学和深圳Altizure公司的研究团队。
简介：该团队于2018年提出了一个高精度高效率的三维重建网络 —— MVSNet，被ECCV2018选为Oral。而今针对原MVSNet由于过于耗费内存而难以应用到大尺度场景的问题，提出了“R-MVSNet”（Recurrent MVSNet），该网络在原MVSNet的基础上进行改进，引入循环神经网络架构，可依序地在深度方向通过GRU单元正则化2D的代价图，较大程度地缓解了内存消耗，进而使大尺度的三维场景重建成为可能，该文章已被CVPR2019接收。

2. MVSNet回顾

由于R-MVSNet是在原MVSNet上进行的改进，故对MVSNet进行回顾有一定必要性。

MVSNet网络架构如图一所示：

图一：MVSNet网络架构

输入进网络的多视影像首先经由2D的特征提取层以及可微的单应矩阵变换以构建代价量，再经由三维卷积网络的优化得到三维概率空间，最后基于参考影像进行进一步优化。

MVSNet主要贡献在于：

通过可微单应矩阵（Differentiable Homography）将相机几何嵌入到网络，以帮助实现端到端的深度神经网络。
设计了基于方差的多视匹配代价计算准则，将任意数量的像素特征向量映射为一个匹配代价向量，以帮助网络适用于不定数量的图像输入。

3. R-MVSNet介绍

R-MVSNet相较于MVSNet，引入了循环神经网络架构，依序地在深度方向通过GRU单元正则化2D的代价图，以减少内存消耗进而使其适用于大尺度的三维场景重建。

MVSNet网络架构如图二所示：

图二：R-MVSNet网络架构

输入的多视影像首先经由2D的特征提取层提取特征，经由可微的单应矩阵变换到参考影像的相机视锥体的正面平行面上，然后在不同深度计算代价，并经由卷积的GRU单元进行正则化，使在深度方向获取几何和单向的语义信息成为可能。该网络将问题视为分类问题，以交叉熵作为损失函数。

在完整的三维重建的流程中，除去R-MVSNet所担任的生成深度图的模块，其他非学习的模块还包括预处理，深度图优化，深度图滤波与融合。

4. 实验及结果

网络在DTU数据集上进行训练，实现框架为tensorflow。

测试数据集有DTU，Tanks and Temples，ETH3D( 图二：数据集具体结介绍见论文 )。

在DTU数据集上进行测试的定量结果图如图三所示，结果表明就重建的完整性和整体的质量而言该方法优于其他的方法。重建效果如图四所示。

图三：以DTU为测试集的定量结果

图四：在DTU数据中Scan23和Scan10上的重建结果及Groud Truth

R-MVSNet和MVSNet在各测试数据集上的表现对比如图五所示，结果表明R-MVSNet的表现明显优于MVSNet，成倍地减小了内存消耗，可处理更大尺度的三维场景。

图五：R-MVSNet与MVSNet在各测试数据集上的表现对比。

5. 论文及代码链接

论文链接：
https://arxiv.org/abs/1902.10556

代码链接：
https://github.com/YoYo000/MVSNet

*延伸阅读

ECCV2018论文Express | 单幅RGB图像整体三维场景解析与重建（附原文下载）

SkeletonNet：完整的人体三维位姿重建方法

小Tips：如何查看和检索历史文章？

有不少小伙伴提问如何号内搜文章，其实很简单，在“极市平台”公众号后台菜单点击极市干货-历史文章，或直接搜索“极市平台”公众号查看全部消息，即可在如下搜索框查找往期文章哦~

ps.可以输入CVPR2019/目标检测/语义分割等等，快去探索宝藏吧~~

点击左下角“阅读原文”，即可申请加入极市目标跟踪、目标检测、工业检测、人脸方向、视觉竞赛等技术交流群，更有每月大咖直播分享、真实项目需求对接、干货资讯汇总，行业技术交流，一起来让思想之光照的更远吧~

觉得有用麻烦给个好看啦~

登录查看更多

3

相关内容

CVPR2019

【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型

【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型

专知会员服务

26+阅读 · 2020年5月7日

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

专知会员服务

45+阅读 · 2020年4月17日

【CVPR 2020 Oral-北大华为】只用加法的神经网络，重磅开源

【CVPR 2020 Oral-北大华为】只用加法的神经网络，重磅开源

专知会员服务

31+阅读 · 2020年4月6日

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

专知会员服务

39+阅读 · 2020年4月6日

【FAIR-CVPR2020】PIFuHD:多级像素对齐隐式功能，实现高分辨率三维人体数字化

【FAIR-CVPR2020】PIFuHD:多级像素对齐隐式功能，实现高分辨率三维人体数字化

专知会员服务

29+阅读 · 2020年4月5日

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

专知会员服务

25+阅读 · 2020年4月2日

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

专知会员服务

27+阅读 · 2020年3月24日

姿势服装随心换-CVPR2019

姿势服装随心换-CVPR2019

专知会员服务

36+阅读 · 2020年1月26日

【CGAN论文笔记强烈推荐】基于CGAN的人脸深度图估计： Face Depth Estimation With Conditional Generative Adversarial Networks

专知会员服务

24+阅读 · 2020年1月8日

【深度估计| 2019最新综述】单目深度估计方法综述（Monocular Depth Estimation: A Survey）

专知会员服务

69+阅读 · 2019年11月23日

已删除

将门创投

5+阅读 · 2019年9月10日

【泡泡点云时空】StereoDRNet：基于扩张卷积的双目残差网络

【泡泡点云时空】StereoDRNet：基于扩张卷积的双目残差网络

泡泡机器人SLAM

13+阅读 · 2019年9月8日

ICCV2019 | 高精度，高效率点云三维重建 PointMVSNet

ICCV2019 | 高精度，高效率点云三维重建 PointMVSNet

计算机视觉life

23+阅读 · 2019年9月5日

极市直播|董峻廷：多视角下多人三维姿态估计（CVPR2019，已开源）

极市直播|董峻廷：多视角下多人三维姿态估计（CVPR2019，已开源）

极市平台

5+阅读 · 2019年6月9日

CVPR2019 | 港中文&腾讯优图等提出：暗光下的图像增强

CVPR2019 | 港中文&腾讯优图等提出：暗光下的图像增强

极市平台

15+阅读 · 2019年6月5日

CVPR2019 | 行人检测新思路：高级语义特征检测取得精度新突破

CVPR2019 | 行人检测新思路：高级语义特征检测取得精度新突破

极市平台

7+阅读 · 2019年4月10日

CVPR2018 | Decoupled Networks

CVPR2018 | Decoupled Networks

极市平台

4+阅读 · 2019年3月22日

CVPR2019无人驾驶相关论文

CVPR2019无人驾驶相关论文

极市平台

21+阅读 · 2019年3月20日

公开课|腾讯优图高级研究员张润泽：基于图像的大规模三维重建

公开课|腾讯优图高级研究员张润泽：基于图像的大规模三维重建

计算机视觉life

19+阅读 · 2018年12月27日

【泡泡点云时空】Hand PointNet：基于点集的三维手势估计（CVPR2018-15）

【泡泡点云时空】Hand PointNet：基于点集的三维手势估计（CVPR2018-15）

泡泡机器人SLAM

8+阅读 · 2018年9月24日

Mesh R-CNN

Arxiv

4+阅读 · 2019年6月6日

Efficient Tracking Proposals using 2D-3D Siamese Networks on LIDAR

Arxiv

4+阅读 · 2019年3月25日

Residual Non-local Attention Networks for Image Restoration

Arxiv

9+阅读 · 2019年3月24日

Sparse2Dense: From direct sparse odometry to dense 3D reconstruction

Sparse2Dense: From direct sparse odometry to dense 3D reconstruction

Arxiv

9+阅读 · 2019年3月21日

Recurrent MVSNet for High-resolution Multi-view Stereo Depth Inference

Recurrent MVSNet for High-resolution Multi-view Stereo Depth Inference

Arxiv

4+阅读 · 2019年2月27日

Monocular Total Capture: Posing Face, Body, and Hands in the Wild

Monocular Total Capture: Posing Face, Body, and Hands in the Wild

Arxiv

4+阅读 · 2018年12月4日

W-net: Bridged U-net for 2D Medical Image Segmentation

W-net: Bridged U-net for 2D Medical Image Segmentation

Arxiv

20+阅读 · 2018年7月12日

Non-rigid Object Tracking via Deep Multi-scale Spatial-Temporal Discriminative Saliency Maps

Arxiv

5+阅读 · 2018年2月22日

DeblurGAN: Blind Motion Deblurring Using Conditional Adversarial Networks

Arxiv

9+阅读 · 2018年1月16日

2D-3D Pose Consistency-based Conditional Random Fields for 3D Human Pose Estimation

Arxiv

3+阅读 · 2017年12月28日

VIP会员

相关主题

相关VIP内容

【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型

【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型

专知会员服务

26+阅读 · 2020年5月7日

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

专知会员服务

45+阅读 · 2020年4月17日

【CVPR 2020 Oral-北大华为】只用加法的神经网络，重磅开源

【CVPR 2020 Oral-北大华为】只用加法的神经网络，重磅开源

专知会员服务

31+阅读 · 2020年4月6日

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

专知会员服务

39+阅读 · 2020年4月6日

【FAIR-CVPR2020】PIFuHD:多级像素对齐隐式功能，实现高分辨率三维人体数字化

【FAIR-CVPR2020】PIFuHD:多级像素对齐隐式功能，实现高分辨率三维人体数字化

专知会员服务

29+阅读 · 2020年4月5日

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

专知会员服务

25+阅读 · 2020年4月2日

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

专知会员服务

27+阅读 · 2020年3月24日

姿势服装随心换-CVPR2019

姿势服装随心换-CVPR2019

专知会员服务

36+阅读 · 2020年1月26日

【CGAN论文笔记强烈推荐】基于CGAN的人脸深度图估计： Face Depth Estimation With Conditional Generative Adversarial Networks

专知会员服务

24+阅读 · 2020年1月8日

【深度估计| 2019最新综述】单目深度估计方法综述（Monocular Depth Estimation: A Survey）

专知会员服务

69+阅读 · 2019年11月23日

热门VIP内容

开通专知VIP会员享更多权益服务

《美国海军陆战队软件定义网络应用案例：分布式防火墙自动化系统》148页

《多体环境下定位导航授时（PNT）系统研究》228页

软件定义无线电（SDR）：商业与军事领域的技术、应用及未来趋势

《攻势防空作战中无人追击者/规避者最优轨迹研究（含动态交战区建模）》95页

相关资讯

已删除

将门创投

5+阅读 · 2019年9月10日

【泡泡点云时空】StereoDRNet：基于扩张卷积的双目残差网络

【泡泡点云时空】StereoDRNet：基于扩张卷积的双目残差网络

泡泡机器人SLAM

13+阅读 · 2019年9月8日

ICCV2019 | 高精度，高效率点云三维重建 PointMVSNet

ICCV2019 | 高精度，高效率点云三维重建 PointMVSNet

计算机视觉life

23+阅读 · 2019年9月5日

极市直播|董峻廷：多视角下多人三维姿态估计（CVPR2019，已开源）

极市直播|董峻廷：多视角下多人三维姿态估计（CVPR2019，已开源）

极市平台

5+阅读 · 2019年6月9日

CVPR2019 | 港中文&腾讯优图等提出：暗光下的图像增强

CVPR2019 | 港中文&腾讯优图等提出：暗光下的图像增强

极市平台

15+阅读 · 2019年6月5日

CVPR2019 | 行人检测新思路：高级语义特征检测取得精度新突破

CVPR2019 | 行人检测新思路：高级语义特征检测取得精度新突破

极市平台

7+阅读 · 2019年4月10日

CVPR2018 | Decoupled Networks

CVPR2018 | Decoupled Networks

极市平台

4+阅读 · 2019年3月22日

CVPR2019无人驾驶相关论文

CVPR2019无人驾驶相关论文

极市平台

21+阅读 · 2019年3月20日

公开课|腾讯优图高级研究员张润泽：基于图像的大规模三维重建

公开课|腾讯优图高级研究员张润泽：基于图像的大规模三维重建

计算机视觉life

19+阅读 · 2018年12月27日

【泡泡点云时空】Hand PointNet：基于点集的三维手势估计（CVPR2018-15）

【泡泡点云时空】Hand PointNet：基于点集的三维手势估计（CVPR2018-15）

泡泡机器人SLAM

8+阅读 · 2018年9月24日

相关论文

Mesh R-CNN

Arxiv

4+阅读 · 2019年6月6日

Efficient Tracking Proposals using 2D-3D Siamese Networks on LIDAR

Arxiv

4+阅读 · 2019年3月25日

Residual Non-local Attention Networks for Image Restoration

Arxiv

9+阅读 · 2019年3月24日

Sparse2Dense: From direct sparse odometry to dense 3D reconstruction

Sparse2Dense: From direct sparse odometry to dense 3D reconstruction

Arxiv

9+阅读 · 2019年3月21日

Recurrent MVSNet for High-resolution Multi-view Stereo Depth Inference

Recurrent MVSNet for High-resolution Multi-view Stereo Depth Inference

Arxiv

4+阅读 · 2019年2月27日

Monocular Total Capture: Posing Face, Body, and Hands in the Wild

Monocular Total Capture: Posing Face, Body, and Hands in the Wild

Arxiv

4+阅读 · 2018年12月4日

W-net: Bridged U-net for 2D Medical Image Segmentation

W-net: Bridged U-net for 2D Medical Image Segmentation

Arxiv

20+阅读 · 2018年7月12日

Non-rigid Object Tracking via Deep Multi-scale Spatial-Temporal Discriminative Saliency Maps

Arxiv

5+阅读 · 2018年2月22日

DeblurGAN: Blind Motion Deblurring Using Conditional Adversarial Networks

Arxiv

9+阅读 · 2018年1月16日

2D-3D Pose Consistency-based Conditional Random Fields for 3D Human Pose Estimation

Arxiv

3+阅读 · 2017年12月28日

大家都在搜

CMU博士论文

无人机集群

久别重逢话双塔

OpenKG开源系列 | 海洋鱼类百科知识图谱（浙江大学）

微信扫码咨询专知VIP会员