We propose an efficient multi-view stereo (MVS) network for infering depth value from multiple RGB images. Recent studies have shown that mapping the geometric relationship in real space to neural network is an essential topic of the MVS problem. Specifically, these methods focus on how to express the correspondence between different views by constructing a nice cost volume. In this paper, we propose a more complete cost volume construction approach based on absorbing previous experience. First of all, we introduce the self-attention mechanism to fully aggregate the dominant information from input images and accurately model the long-range dependency, so as to selectively aggregate reference features. Secondly, we introduce the group-wise correlation to feature aggregation, which greatly reduces the memory and calculation burden. Meanwhile, this method enhances the information interaction between different feature channels. With this approach, a more lightweight and efficient cost volume is constructed. Finally we follow the coarse to fine strategy and refine the depth sampling range scale by scale with the help of uncertainty estimation. We further combine the previous steps to get the attention thin volume. Quantitative and qualitative experiments are presented to demonstrate the performance of our model.


翻译:我们建议建立一个高效的多视图立体(MVS)网络,从多个 RGB 图像中推断深度值。最近的研究表明,测绘实际空间的几何关系与神经网络的几何关系是MVS问题的一个基本主题。具体地说,这些方法侧重于如何通过构建一个高成本体积来表达不同观点之间的对应关系。在本文中,我们建议基于吸收以往经验的更完整的成本量构建方法。首先,我们引入自我注意机制,充分汇总输入图像中的主要信息,准确模拟长距离依赖性,以便有选择地综合参考特征。第二,我们引入群集的群集相关性,这极大地减少了记忆和计算负担。与此同时,这一方法加强了不同特征渠道之间的信息互动。用这种方法构建了一个更轻、更高效的成本量。最后,我们遵循粗略的策略,并根据不确定性估计来改进深度取样范围。我们进一步整合了先前的步骤,以吸引对薄体积的注意。我们介绍了定量和定性实验,以展示模型的性能。

0
下载
关闭预览

相关内容

《计算机信息》杂志发表高质量的论文,扩大了运筹学和计算的范围,寻求有关理论、方法、实验、系统和应用方面的原创研究论文、新颖的调查和教程论文,以及描述新的和有用的软件工具的论文。官网链接:https://pubsonline.informs.org/journal/ijoc
专知会员服务
22+阅读 · 2021年9月20日
专知会员服务
50+阅读 · 2021年8月8日
[WWW2021]图结构估计神经网络
专知会员服务
42+阅读 · 2021年3月29日
Attention最新进展
极市平台
5+阅读 · 2020年5月30日
模式国重实验室21篇论文入选CVPR 2020
专知
30+阅读 · 2020年3月8日
【泡泡汇总】CVPR2019 SLAM Paperlist
泡泡机器人SLAM
14+阅读 · 2019年6月12日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
CVPR2019 | Stereo R-CNN 3D 目标检测
极市平台
27+阅读 · 2019年3月10日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
《pyramid Attention Network for Semantic Segmentation》
统计学习与视觉计算组
44+阅读 · 2018年8月30日
计算机视觉近一年进展综述
机器学习研究会
9+阅读 · 2017年11月25日
VIP会员
相关VIP内容
专知会员服务
22+阅读 · 2021年9月20日
专知会员服务
50+阅读 · 2021年8月8日
[WWW2021]图结构估计神经网络
专知会员服务
42+阅读 · 2021年3月29日
相关资讯
Attention最新进展
极市平台
5+阅读 · 2020年5月30日
模式国重实验室21篇论文入选CVPR 2020
专知
30+阅读 · 2020年3月8日
【泡泡汇总】CVPR2019 SLAM Paperlist
泡泡机器人SLAM
14+阅读 · 2019年6月12日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
CVPR2019 | Stereo R-CNN 3D 目标检测
极市平台
27+阅读 · 2019年3月10日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
《pyramid Attention Network for Semantic Segmentation》
统计学习与视觉计算组
44+阅读 · 2018年8月30日
计算机视觉近一年进展综述
机器学习研究会
9+阅读 · 2017年11月25日
Top
微信扫码咨询专知VIP会员