Homography estimation is an important task in computer vision, such as image stitching, video stabilization, and camera calibration. Traditional homography estimation methods heavily depend on the quantity and distribution of feature points, leading to poor robustness in textureless scenes. The learning solutions, on the contrary, try to learn robust deep features but demonstrate unsatisfying performance in the scenes of low overlap rates. In this paper, we address the two problems simultaneously, by designing a contextual correlation layer, which can capture the long-range correlation on feature maps and flexibly be bridged in a learning framework. In addition, considering that a single homography can not represent the complex spatial transformation in depth-varying images with parallax, we propose to predict multi-grid homography from global to local. Moreover, we equip our network with depth perception capability, by introducing a novel depth-aware shape-preserved loss. Extensive experiments demonstrate the superiority of our method over other state-of-the-art solutions in the synthetic benchmark dataset and real-world dataset. The codes and models will be available at https://github.com/nie-lang/Multi-Grid-Deep-Homogarphy.


翻译:在计算机视觉方面,如图像缝合、视频稳定、相机校准等,对同性恋进行估计是一项重要任务。传统的同系估计方法在很大程度上取决于特征点的数量和分布,导致无纹理场景的强度差。相反,学习的解决方案试图学习强健的深处特征,但在低重叠率的场景中表现出不满意的性能。在本文中,我们同时处理这两个问题,方法是设计一个相关关系层,能够捕捉地貌图上的长距离相关性,并在一个学习框架中灵活地连接。此外,考虑到单种同系无法代表用准光谱进行深度变化的图像的复杂空间变化,我们提议预测从全球到地方的多电网同系。此外,我们通过引入一种新型的深度观测形状预知损失,使我们的网络具备深度感知能力。广泛的实验表明,我们的方法优于合成基准数据集和现实世界数据集中的其他状态-艺术解决方案。代码和模型将在https://github.com/nie-lang/MG-Gri-hi-Iep-Hriev-Iep上提供。

1
下载
关闭预览

相关内容

专知会员服务
45+阅读 · 2020年10月31日
专知会员服务
110+阅读 · 2020年3月12日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
60+阅读 · 2019年10月17日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
LibRec 精选:AutoML for Contextual Bandits
LibRec智能推荐
7+阅读 · 2019年9月19日
逆强化学习-学习人先验的动机
CreateAMind
16+阅读 · 2019年1月18日
【NIPS2018】接收论文列表
专知
5+阅读 · 2018年9月10日
【ECCV2018】24篇论文代码实现
专知
17+阅读 · 2018年9月10日
视频超分辨 Detail-revealing Deep Video Super-resolution 论文笔记
统计学习与视觉计算组
17+阅读 · 2018年3月16日
可解释的CNN
CreateAMind
17+阅读 · 2017年10月5日
VIP会员
相关资讯
LibRec 精选:AutoML for Contextual Bandits
LibRec智能推荐
7+阅读 · 2019年9月19日
逆强化学习-学习人先验的动机
CreateAMind
16+阅读 · 2019年1月18日
【NIPS2018】接收论文列表
专知
5+阅读 · 2018年9月10日
【ECCV2018】24篇论文代码实现
专知
17+阅读 · 2018年9月10日
视频超分辨 Detail-revealing Deep Video Super-resolution 论文笔记
统计学习与视觉计算组
17+阅读 · 2018年3月16日
可解释的CNN
CreateAMind
17+阅读 · 2017年10月5日
Top
微信扫码咨询专知VIP会员