3D shape reconstruction from a single image has been a long-standing problem in computer vision. Recent advances have led to 3D representation learning, wherein pixel-aligned 3D reconstruction methods show impressive performance. However, it is normally hard to exploit meaningful local image features to describe 3D point samplings from the aligned pixels when large variations of occlusions, views, and appearances exist. In this paper, we study a general kernel to encode local image features with considering geometric relationships of point samplings from the underlying surfaces. The kernel is derived from the proposed spatial pattern, in a way the kernel points are obtained as the 2D projections of a number of 3D pattern points around a sampling. Supported by the spatial pattern, the 2D kernel encodes geometric information that is essential for 3D reconstruction tasks, while traditional 2D kernels mainly consider appearance information. Furthermore, to enable the network to discover more adaptive spatial patterns for further capturing non-local contextual information, the spatial pattern is devised to be deformable. Experimental results on both synthetic datasets and real datasets demonstrate the superiority of the proposed method.


翻译:从单一图像重建 3D 形状一直是计算机视觉中长期存在的一个问题。 最近的进步导致3D 代表学习, 其中像素匹配 3D 重建方法显示了令人印象深刻的性能。 然而,通常很难利用有意义的本地图像特征来描述对齐像素的3D点抽样, 因为在3D 重建任务中存在巨大的分层、 视图和外观的变异。 在本文中, 我们研究一个一般内核, 将本地图像特征编码为考虑到从底层取样的几何关系。 内核来自拟议的空间模式, 以获得2D 样点作为取样周围若干 3D 模式点的预测。 在空间模式的支持下, 2D 内核编码了对 3D 重建任务至关重要的几何信息, 而传统的 2D 内核主要考虑外观信息 。 此外, 为使网络能够发现更适应性更强的空间模式, 以进一步获取非本地背景信息, 空间模式的设计是可变的。 合成数据集和真实数据集的实验结果显示了拟议方法的优越性。

0
下载
关闭预览

相关内容

专知会员服务
19+阅读 · 2021年4月1日
Capsule Networks,胶囊网络,57页ppt,布法罗大学
专知会员服务
67+阅读 · 2020年2月29日
计算机视觉最佳实践、代码示例和相关文档
专知会员服务
17+阅读 · 2019年10月9日
AAAI2020 图相关论文集
图与推荐
10+阅读 · 2020年7月15日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
视频超分辨 Detail-revealing Deep Video Super-resolution 论文笔记
统计学习与视觉计算组
17+阅读 · 2018年3月16日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Learning Implicit Fields for Generative Shape Modeling
Arxiv
10+阅读 · 2018年12月6日
VIP会员
相关VIP内容
专知会员服务
19+阅读 · 2021年4月1日
Capsule Networks,胶囊网络,57页ppt,布法罗大学
专知会员服务
67+阅读 · 2020年2月29日
计算机视觉最佳实践、代码示例和相关文档
专知会员服务
17+阅读 · 2019年10月9日
Top
微信扫码咨询专知VIP会员