VALSE 论文速览第08期：基于单张图像的三维场景重建 - 专知

会员服务 ·

0

VALSE 论文速览第08期：基于单张图像的三维场景重建

2021 年 8 月 17 日 VALSE

为了使得视觉与学习领域相关从业者快速及时地了解领域的最新发展动态和前沿技术进展，VALSE最新推出了《论文速览》栏目，将在每周二和周五各发布一篇顶会顶刊论文的录制视频，对单个前沿工作进行细致讲解。本期VALSE论文速览选取了来自阿德莱德大学和Adobe Research的三维场景重建方面工作。该工作由沈春华教授和Jianming Zhang, Oliver Wang等高级研究员指导，尹炜同学录制，将为大家呈现单目场景重建最前沿的进展。

论文题目：基于单张图像的三维场景重建

作者列表：尹炜 (阿德莱德大学)、Jianming Zhang (Adobe Research)、Oliver Wang (Adobe Research)、Simon Niklaus (Adobe Research)、Long Mai (Adobe Research)、Simon Chen (Adobe Research)、沈春华 (阿德莱德大学)

B站观看网址：

https://www.bilibili.com/video/BV1S64y1e7qD/

复制链接到浏览器打开或点击阅读原文即可跳转至观看页面。

论文摘要：

单目深度估计以及场景三维重建旨在从一张输入图像重建出场景的深度信息以及3D结构。尽管最新的工作在单目深度估计的泛化性方面取得了重大进展，但由于在混合数据训练中使用的仿射不变性的深度估计，会引起未知深度的偏移，使得获取的深度无法用于恢复准确的 3D 场景形状。并且当相机焦距未知时，也无法进行准确的重建。我们详细研究了这个问题，并提出了一个两阶段框架，首先从单目图像中预测放射不变性的深度，然后使用 3D点云网络来预测缺失的深度偏移和焦距，这使我们能够恢复逼真的 3D 场景形状。此外，我们提出了基于单张图像的归一化回归代价函数和配对点的法矢量的回归代价函数，以提升在混合数据集上训练的深度预测精度。我们在 9 个未见过的数据集上测试了深度模型，在零样本数据集泛化上实现了最好的性能。本文入选了CVPR 2021的口头报告，并获得了CVPR2021最佳论文奖提名。

论文信息：

[1] Wei Yin, Jianming Zhang, Oliver Wang, Simon Niklaus, Long Mai, Simon Chen, Chunhua Shen,“ Learning to Recover 3D Scene Shape from a Single Image,” in Proceeding of IEEE Computer Vision and Pattern Recognition (CVPR), June 2021.

论文链接：

[https://arxiv.org/abs/2012.09365]

视频讲者简介：

尹炜，阿德莱德大学计算机系三年级博士生。研究兴趣包括零样本迁移学习，场景深度估计，场景语义理解。在CVPR，ICCV，AAAI, TPAMI等国际会议和期刊上发表多篇论文，并在ICCV，CVPR，TRO等国际会议和期刊上担任审稿人。

看到这了，确定不关注下吗？关注下再走吧～

特别鸣谢本次论文速览主要组织者：

月度轮值AC：王栋 (大连理工大学)、王鹤 (北京大学)

季度责任AC：王兴刚 (华中科技大学)

活动参与方式

1、VALSE每周举行的Webinar活动依托B站直播平台进行，直播地址：https://live.bilibili.com/22300737；VALSE的近期历史视频可在这里观看：https://space.bilibili.com/562085182/

2、VALSE Webinar活动通常每周三晚上20:00进行，但偶尔会因为讲者时区问题略有调整，为方便您参加活动，请关注VALSE微信公众号：valse_wechat 或加入VALSE QQ Q群，群号：698303207）；

*注：申请加入VALSE QQ群时需验证姓名、单位和身份，缺一不可。入群后，请实名，姓名身份单位。身份：学校及科研单位人员T；企业研发I；博士D；硕士M。

3. VALSE微信公众号一般会在每周四发布下一周Webinar报告的通知。

4、您也可以通过访问VALSE主页：http://valser.org/ 直接查看Webinar活动信息。Webinar报告的PPT（经讲者允许后），会在VALSE官网每期报告通知的最下方更新。

登录查看更多

2

相关内容

三维场景

【博士论文】基于深度学习的单目场景深度估计方法研究

【博士论文】基于深度学习的单目场景深度估计方法研究

专知会员服务

56+阅读 · 2021年12月8日

【ICCV 2021】HCFlow：使用一个统一的框架处理图像超分辨率和图像再缩放

专知会员服务

15+阅读 · 2021年10月4日

三维视觉前沿进展

专知会员服务

67+阅读 · 2021年5月21日

【CVPR2021】基于跨任务场景结构知识迁移的单张深度图像超分辨率方法

专知会员服务

18+阅读 · 2021年3月23日

近期必读的9篇 CVPR 2019【视觉目标跟踪】相关论文和代码

近期必读的9篇 CVPR 2019【视觉目标跟踪】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

VALSE 论文速览第55期：PyMAF：基于多尺度网格对齐反馈机制的三维人体模型重建

VALSE 论文速览第55期：PyMAF：基于多尺度网格对齐反馈机制的三维人体模型重建

VALSE

0+阅读 · 2022年3月9日

VALSE 论文速览第30期：基于并行解码的端到端密集视频描述

VALSE 论文速览第30期：基于并行解码的端到端密集视频描述

VALSE

0+阅读 · 2021年12月1日

VALSE 论文速览第29期：通过观察镜中人来重建三维人体姿态

VALSE 论文速览第29期：通过观察镜中人来重建三维人体姿态

VALSE

0+阅读 · 2021年11月26日

VALSE 论文速览第15期：图像超分辨率中的稀疏性及高效推理

VALSE 论文速览第15期：图像超分辨率中的稀疏性及高效推理

VALSE

1+阅读 · 2021年9月17日

VALSE 论文速览第01期：NeuralRecon: 基于单目视频的实时三维场景重建

VALSE 论文速览第01期：NeuralRecon: 基于单目视频的实时三维场景重建

VALSE

2+阅读 · 2021年7月20日

基于概率图谱引导的群组自适应时序脑MR图像脑提取方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于立体视觉的动态在体软组织表面三维运动跟踪研究

国家自然科学基金

2+阅读 · 2013年12月31日

面向3D-TOF相机的高质量深度图像重建方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于小框架的pMRI图像重建研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于单张低精度深度图的实时精确三维曲面重建

国家自然科学基金

0+阅读 · 2012年12月31日

SPTS: Single-Point Text Spotting

Arxiv

0+阅读 · 2022年4月20日

A Dynamic 3D Spontaneous Micro-expression Database: Establishment and Evaluation

Arxiv

0+阅读 · 2022年4月20日

Semi-supervised 3D shape segmentation with multilevel consistency and part substitution

Arxiv

0+阅读 · 2022年4月19日

End-to-end Weakly-supervised Multiple 3D Hand Mesh Reconstruction from Single Image

Arxiv

0+阅读 · 2022年4月18日

Deep Generative Modelling: A Comparative Review of VAEs, GANs, Normalizing Flows, Energy-Based and Autoregressive Models

Arxiv

13+阅读 · 2021年3月8日

VIP会员

相关主题

单目深度估计

相关VIP内容

【博士论文】基于深度学习的单目场景深度估计方法研究

【博士论文】基于深度学习的单目场景深度估计方法研究

专知会员服务

56+阅读 · 2021年12月8日

【ICCV 2021】HCFlow：使用一个统一的框架处理图像超分辨率和图像再缩放

专知会员服务

15+阅读 · 2021年10月4日

三维视觉前沿进展

专知会员服务

67+阅读 · 2021年5月21日

【CVPR2021】基于跨任务场景结构知识迁移的单张深度图像超分辨率方法

专知会员服务

18+阅读 · 2021年3月23日

近期必读的9篇 CVPR 2019【视觉目标跟踪】相关论文和代码

近期必读的9篇 CVPR 2019【视觉目标跟踪】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

热门VIP内容

开通专知VIP会员享更多权益服务

【斯坦福博士论文】数据、决策与过度依赖：构建可信人工智能的核心挑战

《多域时代中维持弹性军事训练：挑战与机遇》

【AAAI2026】专家数量何为最优？面向混合专家模型的语义专业化优化研究

自进化人工智能体的全面综述：连接基础模型与终身自主智能系统的新范式

相关资讯

VALSE 论文速览第55期：PyMAF：基于多尺度网格对齐反馈机制的三维人体模型重建

VALSE 论文速览第55期：PyMAF：基于多尺度网格对齐反馈机制的三维人体模型重建

VALSE

0+阅读 · 2022年3月9日

VALSE 论文速览第30期：基于并行解码的端到端密集视频描述

VALSE 论文速览第30期：基于并行解码的端到端密集视频描述

VALSE

0+阅读 · 2021年12月1日

VALSE 论文速览第29期：通过观察镜中人来重建三维人体姿态

VALSE 论文速览第29期：通过观察镜中人来重建三维人体姿态

VALSE

0+阅读 · 2021年11月26日

VALSE 论文速览第15期：图像超分辨率中的稀疏性及高效推理

VALSE 论文速览第15期：图像超分辨率中的稀疏性及高效推理

VALSE

1+阅读 · 2021年9月17日

VALSE 论文速览第01期：NeuralRecon: 基于单目视频的实时三维场景重建

VALSE 论文速览第01期：NeuralRecon: 基于单目视频的实时三维场景重建

VALSE

2+阅读 · 2021年7月20日

相关基金

基于概率图谱引导的群组自适应时序脑MR图像脑提取方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于立体视觉的动态在体软组织表面三维运动跟踪研究

国家自然科学基金

2+阅读 · 2013年12月31日

面向3D-TOF相机的高质量深度图像重建方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于小框架的pMRI图像重建研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于单张低精度深度图的实时精确三维曲面重建

国家自然科学基金

0+阅读 · 2012年12月31日

相关论文

SPTS: Single-Point Text Spotting

Arxiv

0+阅读 · 2022年4月20日

A Dynamic 3D Spontaneous Micro-expression Database: Establishment and Evaluation

Arxiv

0+阅读 · 2022年4月20日

Semi-supervised 3D shape segmentation with multilevel consistency and part substitution

Arxiv

0+阅读 · 2022年4月19日

End-to-end Weakly-supervised Multiple 3D Hand Mesh Reconstruction from Single Image

Arxiv

0+阅读 · 2022年4月18日

Deep Generative Modelling: A Comparative Review of VAEs, GANs, Normalizing Flows, Energy-Based and Autoregressive Models

Arxiv

13+阅读 · 2021年3月8日

大家都在搜

大型语言模型

蓝牙安全攻防

网易严选S级大促

【泡泡读者来搞】ROS、Simulink、Carsim的互联与规划、控制算法的验证

微信扫码咨询专知VIP会员