面向对象的映射对于场景理解非常重要,因为它们共同捕获几何和语义,允许对对象进行单独的实例化和有意义的推理。我们介绍了FroDO,这是一种从RGB视频中精确重建物体实例的方法,它以一种由粗到细的方式推断出物体的位置、姿态和形状。FroDO的关键是将对象形状嵌入到一个新的学习空间中,允许在稀疏点云和稠密DeepSDF解码之间进行无缝切换。给定一个局部的RGB帧的输入序列,FroDO首先聚合2D检测,为每个对象实例化一个分类感知的3D包围框。在利用稀疏和稠密形状表示进一步优化形状和姿态之前,使用编码器网络对形状代码进行回归。优化使用多视图几何,光度和剪影损失。我们对真实世界的数据集进行评估,包括Pix3D、Redwood-OS和ScanNet,用于单视图、多视图和多对象重建。

成为VIP会员查看完整内容
33

相关内容

CVPR is the premier annual computer vision event comprising the main conference and several co-located workshops and short courses. With its high quality and low cost, it provides an exceptional value for students, academics and industry researchers. CVPR 2020 will take place at The Washington State Convention Center in Seattle, WA, from June 16 to June 20, 2020. http://cvpr2020.thecvf.com/
【泡泡点云时空】基于分割方法的物体六维姿态估计
泡泡机器人SLAM
18+阅读 · 2019年9月15日
已删除
将门创投
8+阅读 · 2019年6月13日
理解 YOLO 目标检测
AI研习社
22+阅读 · 2018年11月5日
Arxiv
12+阅读 · 2019年1月24日
VIP会员
相关资讯
【泡泡点云时空】基于分割方法的物体六维姿态估计
泡泡机器人SLAM
18+阅读 · 2019年9月15日
已删除
将门创投
8+阅读 · 2019年6月13日
理解 YOLO 目标检测
AI研习社
22+阅读 · 2018年11月5日
微信扫码咨询专知VIP会员