【泡泡一分钟】ScanNet:一个室内场景三维重建标注数据集(CVPR-22)

2017 年 11 月 30 日 泡泡机器人SLAM 李仕杰

每天一分钟,带你读遍机器人顶级会议文章


标题:ScanNet: Richly-annotated 3D Reconstructions of Indoor Scenes

作者:Angela Dai, Angel X. Chang, Manolis Savva, Maciej Halber, Thomas Funkhouser, Matthias Nießner

来源:CVPR 2017 

编译:李仕杰

播音员:王肃

欢迎个人转发朋友圈;其他机构或自媒体如需转载,后台留言申请授权



 

摘要


今天介绍的文章是ScanNet: Richly-annotated 3D Reconstructions of Indoor Scenes ——ScanNet:一个室内场景三维重建标注数据集,该文章发表在CVPR 2017。


影响有监督深度学习方法的一个关键因素是大量标注的数据集。然而,在RGB-D场景理解这一问题上,现今的数据集只包含了一小部分场景和非常有限的标注。


为了解决这一问题,我们引入了一个RGB-D视频数据集ScanNet。ScanNet包含1513个场景中的2.5M张图片。与此同时ScanNet还提供了相机位姿,平面重建和语义分割的标注。为了获得这些数据,我们设计了一个易于使用的RGB-D采集系统来进行平面重建和语义分割标注的工作。


我们的结果表明使用ScanNet在一些3D场景理解的任务上取得了非常好的结果。包括3D物体分类,voxel的语义分割和CAD模型的搜索

    

  

如果你对本文感兴趣,想要下载完整文章进行阅读,可以关注【泡泡机器人SLAM】公众号(paopaorobot_slam)


回复关键字“ScanNet”,即可获取本文下载链接。

泡泡机器人SLAM的原创内容均由泡泡机器人的成员花费大量心血制作而成,希望大家珍惜我们的劳动成果,转载请务必注明出自【泡泡机器人SLAM】微信公众号,否则侵权必究!同时,我们也欢迎各位转载到自己的朋友圈,让更多的人能进入到SLAM这个领域中,让我们共同为推进中国的SLAM事业而努力!

商业合作及转载请联系liufuqiang_robot@hotmail.com




登录查看更多
45

相关内容

在计算机视觉中, 三维重建是指根据单视图或者多视图的图像重建三维信息的过程. 由于单视频的信息不完全,因此三维重建需要利用经验知识. 而多视图的三维重建(类似人的双目定位)相对比较容易, 其方法是先对摄像机进行标定, 即计算出摄像机的图象坐标系与世界坐标系的关系.然后利用多个二维图象中的信息重建出三维信息。 物体三维重建是计算机辅助几何设计(CAGD)、计算机图形学(CG)、计算机动画、计算机视觉、医学图像处理、科学计算和虚拟现实、数字媒体创作等领域的共性科学问题和核心技术。在计算机内生成物体三维表示主要有两类方法。一类是使用几何建模软件通过人机交互生成人为控制下的物体三维几何模型,另一类是通过一定的手段获取真实物体的几何形状。前者实现技术已经十分成熟,现有若干软件支持,比如:3DMAX、Maya、AutoCAD、UG等等,它们一般使用具有数学表达式的曲线曲面表示几何形状。后者一般称为三维重建过程,三维重建是指利用二维投影恢复物体三维信息(形状等)的数学过程和计算机技术,包括数据获取、预处理、点云拼接和特征分析等步骤。
3D目标检测进展综述
专知会员服务
193+阅读 · 2020年4月24日
CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络
专知会员服务
44+阅读 · 2020年4月17日
【泡泡一分钟】学习高分辨率的3D数据表示(CVPR-25)
泡泡机器人SLAM
4+阅读 · 2017年12月11日
【泡泡一分钟】基于紧凑模型表示的三维重建(3dv-12)
泡泡机器人SLAM
10+阅读 · 2017年12月7日
【泡泡一分钟】重新认识SfM (CVPR-6)
泡泡机器人SLAM
22+阅读 · 2017年10月20日
Real-time Scalable Dense Surfel Mapping
Arxiv
5+阅读 · 2019年9月10日
Structure Aware SLAM using Quadrics and Planes
Arxiv
4+阅读 · 2018年8月13日
VIP会员
相关资讯
Top
微信扫码咨询专知VIP会员