Despite recent progress in 3D self-supervised learning, collecting large-scale 3D scene scans remains expensive and labor-intensive. In this work, we investigate whether 3D representations can be learned from unlabeled videos recorded without any real 3D sensors. We present Laplacian-Aware Multi-level 3D Clustering with Sinkhorn-Knopp (LAM3C), a self-supervised framework that learns from video-generated point clouds from unlabeled videos. We first introduce RoomTours, a video-generated point cloud dataset constructed by collecting room-walkthrough videos from the web (e.g., real-estate tours) and generating 49,219 scenes using an off-the-shelf feed-forward reconstruction model. We also propose a noise-regularized loss that stabilizes representation learning by enforcing local geometric smoothness and ensuring feature stability under noisy point clouds. Remarkably, without using any real 3D scans, LAM3C achieves higher performance than the previous self-supervised methods on indoor semantic and instance segmentation. These results suggest that unlabeled videos represent an abundant source of data for 3D self-supervised learning.


翻译:尽管三维自监督学习近期取得了进展,但大规模三维场景扫描数据的采集仍然昂贵且劳动密集。本工作中,我们探究了是否能够从无任何真实三维传感器记录的未标注视频中学习三维表示。我们提出了拉普拉斯感知多级三维聚类与Sinkhorn-Knopp算法(LAM3C),这是一个从视频生成点云中学习的自监督框架,其输入为未标注视频。我们首先介绍了RoomTours数据集,这是一个通过收集网络上的房间漫游视频(例如房地产导览视频)并使用现成的前馈重建模型生成49,219个场景而构建的视频生成点云数据集。我们还提出了一种噪声正则化损失,该损失通过强制局部几何平滑性并确保特征在噪声点云下的稳定性,从而稳定表示学习。值得注意的是,在未使用任何真实三维扫描数据的情况下,LAM3C在室内语义分割和实例分割任务上取得了优于先前自监督方法的性能。这些结果表明,未标注视频是三维自监督学习的丰富数据源。

0
下载
关闭预览

相关内容

【CVPR2024】ViewDiff: 3D一致的图像生成与文本到图像模型
专知会员服务
30+阅读 · 2024年3月10日
AAAI 2022 | ProtGNN:自解释图神经网络
专知
10+阅读 · 2022年2月28日
图机器学习 2.2-2.4 Properties of Networks, Random Graph
图与推荐
10+阅读 · 2020年3月28日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员