开放词汇3D物体检测最近因其在自动驾驶和机器人领域的广泛应用而受到广泛关注,旨在有效识别之前未见过的新类别。然而,现有的基于点云的开放词汇3D检测模型受限于高昂的部署成本。在本研究中,我们提出了一种新颖的开放词汇单目3D物体检测框架,称为OVM3D-Det,该框架仅使用RGB图像训练检测器,使其在成本效益和可扩展性方面具有优势,并能够利用公开数据。与传统方法不同,OVM3D-Det不需要高精度的LiDAR或3D传感器数据作为输入,也不需要用于生成3D边界框。相反,它采用开放词汇的2D模型和伪LiDAR自动标注RGB图像中的3D物体,促进了开放词汇单目3D检测器的学习。然而,直接使用伪LiDAR生成的标签训练3D模型是不够的,因为从噪声点云中估计的边界框往往不精确,且严重遮挡的物体会进一步影响效果。为了解决这些问题,我们提出了两项创新设计:自适应伪LiDAR侵蚀和基于大语言模型的先验知识进行的边界框精细调整。这些技术有效地校准了3D标签,并使得仅用RGB图像进行3D检测器训练成为可能。大量实验表明,OVM3D-Det在室内和室外场景中均优于基线方法。代码将公开发布。

成为VIP会员查看完整内容
1

相关内容

【NeurIPS2023】跨情境课程设计的Transformer智能体
专知会员服务
25+阅读 · 2023年10月14日
【ECCV2022】对比视觉Transformer的在线持续学习
专知会员服务
21+阅读 · 2022年7月29日
【AAAI2022】混合课程学习对话情绪识别
专知会员服务
26+阅读 · 2021年12月24日
【KDD2020】图神经网络生成式预训练
专知
22+阅读 · 2020年7月3日
【CVPR 2020 Oral】小样本类增量学习
专知
16+阅读 · 2020年6月26日
NLP命名实体识别开源实战教程 | 深度应用
AI100
15+阅读 · 2019年8月18日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
37+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Arxiv
157+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
399+阅读 · 2023年3月31日
Arxiv
66+阅读 · 2023年3月26日
Arxiv
20+阅读 · 2023年3月17日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
37+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员