激光雷达和相机是自动驾驶中可用于3D语义分割的两种模态。由于激光点不足,流行的仅用激光雷达的方法在小而远的目标上存在严重的分割问题,而鲁棒的多模态解决方案尚未得到充分探索,**本文研究了三个关键的内在困难:模态异质性、有限的传感器视场交叉点和多模态数据增强。为此,提出一种联合模态内特征提取和模态间特征融合的多模态3D语义分割模型(MSeg3D)。**MSeg3D中的多模态融合包括所有可见点上基于几何的特征融合GF-Phase、跨模态的特征补全和基于语义的特征融合SF-Phase。通过对LiDAR点云和多相机图像分别应用非对称变换来重新激活多模态数据增强,这有利于通过多样化的增强变换进行模型训练。MSeg3D在nuScenes, Waymo和SemanticKITTI数据集上取得了最先进的结果。在故障多摄像机输入和多帧点云输入下,MSeg3D仍然表现出鲁棒性,并改善了LiDARonly基线。我们的代码通过https: //github.com/jialeli1/lidarseg3d公开。

成为VIP会员查看完整内容
15

相关内容

CVPR 2023大会将于 6 月 18 日至 22 日在温哥华会议中心举行。CVPR是IEEE Conference on Computer Vision and Pattern Recognition的缩写,即IEEE国际计算机视觉与模式识别会议。该会议是由IEEE举办的计算机视觉和模式识别领域的顶级会议,会议的主要内容是计算机视觉与模式识别技术。 CVPR 2023 共收到 9155 份提交,比去年增加了 12%,创下新纪录,今年接收了 2360 篇论文,接收率为 25.78%。作为对比,去年有 8100 多篇有效投稿,大会接收了 2067 篇,接收率为 25%。
【CVPR2023】基于文本驱动软掩码的多模态表示学习
专知会员服务
20+阅读 · 2023年4月10日
【CVPR2023】基于混合融合的多模态工业异常检测
专知会员服务
44+阅读 · 2023年3月6日
【CVPR2023】基础模型驱动弱增量学习的语义分割
专知会员服务
17+阅读 · 2023年3月2日
【CVPR2022】多视图聚合的大规模三维语义分割
专知会员服务
20+阅读 · 2022年4月20日
专知会员服务
15+阅读 · 2021年10月4日
专知会员服务
20+阅读 · 2021年7月28日
MonoGRNet:单目3D目标检测的通用框架(TPAMI2021)
专知会员服务
17+阅读 · 2021年5月3日
数据集|ALITA:用于自动驾驶的大规模增量数据集
极市平台
3+阅读 · 2022年6月27日
BEVFormer:基于Transformer的自动驾驶BEV纯视觉感知
CVPR 2022 | 元学习在图像回归任务的表现
PaperWeekly
1+阅读 · 2022年6月11日
综述 | 激光与视觉融合SLAM
计算机视觉life
18+阅读 · 2020年10月8日
【泡泡一分钟】变化环境下激光地图辅助视觉惯性定位
泡泡机器人SLAM
15+阅读 · 2019年5月22日
现在开源的RGB-D SLAM有哪些?
计算机视觉life
30+阅读 · 2019年5月8日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
VIP会员
相关VIP内容
【CVPR2023】基于文本驱动软掩码的多模态表示学习
专知会员服务
20+阅读 · 2023年4月10日
【CVPR2023】基于混合融合的多模态工业异常检测
专知会员服务
44+阅读 · 2023年3月6日
【CVPR2023】基础模型驱动弱增量学习的语义分割
专知会员服务
17+阅读 · 2023年3月2日
【CVPR2022】多视图聚合的大规模三维语义分割
专知会员服务
20+阅读 · 2022年4月20日
专知会员服务
15+阅读 · 2021年10月4日
专知会员服务
20+阅读 · 2021年7月28日
MonoGRNet:单目3D目标检测的通用框架(TPAMI2021)
专知会员服务
17+阅读 · 2021年5月3日
相关资讯
数据集|ALITA:用于自动驾驶的大规模增量数据集
极市平台
3+阅读 · 2022年6月27日
BEVFormer:基于Transformer的自动驾驶BEV纯视觉感知
CVPR 2022 | 元学习在图像回归任务的表现
PaperWeekly
1+阅读 · 2022年6月11日
综述 | 激光与视觉融合SLAM
计算机视觉life
18+阅读 · 2020年10月8日
【泡泡一分钟】变化环境下激光地图辅助视觉惯性定位
泡泡机器人SLAM
15+阅读 · 2019年5月22日
现在开源的RGB-D SLAM有哪些?
计算机视觉life
30+阅读 · 2019年5月8日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员