【CVPR2023】MSeg3D:面向自动驾驶的多模态3D语义分割 - 专知VIP

会员服务 ·

11

CVPR 2023 · MSeg3D · 自动驾驶 · 语义分割 ·

2023 年 3 月 17 日

【CVPR2023】MSeg3D:面向自动驾驶的多模态3D语义分割

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

激光雷达和相机是自动驾驶中可用于3D语义分割的两种模态。由于激光点不足，流行的仅用激光雷达的方法在小而远的目标上存在严重的分割问题，而鲁棒的多模态解决方案尚未得到充分探索，**本文研究了三个关键的内在困难:模态异质性、有限的传感器视场交叉点和多模态数据增强。为此，提出一种联合模态内特征提取和模态间特征融合的多模态3D语义分割模型(MSeg3D)。**MSeg3D中的多模态融合包括所有可见点上基于几何的特征融合GF-Phase、跨模态的特征补全和基于语义的特征融合SF-Phase。通过对LiDAR点云和多相机图像分别应用非对称变换来重新激活多模态数据增强，这有利于通过多样化的增强变换进行模型训练。MSeg3D在nuScenes, Waymo和SemanticKITTI数据集上取得了最先进的结果。在故障多摄像机输入和多帧点云输入下，MSeg3D仍然表现出鲁棒性，并改善了LiDARonly基线。我们的代码通过https: //github.com/jialeli1/lidarseg3d公开。

成为VIP会员查看完整内容

16

相关内容

CVPR 2023

CVPR 2023大会将于 6 月 18 日至 22 日在温哥华会议中心举行。CVPR是IEEE Conference on Computer Vision and Pattern Recognition的缩写，即IEEE国际计算机视觉与模式识别会议。该会议是由IEEE举办的计算机视觉和模式识别领域的顶级会议，会议的主要内容是计算机视觉与模式识别技术。 CVPR 2023 共收到 9155 份提交，比去年增加了 12%，创下新纪录，今年接收了 2360 篇论文，接收率为 25.78%。作为对比，去年有 8100 多篇有效投稿，大会接收了 2067 篇，接收率为 25%。

【CVPR2023】基于文本驱动软掩码的多模态表示学习

【CVPR2023】基于文本驱动软掩码的多模态表示学习

专知会员服务

21+阅读 · 2023年4月10日

【CVPR2023】基于混合融合的多模态工业异常检测

【CVPR2023】基于混合融合的多模态工业异常检测

专知会员服务

46+阅读 · 2023年3月6日

【CVPR2023】三维医学图像自监督预训练中的几何视觉相似性学习

【CVPR2023】三维医学图像自监督预训练中的几何视觉相似性学习

专知会员服务

32+阅读 · 2023年3月3日

【CVPR2023】基础模型驱动弱增量学习的语义分割

【CVPR2023】基础模型驱动弱增量学习的语义分割

专知会员服务

18+阅读 · 2023年3月2日

【CVPR2022】多视图聚合的大规模三维语义分割

【CVPR2022】多视图聚合的大规模三维语义分割

专知会员服务

21+阅读 · 2022年4月20日

【CVPR2022】CAT-Det:用于多模态三维物体检测的对比增强Transformer

【CVPR2022】CAT-Det:用于多模态三维物体检测的对比增强Transformer

专知会员服务

19+阅读 · 2022年4月7日

【CVPR 2022】单目3D语义场景完成框架，MonoScene: Monocular 3D Semantic Scene Completion

【CVPR 2022】单目3D语义场景完成框架，MonoScene: Monocular 3D Semantic Scene Completion

专知会员服务

15+阅读 · 2022年3月3日

【ICCV2021】模态视频表示的跨模态对比学习

专知会员服务

16+阅读 · 2021年10月4日

【ICCV2021】用于目标检测和实例分割的新损失函数

专知会员服务

22+阅读 · 2021年7月28日

MonoGRNet：单目3D目标检测的通用框架（TPAMI2021）

MonoGRNet：单目3D目标检测的通用框架（TPAMI2021）

专知会员服务

18+阅读 · 2021年5月3日

【AAAI2023】面向领域自适应语义分割的几何感知网络

【AAAI2023】面向领域自适应语义分割的几何感知网络

专知

8+阅读 · 2022年12月7日

ECCV22｜美团&上海交大开源PromptDet：无需手动标注，迈向开放词汇的目标检测

ECCV22｜美团&上海交大开源PromptDet：无需手动标注，迈向开放词汇的目标检测

极市平台

0+阅读 · 2022年7月31日

数据集｜ALITA:用于自动驾驶的大规模增量数据集

数据集｜ALITA:用于自动驾驶的大规模增量数据集

极市平台

3+阅读 · 2022年6月27日

BEVFormer：基于Transformer的自动驾驶BEV纯视觉感知

BEVFormer：基于Transformer的自动驾驶BEV纯视觉感知

PaperWeekly

1+阅读 · 2022年6月21日

CVPR 2022 | 元学习在图像回归任务的表现

CVPR 2022 | 元学习在图像回归任务的表现

PaperWeekly

1+阅读 · 2022年6月11日

综述 | 激光与视觉融合SLAM

综述 | 激光与视觉融合SLAM

计算机视觉life

18+阅读 · 2020年10月8日

【泡泡图灵智库】ContextDesc：用跨模态上下文增强的局部描述子

【泡泡图灵智库】ContextDesc：用跨模态上下文增强的局部描述子

泡泡机器人SLAM

34+阅读 · 2019年9月18日

【泡泡图灵智库】DenseFusion:基于迭代密集融合的6D目标姿态估计

【泡泡图灵智库】DenseFusion:基于迭代密集融合的6D目标姿态估计

泡泡机器人SLAM

16+阅读 · 2019年9月3日

【泡泡一分钟】变化环境下激光地图辅助视觉惯性定位

【泡泡一分钟】变化环境下激光地图辅助视觉惯性定位

泡泡机器人SLAM

15+阅读 · 2019年5月22日

现在开源的RGB-D SLAM有哪些?

现在开源的RGB-D SLAM有哪些?

计算机视觉life

31+阅读 · 2019年5月8日

面向遮挡条件下的人脸识别方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

三维空间中基于图结构的人体姿态估计算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

复杂场景下非合作目标鲁棒识别方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向金属板表面非完整信息目标的识别方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于先验知识的三维点云鲁棒处理技术研究

国家自然科学基金

1+阅读 · 2012年12月31日

面向多场景图像自适应的三维人脸建模研究

国家自然科学基金

0+阅读 · 2012年12月31日

弱监督条件下RGB-D时序图像的语义分割模型与迁移学习算法

国家自然科学基金

0+阅读 · 2012年12月31日

医学图像分割中面向目标的形状统计与边界特征学习

国家自然科学基金

3+阅读 · 2011年12月31日

基于超多视角成像的三维重建关键技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于3D视频的运动分割与3D运动估计

国家自然科学基金

1+阅读 · 2008年12月31日

Understanding why SLAM algorithms fail in modern indoor environments

Arxiv

0+阅读 · 2023年5月9日

RelPose++: Recovering 6D Poses from Sparse-view Observations

Arxiv

0+阅读 · 2023年5月8日

Self-supervised Learning for Pre-Training 3D Point Clouds: A Survey

Arxiv

5+阅读 · 2023年5月8日

A sensor fusion approach for improving implementation speed and accuracy of RTAB-Map algorithm based indoor 3D mapping

Arxiv

0+阅读 · 2023年5月8日

Improving 2D face recognition via fine-level facial depth generation and RGB-D complementary feature learning

Arxiv

0+阅读 · 2023年5月8日

Neural Voting Field for Camera-Space 3D Hand Pose Estimation

Arxiv

0+阅读 · 2023年5月7日

Learning Hybrid Actor-Critic Maps for 6D Non-Prehensile Manipulation

Arxiv

0+阅读 · 2023年5月6日

Understanding and Constructing Latent Modality Structures in Multi-modal Representation Learning

Arxiv

11+阅读 · 2023年3月10日

Recovering 3D Human Mesh from Monocular Images: A Survey

Arxiv

12+阅读 · 2022年3月8日

3D Hand Shape and Pose Estimation from a Single RGB Image

3D Hand Shape and Pose Estimation from a Single RGB Image

Arxiv

17+阅读 · 2019年3月3日

VIP会员

相关主题

相关VIP内容

【CVPR2023】基于文本驱动软掩码的多模态表示学习

【CVPR2023】基于文本驱动软掩码的多模态表示学习

专知会员服务

21+阅读 · 2023年4月10日

【CVPR2023】基于混合融合的多模态工业异常检测

【CVPR2023】基于混合融合的多模态工业异常检测

专知会员服务

46+阅读 · 2023年3月6日

【CVPR2023】三维医学图像自监督预训练中的几何视觉相似性学习

【CVPR2023】三维医学图像自监督预训练中的几何视觉相似性学习

专知会员服务

32+阅读 · 2023年3月3日

【CVPR2023】基础模型驱动弱增量学习的语义分割

【CVPR2023】基础模型驱动弱增量学习的语义分割

专知会员服务

18+阅读 · 2023年3月2日

【CVPR2022】多视图聚合的大规模三维语义分割

【CVPR2022】多视图聚合的大规模三维语义分割

专知会员服务

21+阅读 · 2022年4月20日

【CVPR2022】CAT-Det:用于多模态三维物体检测的对比增强Transformer

【CVPR2022】CAT-Det:用于多模态三维物体检测的对比增强Transformer

专知会员服务

19+阅读 · 2022年4月7日

【CVPR 2022】单目3D语义场景完成框架，MonoScene: Monocular 3D Semantic Scene Completion

【CVPR 2022】单目3D语义场景完成框架，MonoScene: Monocular 3D Semantic Scene Completion

专知会员服务

15+阅读 · 2022年3月3日

【ICCV2021】模态视频表示的跨模态对比学习

专知会员服务

16+阅读 · 2021年10月4日

【ICCV2021】用于目标检测和实例分割的新损失函数

专知会员服务

22+阅读 · 2021年7月28日

MonoGRNet：单目3D目标检测的通用框架（TPAMI2021）

MonoGRNet：单目3D目标检测的通用框架（TPAMI2021）

专知会员服务

18+阅读 · 2021年5月3日

热门VIP内容

开通专知VIP会员享更多权益服务

模型提取攻击与防御的系统综述：最新进展与展望

【博士论文】低维与高维空间中潜在表征的分析、建模与变换

【CMU博士论文】用于物理模拟的高效深度学习模型

大模型解决方案白皮书：社交陪伴场景全流程落地指南

相关资讯

【AAAI2023】面向领域自适应语义分割的几何感知网络

【AAAI2023】面向领域自适应语义分割的几何感知网络

专知

8+阅读 · 2022年12月7日

ECCV22｜美团&上海交大开源PromptDet：无需手动标注，迈向开放词汇的目标检测

ECCV22｜美团&上海交大开源PromptDet：无需手动标注，迈向开放词汇的目标检测

极市平台

0+阅读 · 2022年7月31日

数据集｜ALITA:用于自动驾驶的大规模增量数据集

数据集｜ALITA:用于自动驾驶的大规模增量数据集

极市平台

3+阅读 · 2022年6月27日

BEVFormer：基于Transformer的自动驾驶BEV纯视觉感知

BEVFormer：基于Transformer的自动驾驶BEV纯视觉感知

PaperWeekly

1+阅读 · 2022年6月21日

CVPR 2022 | 元学习在图像回归任务的表现

CVPR 2022 | 元学习在图像回归任务的表现

PaperWeekly

1+阅读 · 2022年6月11日

综述 | 激光与视觉融合SLAM

综述 | 激光与视觉融合SLAM

计算机视觉life

18+阅读 · 2020年10月8日

【泡泡图灵智库】ContextDesc：用跨模态上下文增强的局部描述子

【泡泡图灵智库】ContextDesc：用跨模态上下文增强的局部描述子

泡泡机器人SLAM

34+阅读 · 2019年9月18日

【泡泡图灵智库】DenseFusion:基于迭代密集融合的6D目标姿态估计

【泡泡图灵智库】DenseFusion:基于迭代密集融合的6D目标姿态估计

泡泡机器人SLAM

16+阅读 · 2019年9月3日

【泡泡一分钟】变化环境下激光地图辅助视觉惯性定位

【泡泡一分钟】变化环境下激光地图辅助视觉惯性定位

泡泡机器人SLAM

15+阅读 · 2019年5月22日

现在开源的RGB-D SLAM有哪些?

现在开源的RGB-D SLAM有哪些?

计算机视觉life

31+阅读 · 2019年5月8日

相关基金

面向遮挡条件下的人脸识别方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

三维空间中基于图结构的人体姿态估计算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

复杂场景下非合作目标鲁棒识别方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向金属板表面非完整信息目标的识别方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于先验知识的三维点云鲁棒处理技术研究

国家自然科学基金

1+阅读 · 2012年12月31日

面向多场景图像自适应的三维人脸建模研究

国家自然科学基金

0+阅读 · 2012年12月31日

弱监督条件下RGB-D时序图像的语义分割模型与迁移学习算法

国家自然科学基金

0+阅读 · 2012年12月31日

医学图像分割中面向目标的形状统计与边界特征学习

国家自然科学基金

3+阅读 · 2011年12月31日

基于超多视角成像的三维重建关键技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于3D视频的运动分割与3D运动估计

国家自然科学基金

1+阅读 · 2008年12月31日

相关论文

Understanding why SLAM algorithms fail in modern indoor environments

Arxiv

0+阅读 · 2023年5月9日

RelPose++: Recovering 6D Poses from Sparse-view Observations

Arxiv

0+阅读 · 2023年5月8日

Self-supervised Learning for Pre-Training 3D Point Clouds: A Survey

Arxiv

5+阅读 · 2023年5月8日

A sensor fusion approach for improving implementation speed and accuracy of RTAB-Map algorithm based indoor 3D mapping

Arxiv

0+阅读 · 2023年5月8日

Improving 2D face recognition via fine-level facial depth generation and RGB-D complementary feature learning

Arxiv

0+阅读 · 2023年5月8日

Neural Voting Field for Camera-Space 3D Hand Pose Estimation

Arxiv

0+阅读 · 2023年5月7日

Learning Hybrid Actor-Critic Maps for 6D Non-Prehensile Manipulation

Arxiv

0+阅读 · 2023年5月6日

Understanding and Constructing Latent Modality Structures in Multi-modal Representation Learning

Arxiv

11+阅读 · 2023年3月10日

Recovering 3D Human Mesh from Monocular Images: A Survey

Arxiv

12+阅读 · 2022年3月8日

3D Hand Shape and Pose Estimation from a Single RGB Image

3D Hand Shape and Pose Estimation from a Single RGB Image

Arxiv

17+阅读 · 2019年3月3日

微信扫码咨询专知VIP会员