Accurate detection of obstacles in 3D is an essential task for autonomous driving and intelligent transportation. In this work, we propose a general multimodal fusion framework FusionPainting to fuse the 2D RGB image and 3D point clouds at a semantic level for boosting the 3D object detection task. Especially, the FusionPainting framework consists of three main modules: a multi-modal semantic segmentation module, an adaptive attention-based semantic fusion module, and a 3D object detector. First, semantic information is obtained for 2D images and 3D Lidar point clouds based on 2D and 3D segmentation approaches. Then the segmentation results from different sensors are adaptively fused based on the proposed attention-based semantic fusion module. Finally, the point clouds painted with the fused semantic label are sent to the 3D detector for obtaining the 3D objection results. The effectiveness of the proposed framework has been verified on the large-scale nuScenes detection benchmark by comparing it with three different baselines. The experimental results show that the fusion strategy can significantly improve the detection performance compared to the methods using only point clouds, and the methods using point clouds only painted with 2D segmentation information. Furthermore, the proposed approach outperforms other state-of-the-art methods on the nuScenes testing benchmark.


翻译:3D 中障碍的准确检测是自动驾驶和智能运输的一项基本任务。 在这项工作中,我们提议建立一个通用的多式联运融合框架 FisionPaint, 将 2D RGB 图像和 3D 点云在语义层面上结合, 以提升 3D 对象检测任务。 特别是, FusionPaint 框架由三个主要模块组成: 多模式语义分离模块、 适应性关注性语义融合模块和 3D 对象探测器。 首先, 以 2D 和 3D 分解方法为基础, 获得 2D 图像和 3D 利达尔 点云的语义化信息。 然后, 不同的传感器的分解结果根据拟议的基于关注的语义融合模块, 适应性地结合。 最后, 与 3D 连接的语义标志所绘制的点云, 以获得 3D 反对的结果。 提议的框架的有效性通过与其他三个不同的基准进行比较, 得到验证。 实验结果显示, 组合战略的分化结果能够大大改进2D 与状态测试方法。

0
下载
关闭预览

相关内容

专知会员服务
28+阅读 · 2021年2月17日
3D目标检测进展综述
专知会员服务
191+阅读 · 2020年4月24日
已删除
将门创投
12+阅读 · 2019年7月1日
【泡泡一分钟】基于3D激光雷达地图的立体相机定位
泡泡机器人SLAM
4+阅读 · 2019年1月14日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
Single-Shot Object Detection with Enriched Semantics
统计学习与视觉计算组
14+阅读 · 2018年8月29日
论文笔记之Feature Selective Networks for Object Detection
统计学习与视觉计算组
21+阅读 · 2018年7月26日
自适应注意力机制在Image Caption中的应用
PaperWeekly
10+阅读 · 2018年5月10日
(TensorFlow)实时语义分割比较研究
机器学习研究会
9+阅读 · 2018年3月12日
【推荐】全卷积语义分割综述
机器学习研究会
19+阅读 · 2017年8月31日
Arxiv
12+阅读 · 2021年6月21日
Arxiv
11+阅读 · 2019年4月15日
Arxiv
12+阅读 · 2019年1月24日
VIP会员
相关VIP内容
专知会员服务
28+阅读 · 2021年2月17日
3D目标检测进展综述
专知会员服务
191+阅读 · 2020年4月24日
相关资讯
已删除
将门创投
12+阅读 · 2019年7月1日
【泡泡一分钟】基于3D激光雷达地图的立体相机定位
泡泡机器人SLAM
4+阅读 · 2019年1月14日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
Single-Shot Object Detection with Enriched Semantics
统计学习与视觉计算组
14+阅读 · 2018年8月29日
论文笔记之Feature Selective Networks for Object Detection
统计学习与视觉计算组
21+阅读 · 2018年7月26日
自适应注意力机制在Image Caption中的应用
PaperWeekly
10+阅读 · 2018年5月10日
(TensorFlow)实时语义分割比较研究
机器学习研究会
9+阅读 · 2018年3月12日
【推荐】全卷积语义分割综述
机器学习研究会
19+阅读 · 2017年8月31日
Top
微信扫码咨询专知VIP会员