汽车雷达网络（CRN）：精准、鲁棒、高效的三维感知 (CRN: Camera Radar Net for Accurate, Robust, Efficient 3D Perception) - 专知论文

会员服务 ·

0

三维感知 · LIDAR · 三维物体检测 · 三维物体 · 物体检测 ·

2023 年 4 月 3 日

CRN: Camera Radar Net for Accurate, Robust, Efficient 3D Perception

翻译：汽车雷达网络（CRN）：精准、鲁棒、高效的三维感知

Youngseok Kim,Sanmin Kim,Juyeb Shin,Jun Won Choi,Dongsuk Kum

from arxiv, International Conference on Learning Representations 2023 Workshop on Scene Representations for Autonomous Driving (ICLR'23 SR4AD)

Autonomous driving requires an accurate and fast 3D perception system that includes 3D object detection, tracking, and segmentation. Although recent low-cost camera-based approaches have shown promising results, they are susceptible to poor illumination or bad weather conditions and have a large localization error. Hence, fusing camera with low-cost radar, which provides precise long-range measurement and operates reliably in all environments, is promising but has not yet been thoroughly investigated. In this paper, we propose Camera Radar Net (CRN), a novel camera-radar fusion framework that generates a semantically rich and spatially accurate bird's-eye-view (BEV) feature map for various tasks. To overcome the lack of spatial information in an image, we transform perspective view image features to BEV with the help of sparse but accurate radar points. We further aggregate image and radar feature maps in BEV using multi-modal deformable attention designed to tackle the spatial misalignment between inputs. CRN with real-time setting operates at 20 FPS while achieving comparable performance to LiDAR detectors on nuScenes, and even outperforms at a far distance on 100m setting. Moreover, CRN with offline setting yields 62.4% NDS, 57.5% mAP on nuScenes test set and ranks first among all camera and camera-radar 3D object detectors.

翻译：自动驾驶需要一个精准快速的三维感知系统，其中包括三维物体检测、跟踪和分割。尽管最近的低成本基于摄像机的方法显示出了很有前途的结果，但它们容易受到不良照明或恶劣天气条件的影响，并且具有大的定位误差。因此，将摄像机与低成本的雷达融合，这种方式不仅提供精确的远程测量，而且在所有环境中都能可靠地运行，具有很大的潜力，但尚未得到全面研究。在本文中，我们提出了一种名为汽车雷达网络（CRN）的新型摄像机-雷达融合框架，它可以为各种任务生成语义丰富、空间准确的俯视特征图。为了克服图像中缺乏空间信息的缺点，我们利用稀疏但准确的雷达点将透视图像特征转换为俯视特征。我们进一步使用多模态可变形注意力将俯视图像和雷达特征图在BEV中聚合，以解决输入之间的空间不对齐问题。CRN采用实时设置，在nuScenes上具有与LiDAR探测器相当的性能，速度达到20 FPS，在100米设置下在远距离时甚至优于LiDAR。此外，CRN在离线设置下在nuScenes测试集上获得了62.4%的NDS、57.5%的mAP，并在所有摄像机和摄像机-雷达三维物体检测器中排名第一。

0

相关内容

三维感知

【CVPR2023】MSeg3D:面向自动驾驶的多模态3D语义分割

【CVPR2023】MSeg3D:面向自动驾驶的多模态3D语义分割

专知会员服务

16+阅读 · 2023年3月17日

【CVPR2022】基于鲁棒区域特征生成的零样本目标检测

【CVPR2022】基于鲁棒区域特征生成的零样本目标检测

专知会员服务

11+阅读 · 2022年3月22日

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

专知会员服务

18+阅读 · 2022年3月19日

【CVPR 2022】单目3D语义场景完成框架，MonoScene: Monocular 3D Semantic Scene Completion

【CVPR 2022】单目3D语义场景完成框架，MonoScene: Monocular 3D Semantic Scene Completion

专知会员服务

15+阅读 · 2022年3月3日

MonoGRNet：单目3D目标检测的通用框架（TPAMI2021）

MonoGRNet：单目3D目标检测的通用框架（TPAMI2021）

专知会员服务

18+阅读 · 2021年5月3日

【AAAI2021】面向真实世界的鲁棒视觉信息提取:新的数据集和新颖的解决方案

【AAAI2021】面向真实世界的鲁棒视觉信息提取:新的数据集和新颖的解决方案

专知会员服务

22+阅读 · 2021年2月17日

【厦门大学-CVPR2020】协调可迁移性与可判别性的自适应目标检测器，Adapting Object Detectors

【厦门大学-CVPR2020】协调可迁移性与可判别性的自适应目标检测器，Adapting Object Detectors

专知会员服务

26+阅读 · 2020年3月16日

【CVPR 2019 | tutorial】自主汽车的感知、预测和大规模数据采集：Perception, Prediction, and Large Scale Data Collection for Autonomous Cars

【CVPR 2019 | tutorial】自主汽车的感知、预测和大规模数据采集：Perception, Prediction, and Large Scale Data Collection for Autonomous Cars

专知会员服务

33+阅读 · 2019年11月28日

[综述]深度学习下的场景文本检测与识别

[综述]深度学习下的场景文本检测与识别

专知会员服务

78+阅读 · 2019年10月10日

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

专知会员服务

41+阅读 · 2019年10月9日

【泡泡一分钟】PIRVS：一个具有灵活传感器融合和硬件协同设计的先进视觉-惯性SLAM系统

【泡泡一分钟】PIRVS：一个具有灵活传感器融合和硬件协同设计的先进视觉-惯性SLAM系统

泡泡机器人SLAM

11+阅读 · 2019年9月11日

【泡泡一分钟】单目视觉惯性SLAM的重定位，全局优化和地图融合

【泡泡一分钟】单目视觉惯性SLAM的重定位，全局优化和地图融合

泡泡机器人SLAM

59+阅读 · 2019年7月15日

【泡泡图灵智库】基于视觉深度估计的伪激光雷达: 从2D图像到自动驾驶3D目标检测（IROS）

【泡泡图灵智库】基于视觉深度估计的伪激光雷达: 从2D图像到自动驾驶3D目标检测（IROS）

泡泡机器人SLAM

17+阅读 · 2019年7月8日

【泡泡一分钟】FarSight：从户外图像中实现远距离深度估计

【泡泡一分钟】FarSight：从户外图像中实现远距离深度估计

泡泡机器人SLAM

11+阅读 · 2019年5月22日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

【泡泡一分钟】优化对比度增强以提高SLAM重定位环境中视觉跟踪的稳健性

【泡泡一分钟】优化对比度增强以提高SLAM重定位环境中视觉跟踪的稳健性

泡泡机器人SLAM

10+阅读 · 2019年4月26日

CVPR2019 | Stereo R-CNN 3D 目标检测

CVPR2019 | Stereo R-CNN 3D 目标检测

极市平台

27+阅读 · 2019年3月10日

【泡泡点云时空】3DFeat-Net：用于点云配准的弱监督学习的局部3D特征（ECCV2018-3）

【泡泡点云时空】3DFeat-Net：用于点云配准的弱监督学习的局部3D特征（ECCV2018-3）

泡泡机器人SLAM

12+阅读 · 2018年10月2日

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

专知

13+阅读 · 2018年5月26日

【泡泡一分钟】动态环境下稳健的单目SLAM

【泡泡一分钟】动态环境下稳健的单目SLAM

泡泡机器人SLAM

13+阅读 · 2018年3月22日

宽带稀疏信号调制变换欠采样频谱感知

国家自然科学基金

1+阅读 · 2015年12月31日

多光谱动态融合目标跟踪

国家自然科学基金

1+阅读 · 2013年12月31日

多视点视频追踪问题的研究

国家自然科学基金

1+阅读 · 2013年12月31日

移动机器人基于三维激光测距的室内场景认知与物体识别

国家自然科学基金

0+阅读 · 2012年12月31日

面向图像与视频特征表示的深度编码方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

Cocycle动力学和拟周期薛定谔算子的谱

国家自然科学基金

0+阅读 · 2012年12月31日

Internet环境下组合式软件的时空进程代数刻画及模型检测

国家自然科学基金

0+阅读 · 2012年12月31日

全局轨迹解析的通用框架和推理方法，以及在智能视频监控中的应用

国家自然科学基金

1+阅读 · 2011年12月31日

无人机协同组网感知融合与传感器管理关键技术研究

国家自然科学基金

26+阅读 · 2011年12月31日

基于机器视觉和惯性测量的轮式滑动转向移动机器人定位导航与遥感知

国家自然科学基金

0+阅读 · 2008年12月31日

Energy-based Detection of Adverse Weather Effects in LiDAR Data

Arxiv

0+阅读 · 2023年5月25日

Deep Radar Inverse Sensor Models for Dynamic Occupancy Grid Maps

Arxiv

0+阅读 · 2023年5月25日

RC-BEVFusion: A Plug-In Module for Radar-Camera Bird's Eye View Feature Fusion

Arxiv

0+阅读 · 2023年5月25日

Fair Division with Interdependent Values

Arxiv

0+阅读 · 2023年5月23日

Accelerated Coordinate Encoding: Learning to Relocalize in Minutes using RGB and Poses

Arxiv

0+阅读 · 2023年5月23日

Why semantics matters: A deep study on semantic particle-filtering localization in a LiDAR semantic pole-map

Arxiv

0+阅读 · 2023年5月23日

3D Object Detection for Autonomous Driving: A Survey

Arxiv

12+阅读 · 2021年6月21日

3D Hand Shape and Pose Estimation from a Single RGB Image

3D Hand Shape and Pose Estimation from a Single RGB Image

Arxiv

17+阅读 · 2019年3月3日

3D Backbone Network for 3D Object Detection

Arxiv

12+阅读 · 2019年1月24日

Adaptive Correlation Filters with Long-Term and Short-Term Memory for Object Tracking

Arxiv

11+阅读 · 2018年3月23日

VIP会员

文章信息

相关主题

三维物体检测

相关VIP内容

【CVPR2023】MSeg3D:面向自动驾驶的多模态3D语义分割

【CVPR2023】MSeg3D:面向自动驾驶的多模态3D语义分割

专知会员服务

16+阅读 · 2023年3月17日

【CVPR2022】基于鲁棒区域特征生成的零样本目标检测

【CVPR2022】基于鲁棒区域特征生成的零样本目标检测

专知会员服务

11+阅读 · 2022年3月22日

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

专知会员服务

18+阅读 · 2022年3月19日

【CVPR 2022】单目3D语义场景完成框架，MonoScene: Monocular 3D Semantic Scene Completion

【CVPR 2022】单目3D语义场景完成框架，MonoScene: Monocular 3D Semantic Scene Completion

专知会员服务

15+阅读 · 2022年3月3日

MonoGRNet：单目3D目标检测的通用框架（TPAMI2021）

MonoGRNet：单目3D目标检测的通用框架（TPAMI2021）

专知会员服务

18+阅读 · 2021年5月3日

【AAAI2021】面向真实世界的鲁棒视觉信息提取:新的数据集和新颖的解决方案

【AAAI2021】面向真实世界的鲁棒视觉信息提取:新的数据集和新颖的解决方案

专知会员服务

22+阅读 · 2021年2月17日

【厦门大学-CVPR2020】协调可迁移性与可判别性的自适应目标检测器，Adapting Object Detectors

【厦门大学-CVPR2020】协调可迁移性与可判别性的自适应目标检测器，Adapting Object Detectors

专知会员服务

26+阅读 · 2020年3月16日

【CVPR 2019 | tutorial】自主汽车的感知、预测和大规模数据采集：Perception, Prediction, and Large Scale Data Collection for Autonomous Cars

【CVPR 2019 | tutorial】自主汽车的感知、预测和大规模数据采集：Perception, Prediction, and Large Scale Data Collection for Autonomous Cars

专知会员服务

33+阅读 · 2019年11月28日

[综述]深度学习下的场景文本检测与识别

[综述]深度学习下的场景文本检测与识别

专知会员服务

78+阅读 · 2019年10月10日

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

专知会员服务

41+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

《小型无人机系统侦测追踪技术：声学、计算机视觉与深度学习融合方案》最新98页

《"牧羊人网格"拦截策略：实现无人机集群可靠拦截的新范式》

光纤无人机：反无人机系统的重大挑战

《作战建模与仿真实证研究》

相关资讯

【泡泡一分钟】PIRVS：一个具有灵活传感器融合和硬件协同设计的先进视觉-惯性SLAM系统

【泡泡一分钟】PIRVS：一个具有灵活传感器融合和硬件协同设计的先进视觉-惯性SLAM系统

泡泡机器人SLAM

11+阅读 · 2019年9月11日

【泡泡一分钟】单目视觉惯性SLAM的重定位，全局优化和地图融合

【泡泡一分钟】单目视觉惯性SLAM的重定位，全局优化和地图融合

泡泡机器人SLAM

59+阅读 · 2019年7月15日

【泡泡图灵智库】基于视觉深度估计的伪激光雷达: 从2D图像到自动驾驶3D目标检测（IROS）

【泡泡图灵智库】基于视觉深度估计的伪激光雷达: 从2D图像到自动驾驶3D目标检测（IROS）

泡泡机器人SLAM

17+阅读 · 2019年7月8日

【泡泡一分钟】FarSight：从户外图像中实现远距离深度估计

【泡泡一分钟】FarSight：从户外图像中实现远距离深度估计

泡泡机器人SLAM

11+阅读 · 2019年5月22日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

【泡泡一分钟】优化对比度增强以提高SLAM重定位环境中视觉跟踪的稳健性

【泡泡一分钟】优化对比度增强以提高SLAM重定位环境中视觉跟踪的稳健性

泡泡机器人SLAM

10+阅读 · 2019年4月26日

CVPR2019 | Stereo R-CNN 3D 目标检测

CVPR2019 | Stereo R-CNN 3D 目标检测

极市平台

27+阅读 · 2019年3月10日

【泡泡点云时空】3DFeat-Net：用于点云配准的弱监督学习的局部3D特征（ECCV2018-3）

【泡泡点云时空】3DFeat-Net：用于点云配准的弱监督学习的局部3D特征（ECCV2018-3）

泡泡机器人SLAM

12+阅读 · 2018年10月2日

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

专知

13+阅读 · 2018年5月26日

【泡泡一分钟】动态环境下稳健的单目SLAM

【泡泡一分钟】动态环境下稳健的单目SLAM

泡泡机器人SLAM

13+阅读 · 2018年3月22日

相关论文

Energy-based Detection of Adverse Weather Effects in LiDAR Data

Arxiv

0+阅读 · 2023年5月25日

Deep Radar Inverse Sensor Models for Dynamic Occupancy Grid Maps

Arxiv

0+阅读 · 2023年5月25日

RC-BEVFusion: A Plug-In Module for Radar-Camera Bird's Eye View Feature Fusion

Arxiv

0+阅读 · 2023年5月25日

Fair Division with Interdependent Values

Arxiv

0+阅读 · 2023年5月23日

Accelerated Coordinate Encoding: Learning to Relocalize in Minutes using RGB and Poses

Arxiv

0+阅读 · 2023年5月23日

Why semantics matters: A deep study on semantic particle-filtering localization in a LiDAR semantic pole-map

Arxiv

0+阅读 · 2023年5月23日

3D Object Detection for Autonomous Driving: A Survey

Arxiv

12+阅读 · 2021年6月21日

3D Hand Shape and Pose Estimation from a Single RGB Image

3D Hand Shape and Pose Estimation from a Single RGB Image

Arxiv

17+阅读 · 2019年3月3日

3D Backbone Network for 3D Object Detection

Arxiv

12+阅读 · 2019年1月24日

Adaptive Correlation Filters with Long-Term and Short-Term Memory for Object Tracking

Arxiv

11+阅读 · 2018年3月23日

相关基金

宽带稀疏信号调制变换欠采样频谱感知

国家自然科学基金

1+阅读 · 2015年12月31日

多光谱动态融合目标跟踪

国家自然科学基金

1+阅读 · 2013年12月31日

多视点视频追踪问题的研究

国家自然科学基金

1+阅读 · 2013年12月31日

移动机器人基于三维激光测距的室内场景认知与物体识别

国家自然科学基金

0+阅读 · 2012年12月31日

面向图像与视频特征表示的深度编码方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

Cocycle动力学和拟周期薛定谔算子的谱

国家自然科学基金

0+阅读 · 2012年12月31日

Internet环境下组合式软件的时空进程代数刻画及模型检测

国家自然科学基金

0+阅读 · 2012年12月31日

全局轨迹解析的通用框架和推理方法，以及在智能视频监控中的应用

国家自然科学基金

1+阅读 · 2011年12月31日

无人机协同组网感知融合与传感器管理关键技术研究

国家自然科学基金

26+阅读 · 2011年12月31日

基于机器视觉和惯性测量的轮式滑动转向移动机器人定位导航与遥感知

国家自然科学基金

0+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员