Autonomous driving requires an accurate and fast 3D perception system that includes 3D object detection, tracking, and segmentation. Although recent low-cost camera-based approaches have shown promising results, they are susceptible to poor illumination or bad weather conditions and have a large localization error. Hence, fusing camera with low-cost radar, which provides precise long-range measurement and operates reliably in all environments, is promising but has not yet been thoroughly investigated. In this paper, we propose Camera Radar Net (CRN), a novel camera-radar fusion framework that generates a semantically rich and spatially accurate bird's-eye-view (BEV) feature map for various tasks. To overcome the lack of spatial information in an image, we transform perspective view image features to BEV with the help of sparse but accurate radar points. We further aggregate image and radar feature maps in BEV using multi-modal deformable attention designed to tackle the spatial misalignment between inputs. CRN with real-time setting operates at 20 FPS while achieving comparable performance to LiDAR detectors on nuScenes, and even outperforms at a far distance on 100m setting. Moreover, CRN with offline setting yields 62.4% NDS, 57.5% mAP on nuScenes test set and ranks first among all camera and camera-radar 3D object detectors.


翻译:自动驾驶需要一个精准快速的三维感知系统,其中包括三维物体检测、跟踪和分割。尽管最近的低成本基于摄像机的方法显示出了很有前途的结果,但它们容易受到不良照明或恶劣天气条件的影响,并且具有大的定位误差。因此,将摄像机与低成本的雷达融合,这种方式不仅提供精确的远程测量,而且在所有环境中都能可靠地运行,具有很大的潜力,但尚未得到全面研究。在本文中,我们提出了一种名为汽车雷达网络(CRN)的新型摄像机-雷达融合框架,它可以为各种任务生成语义丰富、空间准确的俯视特征图。为了克服图像中缺乏空间信息的缺点,我们利用稀疏但准确的雷达点将透视图像特征转换为俯视特征。我们进一步使用多模态可变形注意力将俯视图像和雷达特征图在BEV中聚合,以解决输入之间的空间不对齐问题。CRN采用实时设置,在nuScenes上具有与LiDAR探测器相当的性能,速度达到20 FPS,在100米设置下在远距离时甚至优于LiDAR。此外,CRN在离线设置下在nuScenes测试集上获得了62.4%的NDS、57.5%的mAP,并在所有摄像机和摄像机-雷达三维物体检测器中排名第一。

0
下载
关闭预览

相关内容

【CVPR2023】MSeg3D:面向自动驾驶的多模态3D语义分割
专知会员服务
15+阅读 · 2023年3月17日
【CVPR2022】基于鲁棒区域特征生成的零样本目标检测
专知会员服务
10+阅读 · 2022年3月22日
MonoGRNet:单目3D目标检测的通用框架(TPAMI2021)
专知会员服务
17+阅读 · 2021年5月3日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
39+阅读 · 2019年10月9日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
CVPR2019 | Stereo R-CNN 3D 目标检测
极市平台
27+阅读 · 2019年3月10日
【泡泡一分钟】动态环境下稳健的单目SLAM
泡泡机器人SLAM
13+阅读 · 2018年3月22日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
25+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2023年5月23日
Arxiv
12+阅读 · 2021年6月21日
Arxiv
12+阅读 · 2019年1月24日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
25+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员