Monocular 3D object detection is an important task for autonomous driving considering its advantage of low cost. It is much more challenging compared to conventional 2D case due to its inherent ill-posed property, which is mainly reflected on the lack of depth information. Recent progress on 2D detection offers opportunities to better solving this problem. However, it is non-trivial to make a general adapted 2D detector work in this 3D task. In this technical report, we study this problem with a practice built on fully convolutional single-stage detector and propose a general framework FCOS3D. Specifically, we first transform the commonly defined 7-DoF 3D targets to image domain and decouple it as 2D and 3D attributes. Then the objects are distributed to different feature levels with the consideration of their 2D scales and assigned only according to the projected 3D-center for training procedure. Furthermore, the center-ness is redefined with a 2D Guassian distribution based on the 3D-center to fit the 3D target formulation. All of these make this framework simple yet effective, getting rid of any 2D detection or 2D-3D correspondence priors. Our solution achieves 1st place out of all the vision-only methods in the nuScenes 3D detection challenge of NeurIPS 2020. Code and models are released at https://github.com/open-mmlab/mmdetection3d.


翻译:考虑到其低成本优势,自动驱动的3D物体探测是一项重要任务,考虑到其低成本优势,这是自主驱动的一个重要任务。与常规的2D案件相比,其挑战性要大得多,因为其内在的不良属性,这主要反映于缺乏深度信息。最近在2D探测方面取得的进展为更好地解决这一问题提供了机会。然而,在3D任务中,使通用的2D探测器工作适应通用的2D探测器工作是非三维的。此外,在本技术报告中,我们研究这一问题时,我们采用了以完全同步的单阶段探测器为基础的做法,并提出了一个通用框架FCOS3D。具体地说,我们首先将通常定义的7-DoF 3D目标转换为图像域,并脱钩为2D和3D属性。然后,在考虑其2D尺度后,将对象分布到不同的特性级别,并仅仅根据培训程序的预测的 3D中心进行分配。此外,我们用基于 3D- Center 来重新定义的2D Gusian分布方式,并提议一个通用框架。所有这一切都使得这个框架既简单又有效,消除了任何2D-DoF 3D 3D 或2D-3D 3MD 之前的探测方法。我们的方法在S 3MS 之前的解码S 3MS 3MS 的方法在S 3MS 3MVS 3MS 的解出所有的方法是所有的方法。

0
下载
关闭预览

相关内容

3D是英文“Three Dimensions”的简称,中文是指三维、三个维度、三个坐标,即有长、有宽、有高,换句话说,就是立体的,是相对于只有长和宽的平面(2D)而言。
MonoGRNet:单目3D目标检测的通用框架(TPAMI2021)
专知会员服务
17+阅读 · 2021年5月3日
3D目标检测进展综述
专知会员服务
191+阅读 · 2020年4月24日
CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络
专知会员服务
43+阅读 · 2020年4月17日
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
Uber开源实时多任务、多传感器融合3D目标检测方法!
计算机视觉life
11+阅读 · 2020年7月15日
鲁棒机器学习相关文献集
专知
8+阅读 · 2019年8月18日
最全综述 | 图像目标检测
计算机视觉life
31+阅读 · 2019年6月24日
CVPR2019 | Stereo R-CNN 3D 目标检测
极市平台
27+阅读 · 2019年3月10日
Focal Loss for Dense Object Detection
统计学习与视觉计算组
11+阅读 · 2018年3月15日
【推荐】用Python/OpenCV实现增强现实
机器学习研究会
15+阅读 · 2017年11月16日
【推荐】深度学习目标检测全面综述
机器学习研究会
21+阅读 · 2017年9月13日
【推荐】深度学习目标检测概览
机器学习研究会
10+阅读 · 2017年9月1日
Arxiv
9+阅读 · 2021年3月3日
EfficientDet: Scalable and Efficient Object Detection
Arxiv
6+阅读 · 2019年11月20日
Clustered Object Detection in Aerial Images
Arxiv
5+阅读 · 2019年8月27日
DPOD: Dense 6D Pose Object Detector in RGB images
Arxiv
5+阅读 · 2019年2月28日
Arxiv
12+阅读 · 2019年1月24日
Arxiv
5+阅读 · 2018年4月17日
Arxiv
7+阅读 · 2018年3月19日
VIP会员
相关VIP内容
MonoGRNet:单目3D目标检测的通用框架(TPAMI2021)
专知会员服务
17+阅读 · 2021年5月3日
3D目标检测进展综述
专知会员服务
191+阅读 · 2020年4月24日
CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络
专知会员服务
43+阅读 · 2020年4月17日
相关资讯
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
Uber开源实时多任务、多传感器融合3D目标检测方法!
计算机视觉life
11+阅读 · 2020年7月15日
鲁棒机器学习相关文献集
专知
8+阅读 · 2019年8月18日
最全综述 | 图像目标检测
计算机视觉life
31+阅读 · 2019年6月24日
CVPR2019 | Stereo R-CNN 3D 目标检测
极市平台
27+阅读 · 2019年3月10日
Focal Loss for Dense Object Detection
统计学习与视觉计算组
11+阅读 · 2018年3月15日
【推荐】用Python/OpenCV实现增强现实
机器学习研究会
15+阅读 · 2017年11月16日
【推荐】深度学习目标检测全面综述
机器学习研究会
21+阅读 · 2017年9月13日
【推荐】深度学习目标检测概览
机器学习研究会
10+阅读 · 2017年9月1日
相关论文
Arxiv
9+阅读 · 2021年3月3日
EfficientDet: Scalable and Efficient Object Detection
Arxiv
6+阅读 · 2019年11月20日
Clustered Object Detection in Aerial Images
Arxiv
5+阅读 · 2019年8月27日
DPOD: Dense 6D Pose Object Detector in RGB images
Arxiv
5+阅读 · 2019年2月28日
Arxiv
12+阅读 · 2019年1月24日
Arxiv
5+阅读 · 2018年4月17日
Arxiv
7+阅读 · 2018年3月19日
Top
微信扫码咨询专知VIP会员