There have been two streams in the 3D detection from point clouds: single-stage methods and two-stage methods. While the former is more computationally efficient, the latter usually provides better detection accuracy. By carefully examining the two-stage approaches, we have found that if appropriately designed, the first stage can produce accurate box regression. In this scenario, the second stage mainly rescores the boxes such that the boxes with better localization get selected. From this observation, we have devised a single-stage anchor-free network that can fulfill these requirements. This network, named AFDetV2, extends the previous work by incorporating a self-calibrated convolution block in the backbone, a keypoint auxiliary supervision, and an IoU prediction branch in the multi-task head. As a result, the detection accuracy is drastically boosted in the single-stage. To evaluate our approach, we have conducted extensive experiments on the Waymo Open Dataset and the nuScenes Dataset. We have observed that our AFDetV2 achieves the state-of-the-art results on these two datasets, superior to all the prior arts, including both the single-stage and the two-stage se3D detectors. AFDetV2 won the 1st place in the Real-Time 3D Detection of the Waymo Open Dataset Challenge 2021. In addition, a variant of our model AFDetV2-Base was entitled the "Most Efficient Model" by the Challenge Sponsor, showing a superior computational efficiency. To demonstrate the generality of this single-stage method, we have also applied it to the first stage of the two-stage networks. Without exception, the results show that with the strengthened backbone and the rescoring approach, the second stage refinement is no longer needed.


翻译:3D 从点云中检测到两个串流。 单阶段方法和两阶段方法。 前者在计算上效率更高, 后者通常提供更好的检测准确性。 通过仔细检查两阶段方法, 我们发现, 如果设计得当, 第一阶段可以产生准确的框回归。 在这一情景中, 第二阶段主要将盒子重新集中到位置化更好选择的框中。 从这个观察中, 我们设计了一个能够满足这些要求的单阶段无锚网络。 这个名为 AFDetV2 的网络扩大了先前的工作, 在骨干中加入一个自我校准的凝固连接块, 后者通常提供更准确性。 通过仔细检查两阶段的方法, 我们发现检测准确性在多阶段中可以产生准确性。 为了评估我们的方法, 我们在Waymo OpenD数据集和NnuStencilset数据集上进行了广泛的实验。 我们观察到, AFDV2 的骨干在这两套数据设置上实现了最高级的预设结果, 在前艺术中, 更高级的轨道网络和IFD 3 演示中的第一个阶段显示一个最高级的A- streal 。 一级, 一级和第二阶段显示一个最高级的A- dreal 级的A- drea- dremodrodrol 。

0
下载
关闭预览

相关内容

专知会员服务
16+阅读 · 2021年5月23日
专知会员服务
121+阅读 · 2021年4月29日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
深度卷积神经网络中的降采样
极市平台
12+阅读 · 2019年5月24日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
YOLO简史
计算机视觉life
27+阅读 · 2019年3月7日
Focal Loss for Dense Object Detection
统计学习与视觉计算组
11+阅读 · 2018年3月15日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
【推荐】决策树/随机森林深入解析
机器学习研究会
5+阅读 · 2017年9月21日
【推荐】深度学习目标检测全面综述
机器学习研究会
21+阅读 · 2017年9月13日
【推荐】深度学习目标检测概览
机器学习研究会
10+阅读 · 2017年9月1日
Arxiv
6+阅读 · 2021年11月12日
EfficientDet: Scalable and Efficient Object Detection
Arxiv
6+阅读 · 2019年11月20日
Arxiv
11+阅读 · 2019年4月15日
Arxiv
5+阅读 · 2018年5月16日
VIP会员
相关VIP内容
专知会员服务
16+阅读 · 2021年5月23日
专知会员服务
121+阅读 · 2021年4月29日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
相关资讯
深度卷积神经网络中的降采样
极市平台
12+阅读 · 2019年5月24日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
YOLO简史
计算机视觉life
27+阅读 · 2019年3月7日
Focal Loss for Dense Object Detection
统计学习与视觉计算组
11+阅读 · 2018年3月15日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
【推荐】决策树/随机森林深入解析
机器学习研究会
5+阅读 · 2017年9月21日
【推荐】深度学习目标检测全面综述
机器学习研究会
21+阅读 · 2017年9月13日
【推荐】深度学习目标检测概览
机器学习研究会
10+阅读 · 2017年9月1日
Top
微信扫码咨询专知VIP会员