3D object detection with LiDAR point clouds plays an important role in autonomous driving perception module that requires high speed, stability and accuracy. However, the existing point-based methods are challenging to reach the speed requirements because of too many raw points, and the voxel-based methods are unable to ensure stable speed because of the 3D sparse convolution. In contrast, the 2D grid-based methods, such as PointPillar, can easily achieve a stable and efficient speed based on simple 2D convolution, but it is hard to get the competitive accuracy limited by the coarse-grained point clouds representation. So we propose an improved pillar with fine-grained feature based on PointPillar that can significantly improve detection accuracy. It consists of two modules, including height-aware sub-pillar and sparsity-based tiny-pillar, which get fine-grained representation respectively in the vertical and horizontal direction of 3D space. For height-aware sub-pillar, we introduce a height position encoding to keep height information of each sub-pillar during projecting to a 2D pseudo image. For sparsity-based tiny-pillar, we introduce sparsity-based CNN backbone stacked by dense feature and sparse attention module to extract feature with larger receptive field efficiently. Experimental results show that our proposed method significantly outperforms previous state-of-the-art 3D detection methods on the Waymo Open Dataset. The related code will be released to facilitate the academic and industrial study.


翻译:使用 LiDAR 点云进行 3D 对象探测 3D 3D 目标检测 3D 目标与 LiDAR 点云在自主驱动感知模块中起着重要作用,该模块需要高速度、稳定性和准确性。然而,现有的点基方法对于达到速度要求具有挑战性,因为过多的原始点太多,而基于 voxel 的方法无法确保稳定速度。相比之下,基于 2D 的基于 2D 的基于 3D 的基于 3D 的基于 3D 的基于 3D 的 3D 的基于 3D 的基于 3D 的基于 3D 的基于 3D 的基于基于 点的基于 3D 的基于 点点的基于 3 的基于 3D 的基于 的基于 3 D 的基于 的基于 点 点 点 的基于 点 点 的 点代表度 的, 竞争性 准确性 准确性 。 因此, 我们建议基于 点 点 的基于 点 点 精度 精度 精度 精度 的 精度 精度 质 质 质 D 的 质 质 质 和 的 的 度 度 的 度 度 度 质 质 质 质 质 质 质 的 质 质 质 质 质 质 的 质 质 质 质 质 质 质 质 质 质 的 质 质 的 质 质 质 质 度 度 度 的 质 质 度 度 度 度 度 度 。

0
下载
关闭预览

相关内容

机器学习系统设计系统评估标准
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
49+阅读 · 2020年2月26日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
59+阅读 · 2019年10月17日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
152+阅读 · 2019年10月12日
无人机视觉挑战赛 | ICCV 2019 Workshop—VisDrone2019
PaperWeekly
7+阅读 · 2019年5月5日
CVPR2019 | Stereo R-CNN 3D 目标检测
极市平台
27+阅读 · 2019年3月10日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Soft-NMS – Improving Object Detection With One Line of Code
统计学习与视觉计算组
6+阅读 · 2018年3月30日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
DPOD: Dense 6D Pose Object Detector in RGB images
Arxiv
5+阅读 · 2019年2月28日
Arxiv
12+阅读 · 2019年1月24日
Arxiv
5+阅读 · 2018年5月16日
VIP会员
相关VIP内容
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
49+阅读 · 2020年2月26日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
59+阅读 · 2019年10月17日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
152+阅读 · 2019年10月12日
Top
微信扫码咨询专知VIP会员