3D object detection with LiDAR point clouds plays an important role in autonomous driving perception module that requires high speed, stability and accuracy. However, the existing point-based methods are challenging to reach the speed requirements because of too many raw points, and the voxel-based methods are unable to ensure stable speed because of the 3D sparse convolution. In contrast, the 2D grid-based methods, such as PointPillar, can easily achieve a stable and efficient speed based on simple 2D convolution, but it is hard to get the competitive accuracy limited by the coarse-grained point clouds representation. So we propose an improved pillar with fine-grained feature based on PointPillar that can significantly improve detection accuracy. It consists of two modules, including height-aware sub-pillar and sparsity-based tiny-pillar, which get fine-grained representation respectively in the vertical and horizontal direction of 3D space. For height-aware sub-pillar, we introduce a height position encoding to keep height information of each sub-pillar during projecting to a 2D pseudo image. For sparsity-based tiny-pillar, we introduce sparsity-based CNN backbone stacked by dense feature and sparse attention module to extract feature with larger receptive field efficiently. Experimental results show that our proposed method significantly outperforms previous state-of-the-art 3D detection methods on the Waymo Open Dataset. The related code will be released to facilitate the academic and industrial study.
翻译:使用 LiDAR 点云进行 3D 对象探测 3D 3D 目标检测 3D 目标与 LiDAR 点云在自主驱动感知模块中起着重要作用,该模块需要高速度、稳定性和准确性。然而,现有的点基方法对于达到速度要求具有挑战性,因为过多的原始点太多,而基于 voxel 的方法无法确保稳定速度。相比之下,基于 2D 的基于 2D 的基于 3D 的基于 3D 的基于 3D 的基于 3D 的 3D 的基于 3D 的基于 3D 的基于 3D 的基于 3D 的基于基于 点的基于 3D 的基于 点点的基于 3 的基于 3D 的基于 的基于 3 D 的基于 的基于 点 点 点 的基于 点 点 的 点代表度 的, 竞争性 准确性 准确性 。 因此, 我们建议基于 点 点 的基于 点 点 精度 精度 精度 精度 的 精度 精度 质 质 质 D 的 质 质 质 和 的 的 度 度 的 度 度 度 质 质 质 质 质 质 质 的 质 质 质 质 质 质 的 质 质 质 质 质 质 质 质 质 质 的 质 质 的 质 质 质 质 度 度 度 的 质 质 度 度 度 度 度 度 。