由于激光雷达扫描到的点云通常不像图像那样有规则的排列,当前的3D点云目标检测器要么需要对点云进行体素化 (Voxelization) 使其形成规则的形状,如VoxelNet、PointPillars等;要么直接在点上抽取特征,如Point RCNN、SA-SSD等。但这两类方法各有缺点:体素化方法在量化过程中损失了点级别的精确几何信息;点上抽取特征的方法由于点云的不规则性,不论是提取关键点还是寻找邻域的过程都需要引入大量的计算量,导致无法在大规模点云上实时运行。
为了引入精确的几何信息,而又不增加过多的计算量,图森团队想到了二阶段网络。其中第一阶段我们使用常见的体素化方法进行检测,排除掉大部分的背景点,之后在第一阶段的proposal的基础上,利用原始点云信息来得到更精确的包围框。由于proposal中的大部分点都是前景点,点云数量大大降低,所以第二阶段的网络可以完美规避基于点的方法计算量大的缺点,同时保留住了原始点云中目标的精确几何形状。