理解 3D 环境对于机器人感知十分重要,从点云中识别物体对于如自动驾驶之类的应用很有帮助。 CNN 依赖卷积操作识别物体,卷积操作虽然有效,但需要网格化的输入,但点云相较于图片来说更加稀疏并且在网格中分布不均。将点云放置在常规网格上会在网格单元中生成数量不均匀的点。在这样的网格上应用相同的卷积运算会导致拥挤的单元中潜在的信息丢失或空单元中的计算浪费。 最近的一些工作尝试使用无序点集作为输入,这样无需将点云转换为网格。但这样做通常需要迭代采样和分组来创建点集。在大的点云上重复分组和采样可能会在计算上造成高昂的成本,因此最近的一些 3D 检测方法通常采用混合的方法在不同阶段分别使用网格或集合表示,但这种混合的策略可能会同时受到这两种表示方法的限制。