Understanding point cloud has recently gained huge interests following the development of 3D scanning devices and the accumulation of large-scale 3D data. Most point cloud processing algorithms can be classified as either point-based or voxel-based methods, both of which have severe limitations in processing time or memory, or both. To overcome these limitations, we propose Projection-based Point Convolution (PPConv), a point convolutional module that uses 2D convolutions and multi-layer perceptrons (MLPs) as its components. In PPConv, point features are processed through two branches: point branch and projection branch. Point branch consists of MLPs, while projection branch transforms point features into a 2D feature map and then apply 2D convolutions. As PPConv does not use point-based or voxel-based convolutions, it has advantages in fast point cloud processing. When combined with a learnable projection and effective feature fusion strategy, PPConv achieves superior efficiency compared to state-of-the-art methods, even with a simple architecture based on PointNet++. We demonstrate the efficiency of PPConv in terms of the trade-off between inference time and segmentation performance. The experimental results on S3DIS and ShapeNetPart show that PPConv is the most efficient method among the compared ones. The code is available at github.com/pahn04/PPConv.
翻译:开发 3D 扫描 设备 和 大型 3D 数据 积累 后, 理解 云 近来 获得了 巨大的兴趣 。 大多数 点 云 处理算法 都可以 归类为 点基 或 voxel 方法, 这两种方法在处理时间或记忆上都有严重限制 。 为了克服这些限制, 我们提议 以 投影为基础的点 点 共变 (PPConv) (PPConv) (PPConv) (PP) (PP) ) 是一个点 点 共变和 多层 作为其组成部分的集成模块 。 在 PPConv 中, 点 由 点 分支 和 投影分支 组成 点 。 而 投影分支 将点 特性转换为 2D 特征 地图, 然后应用 2DV 。 由于 PP Conv 不使用 点 或 共和 点 组合 组合, 我们展示了 PPP PB 中 中 中 中 的 的 有效 和 CEVIPDF 工具 的运行 。 在 中, 中, 的 和 SDFIPBDR 的, 的 的 将 和 CVDFPBVDR 的 的 的 将 的 的 的 的 的 的 的 。