【泡泡图灵智库】逐点卷积神经网络

2018 年 8 月 11 日 泡泡机器人SLAM

泡泡图灵智库,带你精读机器人顶级会议文章

标题:Pointwise Convolution Neural Networks

作者:Binh-Son Hua, Minh-Khoi Tran, Sat-Kit Yeung

来源:CVPR 2018

播音员:包子

编译:潘越

审核:汤文俊

欢迎个人转发朋友圈;其他机构或自媒体如需转载,后台留言申请授权



摘要

       大家好,今天为大家带来的文章是——逐点卷积神经网络,该文章发表于CVPR 2018。

近来,针对点云重建模型和CAD模型等三维模型的深度学习越来越火。然而,用卷积神经网络来处理点云数据的可能性还没有被深入探讨过。本文中,提出了一种为三维语义分割与目标识别设计的逐点卷积神经网络。本文网络的核心是一种新的能够对点云中每个单点进行操作的逐点卷积算子。本文的全卷积网络设计,在容易实现的同时,还能够在语义分割和目标识别上得到具有竞争力的结果。

介绍

      目前针对点云的卷积方法主要有:

      1.以VoxNet为代表的体素卷积,优点是直观自然且易延用图像处理的算法,缺点是有大量零值体素,较耗内存。

      2.以PointNet为代表的点云网络,该方法由于点云的非规则性而较不自然。

     针对这些方法的优劣势,本文提出一种逐点卷积神经网络,其主要贡献有:

     1.设计了一种可以输出点云中每一点特征的逐点卷积算子

     2.构建了针对场景语义分割和目标识别的两个逐点卷积神经网络

算法流程

图1 逐点卷积示意图

     

       如图1所示,定义了一种新式点云卷积算子,对每个点,查找其近邻点并格网化进卷积核的子域中,然后按核权重进行卷积。卷积如下式所示。其中k在核所支持的所有子域上进行迭代,pi是第i个点的坐标,|·|代表子域内的点个数, wk是第k个子域的核权重,l-1和l是输入与输出层的序数。

图2 逐点卷积神经网络架构

    

      定义了卷积核后,可构建神经网络。如图2所示,输入点云被送入各个卷积算子,经过多层卷积后经过一个级联层,输出到用于密集语义分割的最终卷积层或用于目标识别的全连接层。

主要结果

       本文在语义分割和目标识别两方面评估该逐点卷积网络的性能,在几个常见数据集上进行测试,并与几个State-of-art算法进行比较。

图3 逐点神经网络在S3DIS数据集上语义分割的表现

     

       在语义分割方面,该方法在S3DIS上与PointNet比较。结果如下表所示,本文方法可达到与PointNet相差不大的结果。

图4 逐点神经网络在SceneNN数据集上语义分割的表现

     

      随后,再在SceneNN数据集上与VoxNet 以及SemanticFusion比较,如下表所示,可见本文提出方法更优。

      在目标识别方面,在ModelNet40和ObjectNN两个数据集上进行比较评估。本文提出的方法在结构极简的情况下仍能取得与PointNet与PointNet++基本相当的精度。ModelNet40上目标识别结果如下表所示。

    ObjectNN上目标识别结果如下表所示。

Abstract

      Deep learning with 3D data such as reconstructed point clouds and CAD models has received great research interests recently. However, the capability of using point clouds with convolutional neural network has been so far not fully explored. In this paper, we present a convolutional neural network for semantic segmentation and object recognition with 3D point clouds. At the core of our network is pointwise convolution, a new convolution operator that can be applied at each point of a point cloud. Our fully convolutional network design, while being surprisingly simple to implement, can yield competitive accuracy in both semantic segmentation and object recognition task.


如果你对本文感兴趣,想要下载完整文章进行阅读,可以关注【泡泡机器人SLAM】公众号


点击阅读原文,即可获取本文下载链接。

欢迎来到泡泡论坛,这里有大牛为你解答关于SLAM的任何疑惑。

有想问的问题,或者想刷帖回答问题,泡泡论坛欢迎你!

泡泡网站:www.paopaorobot.org

泡泡论坛:http://paopaorobot.org/forums/


泡泡机器人SLAM的原创内容均由泡泡机器人的成员花费大量心血制作而成,希望大家珍惜我们的劳动成果,转载请务必注明出自【泡泡机器人SLAM】微信公众号,否则侵权必究!同时,我们也欢迎各位转载到自己的朋友圈,让更多的人能进入到SLAM这个领域中,让我们共同为推进中国的SLAM事业而努力!

商业合作及转载请联系liufuqiang_robot@hotmail.com

登录查看更多
9

相关内容

在数学(特别是功能分析)中,卷积是对两个函数(f和g)的数学运算,产生三个函数,表示第一个函数的形状如何被另一个函数修改。 卷积一词既指结果函数,又指计算结果的过程。 它定义为两个函数的乘积在一个函数反转和移位后的积分。 并针对所有shift值评估积分,从而生成卷积函数。
【KDD2020】自适应多通道图卷积神经网络
专知会员服务
119+阅读 · 2020年7月9日
专知会员服务
31+阅读 · 2020年4月24日
CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络
专知会员服务
43+阅读 · 2020年4月17日
神经网络的拓扑结构,TOPOLOGY OF DEEP NEURAL NETWORKS
专知会员服务
31+阅读 · 2020年4月15日
【ICLR-2020】网络反卷积,NETWORK DECONVOLUTION
专知会员服务
38+阅读 · 2020年2月21日
【泡泡图灵智库】点云序列的语义分割数据集
泡泡机器人SLAM
9+阅读 · 2019年9月20日
【泡泡图灵智库】LIMO: LiDAR-单目相机视觉里程计(arXiv)
泡泡机器人SLAM
48+阅读 · 2019年5月14日
Panoptic Feature Pyramid Networks
Arxiv
3+阅读 · 2019年1月8日
Stock Chart Pattern recognition with Deep Learning
Arxiv
6+阅读 · 2018年8月1日
Arxiv
8+阅读 · 2018年5月15日
Arxiv
4+阅读 · 2018年3月14日
Arxiv
8+阅读 · 2018年1月25日
VIP会员
相关VIP内容
【KDD2020】自适应多通道图卷积神经网络
专知会员服务
119+阅读 · 2020年7月9日
专知会员服务
31+阅读 · 2020年4月24日
CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络
专知会员服务
43+阅读 · 2020年4月17日
神经网络的拓扑结构,TOPOLOGY OF DEEP NEURAL NETWORKS
专知会员服务
31+阅读 · 2020年4月15日
【ICLR-2020】网络反卷积,NETWORK DECONVOLUTION
专知会员服务
38+阅读 · 2020年2月21日
Top
微信扫码咨询专知VIP会员