【泡泡图灵智库】基于连续B样条曲线的几何深度神经网络

2018 年 7 月 8 日 泡泡机器人SLAM

泡泡图灵智库,带你精读机器人顶级会议文章

标题:SplineCNN: Fast Geometric Deep Learning with Continuous B-Spline Kernels

作者:Matthias Fey∗, Jan Eric Lenssen∗, Frank Weichert, Heinrich Muller

来源:arXiv 2017

播音员:王肃

编译:刘彤宇

审核:张国强

欢迎个人转发朋友圈;其他机构或自媒体如需转载,后台留言申请授权


摘要

       大家好,今天为大家带来的文章是——基于样条线核的快速几何深度学习,该文章发表于arXiv2017。


        我们提出基于样条线的卷积神经网络(SplineCNNs),一种用于不规则结构化和几何输入(例如图形或网格)的深度神经网络的变体。我们的主要贡献是基于B样条的新型卷积算子,由于B样条基函数的局部支持性质,使得计算时间与内核大小无关。因此,我们通过使用固定数量的可训练权重进行参数化的连续核函数来获得传统CNN卷积算子的推广。与在频域中过滤的相关方法相比,所提出的方法纯粹在空间域中聚合特征。作为一个主要优势,SplineCNN允许深层架构的整个端到端训练,只使用几何结构作为输入,而不是手工制作的特征描述符。

       为了进行验证,我们将该方法应用于图像图形分类,形状对应和图形节点分类等领域的任务,并且显示出其优于现有技术,同时速度更快,具有良好的独立性能。

主要贡献

       提出基于样条线的卷积神经网络(SplineCNNs),这是一种针对不规则结构化数据的深层神经网络的变体。 主要贡献是可训练的空间连续卷积核,利用B样条基的性质有效地过滤任意维度的几何输入。

        主要方法可以:

        1、可应用于不同种类的不规则的数据结构,比如,任意(嵌入)图和网络。

        2、使用输入的空间几何关系

        3、无需使用手工特征描述子即可进行端到端的训练。

        除此之外,还提供了高效的GPGPU算法和工具,可进行快速的训练和推断计算。


算法流程

主要结果

       本文在图像分类,图节点分类和网格形状对应三个不同的任务上用不同的SplineCNN体系结构进行实验。 对于每个任务,使用基于样条线的卷积算子创建一个SplineCNN,用卷积层表示为SConv(k; Min; Mout)

内核大小k,最小输入功能映射和Mout输出功能映射。 另外,将完全连接的层表示为FC(o),其中o表示输出神经元的数量。

1、图像分类

       采用了MINIST数据集——60000张训练样本和10000张测试样本,分为10类的手写体数字识别。   

表一  经典CNN(LeNet5),MoNet和SplineCNN方法测试MNIST数据集(网格和超像素)的分类精确度

2、图节点分类实验

第二个实验通过Cora引文图解决了图节点分类问题。本实验使用Cora中1708个节点作为训练样本,500个节点作为测试样本,最后分离有标签和五标签的信息样本。

表二   不同学习方法(ChebNet,GCN,CayleyNet和SplineCNN)的Cora数据集上的图形节点分类。 显示精度是100次实验的平均精确度,其中对于每个实验,网络被训练200个epoch。

3、网格形状对应实验

第三个实验使用FAUST数据集,包含10组不同姿势的人体外形扫描样本,每组有10个;使用前80个作为训练样本,后20个作为测试样本。

表三 (a)SplineCNN及相关方法和(b)不同SplineCNN实验的形状对应实验的测地误差图。 x轴以直径的百分比显示测地距离,y轴显示位于正确节点周围给定测地半径内的对应关系的百分比。 我们的SplineCNN实现了低测地误差的最高精度,并且明显优于MoNet,GCNN和ACNN等其他常规方法。

图一  FAUST测试数据集的三个示例,每个节点都有SplineCNN预测的测地误差。 我们展示最好的(左),中位数(中)和最差的(右)测试示例,按平均测地误差排序

Abstract

     We present Spline-based Convolutional Neural Networks (SplineCNNs), a variant of deep neural networks for irregular structured and geometric input, , graphs or meshes. Our main contribution is a novel convolution operator based on B-splines, that makes the computation time independent from the kernel size due to the local support property of the B-spline basis functions. As a result, we obtain a generalization of the traditional CNN convolution operator by using continuous kernel functions parametrized by a fixed number of trainable weights. In contrast to related approaches that filter in the spectral domain, the proposed method aggregates features purely in the spatial domain. As a main advantage, SplineCNN allows entire end-to-end training of deep architectures, using only the geometric structure as input, instead of handcrafted feature descriptors.

     For validation, we apply our method on tasks from the fields of image graph classification, shape correspondence and graph node classification, and show that it outperforms or pars state-of-the-art approaches while being significantly faster and having favorable properties like domain-independence.



如果你对本文感兴趣,想要下载完整文章进行阅读,可以关注【泡泡机器人SLAM】公众号


点击阅读原文,即可获取本文下载链接。

欢迎来到泡泡论坛,这里有大牛为你解答关于SLAM的任何疑惑。

有想问的问题,或者想刷帖回答问题,泡泡论坛欢迎你!

泡泡网站:www.paopaorobot.org

泡泡论坛:http://paopaorobot.org/forums/


泡泡机器人SLAM的原创内容均由泡泡机器人的成员花费大量心血制作而成,希望大家珍惜我们的劳动成果,转载请务必注明出自【泡泡机器人SLAM】微信公众号,否则侵权必究!同时,我们也欢迎各位转载到自己的朋友圈,让更多的人能进入到SLAM这个领域中,让我们共同为推进中国的SLAM事业而努力!

商业合作及转载请联系liufuqiang_robot@hotmail.com

登录查看更多
2

相关内容

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。
最新《深度多模态数据分析》综述论文,26页pdf
专知会员服务
298+阅读 · 2020年6月16日
【CVPR2020-Oral】用于深度网络的任务感知超参数
专知会员服务
25+阅读 · 2020年5月25日
基于深度学习的手语识别综述
专知会员服务
46+阅读 · 2020年5月18日
【CVPR2020】图神经网络中的几何原理连接
专知会员服务
56+阅读 · 2020年4月8日
【CVPR2020-百度】用于视觉识别的门控信道变换
专知会员服务
12+阅读 · 2020年3月30日
【泡泡点云时空】PointConv: 3D点云的深度卷积网络
泡泡机器人SLAM
23+阅读 · 2019年6月12日
【泡泡点云时空】FlowNet3D:学习三维点云中的场景流
泡泡机器人SLAM
41+阅读 · 2019年5月19日
【泡泡图灵智库】基于几何一致性网络的摄像机运动估计
Star-Transformer
Arxiv
5+阅读 · 2019年2月28日
3D Face Modeling from Diverse Raw Scan Data
Arxiv
5+阅读 · 2019年2月13日
Arxiv
4+阅读 · 2018年3月14日
Arxiv
8+阅读 · 2018年1月25日
Arxiv
5+阅读 · 2017年12月29日
VIP会员
相关VIP内容
最新《深度多模态数据分析》综述论文,26页pdf
专知会员服务
298+阅读 · 2020年6月16日
【CVPR2020-Oral】用于深度网络的任务感知超参数
专知会员服务
25+阅读 · 2020年5月25日
基于深度学习的手语识别综述
专知会员服务
46+阅读 · 2020年5月18日
【CVPR2020】图神经网络中的几何原理连接
专知会员服务
56+阅读 · 2020年4月8日
【CVPR2020-百度】用于视觉识别的门控信道变换
专知会员服务
12+阅读 · 2020年3月30日
相关论文
Star-Transformer
Arxiv
5+阅读 · 2019年2月28日
3D Face Modeling from Diverse Raw Scan Data
Arxiv
5+阅读 · 2019年2月13日
Arxiv
4+阅读 · 2018年3月14日
Arxiv
8+阅读 · 2018年1月25日
Arxiv
5+阅读 · 2017年12月29日
Top
微信扫码咨询专知VIP会员