基于连续B样条曲线的几何深度神经网络

泡泡图灵智库,带你精读机器人顶级会议文章

标题:SplineCNN: Fast Geometric Deep Learning with Continuous B-Spline Kernels

作者:Matthias Fey∗, Jan Eric Lenssen∗, Frank Weichert, Heinrich Muller

来源:arXiv 2017

播音员:王肃

编译:刘彤宇

审核:张国强

欢迎个人转发朋友圈;其他机构或自媒体如需转载,后台留言申请授权

摘要

大家好,今天为大家带来的文章是——基于样条线核的快速几何深度学习,该文章发表于arXiv2017。

我们提出基于样条线的卷积神经网络(SplineCNNs),一种用于不规则结构化和几何输入(例如图形或网格)的深度神经网络的变体。我们的主要贡献是基于B样条的新型卷积算子,由于B样条基函数的局部支持性质,使得计算时间与内核大小无关。因此,我们通过使用固定数量的可训练权重进行参数化的连续核函数来获得传统CNN卷积算子的推广。与在频域中过滤的相关方法相比,所提出的方法纯粹在空间域中聚合特征。作为一个主要优势,SplineCNN允许深层架构的整个端到端训练,只使用几何结构作为输入,而不是手工制作的特征描述符。

为了进行验证,我们将该方法应用于图像图形分类,形状对应和图形节点分类等领域的任务,并且显示出其优于现有技术,同时速度更快,具有良好的独立性能。

主要贡献

提出基于样条线的卷积神经网络(SplineCNNs),这是一种针对不规则结构化数据的深层神经网络的变体。 主要贡献是可训练的空间连续卷积核,利用B样条基的性质有效地过滤任意维度的几何输入。

主要方法可以:

1、可应用于不同种类的不规则的数据结构,比如,任意(嵌入)图和网络。

2、使用输入的空间几何关系

3、无需使用手工特征描述子即可进行端到端的训练。

除此之外,还提供了高效的GPGPU算法和工具,可进行快速的训练和推断计算。

算法流程

主要结果

本文在图像分类,图节点分类和网格形状对应三个不同的任务上用不同的SplineCNN体系结构进行实验。 对于每个任务,使用基于样条线的卷积算子创建一个SplineCNN,用卷积层表示为SConv(k; Min; Mout)

内核大小k,最小输入功能映射和Mout输出功能映射。 另外,将完全连接的层表示为FC(o),其中o表示输出神经元的数量。

1、图像分类

采用了MINIST数据集——60000张训练样本和10000张测试样本,分为10类的手写体数字识别。

表一 经典CNN(LeNet5),MoNet和SplineCNN方法测试MNIST数据集(网格和超像素)的分类精确度

2、图节点分类实验

第二个实验通过Cora引文图解决了图节点分类问题。本实验使用Cora中1708个节点作为训练样本,500个节点作为测试样本,最后分离有标签和五标签的信息样本。

表二 不同学习方法(ChebNet,GCN,CayleyNet和SplineCNN)的Cora数据集上的图形节点分类。 显示精度是100次实验的平均精确度,其中对于每个实验,网络被训练200个epoch。

3、网格形状对应实验

第三个实验使用FAUST数据集,包含10组不同姿势的人体外形扫描样本,每组有10个;使用前80个作为训练样本,后20个作为测试样本。

表三 (a)SplineCNN及相关方法和(b)不同SplineCNN实验的形状对应实验的测地误差图。 x轴以直径的百分比显示测地距离,y轴显示位于正确节点周围给定测地半径内的对应关系的百分比。 我们的SplineCNN实现了低测地误差的最高精度,并且明显优于MoNet,GCNN和ACNN等其他常规方法。

图一 FAUST测试数据集的三个示例,每个节点都有SplineCNN预测的测地误差。 我们展示最好的(左),中位数(中)和最差的(右)测试示例,按平均测地误差排序

Abstract

We present Spline-based Convolutional Neural Networks (SplineCNNs), a variant of deep neural networks for irregular structured and geometric input, , graphs or meshes. Our main contribution is a novel convolution operator based on B-splines, that makes the computation time independent from the kernel size due to the local support property of the B-spline basis functions. As a result, we obtain a generalization of the traditional CNN convolution operator by using continuous kernel functions parametrized by a fixed number of trainable weights. In contrast to related approaches that filter in the spectral domain, the proposed method aggregates features purely in the spatial domain. As a main advantage, SplineCNN allows entire end-to-end training of deep architectures, using only the geometric structure as input, instead of handcrafted feature descriptors.

For validation, we apply our method on tasks from the fields of image graph classification, shape correspondence and graph node classification, and show that it outperforms or pars state-of-the-art approaches while being significantly faster and having favorable properties like domain-independence.

如果你对本文感兴趣,想要下载完整文章进行阅读,可以关注【泡泡机器人SLAM】公众号

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180709A063SL00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券