2012年至今,随着深度神经网络理论与计算设备的发展,卷积神经网络(CNN)得到了快速发展,并被大量应用于计算机视觉、自然语言处理等领域。尤其是在图像分类、目标检测等主要的计算机视觉任务中,CNN一直都是最主流的方法。
卷积神经网络,虽然取得了巨大成功,但也面临较大局限,即局限于处理欧氏空间的数据(或者有规则的空间数据),图像、语音。
图1:图像、语音的空间数据,节点的连接是规则的,能够用一维、二维的矩阵表示,卷积神经网络处理起来很高效
面对无规则的空间数据,如交通流数据、社交多媒体网络数据、化学成分结构数据、生物基因蛋白数据以及知识图谱数据,传统卷积神经网络发挥不了作用。
图2:社交网络的图数据结构,每个节点连接都不尽相同,有的节点有2个连接,有的节点1个连接
规则与无规则的空间数据,本质上说,都可以表示成图结构的形式。那么,有没有一种卷积神经网络既适用于规则的图结构数据,又适用于不规则的数据呢?
近年来,图卷积神经网络(GCN)将深度神经网络应用于图结构数据上,取得了可喜的成果,已成为当下火热的研究方向。GCN在图像分类、目标检测、语义分割、视觉问答等领域的应用,已被陆续发表在CVPR、ICCV、ECCV、NeurIPS等计算机视觉与神经网络的顶级会议中。