这篇文章总体而言是一个无监督的学习策略。在图表征学习中引入码率衰减的概念,使得图表征两两正交,达到不同类别的节点有较强区分度,且同类型节点又能内部更紧凑。
图节点表征的学习方法总体来说可以分为基于随机游走和基于对比学习的方法,但是现有方法,如DeepWalk或者GRACE,都是针对局部节点的,忽略了节点的全局信息。因此,这篇文章主要解决的问题就是如何合理利用全局信息来改善节点表征,使其学习时能考虑图的整体结构。然而,这个问题仍然是有难点的,如果用简单的聚类方法去聚合这些多样化的信息,则又会导致引入额外的噪音信息。因此,作者引入最大化码率衰减的方式来学习节点表征的方法来学习图的几何特征,即Geometric Graph Representation Learning (G^2R)。模型整体流程如图所示:
首先使用最大化码率衰减将不同组群的节点映射到不同的子空间上,然后优化这个子空间里面的信息,使得每个子空间紧致,而不同子空间分散。
将无监督的表征结果单独拿出来以后用逻辑回归分类器做简单判别,可以得到以下结果。
从实验效果来看G^2R 的表征更能学到有区分度的表征。将得到的表征用PCA降维以后可以观测不同类别之间是否真的两两正交:
这里每一个小图只有两个类别,可以很明显的发现两组节点信息真的可以有明显的区分度,而群组内部的信息也很容易聚合在一起。