导读:图卷积网络(Graph Convolutional Network,简称GCN)最近两年大热,取得不少进展。作为 GNN 的重要分支之一,很多同学可能对它还是一知半解。PinSAGE( PinSage: 第一个基于 GCN 的工业级推荐系统)为 GCN 落地提供了实践经验,而本文是 PinSAGE 的理论基础,同样出自斯坦福,是 GCN 非常经典和实用的论文。
论文链接:Inductive Representation Learning on Large Graphs https://papers.nips.cc/paper/6703-inductive-representation-learning-on-large-graphs.pdf
在大规模图上学习节点 embedding ,在很多任务中非常有效,如学习节点拓扑结构的 DeepWalk 以及同时学习邻居特征和拓扑结构的 semi-GCN 。
但是现在大多数方法都是直推式学习, 不能直接泛化到未知节点。这些方法是在一个固定的图上直接学习每个节点 embedding ,但是大多情况图是会演化的,当网络结构改变以及新节点的出现,直推式学习需要重新训练(复杂度高且可能会导致 embedding 会偏移),很难落地在需要快速生成未知节点embedding的机器学习系统上。
本文提出归纳学习— GraphSAGE(Graph SAmple and aggreGatE) 框架,通过训练聚合节点邻居的函数(卷积层),使 GCN 扩展成归纳学习任务,对未知节点起到泛化作用。
直推式 ( transductive ) 学习:从特殊到特殊,仅考虑当前数据。在图中学习目标是学习目标是直接生成当前节点的 embedding,例如 DeepWalk、LINE,把每个节点 embedding 作为参数,并通过 SGD 优化,又如 GCN,在训练过程中使用图的拉普拉斯矩阵进行计算。 归纳 ( inductive ) 学习:平时所说的一般的机器学习任务,从特殊到一般:目标是在未知数据上也有区分性。
本文提出 GraphSAGE 框架的核心是如何聚合节点邻居特征信息,本章先介绍 GraphSAGE 前向传播过程(生成节点 embedding ),不同的聚合函数设定;然后介绍无监督和有监督的损失函数以及参数学习。
a. 可视化例子:下图是 GraphSAGE 生成目标节点(红色)embededing 并供下游任务预测的过程:
b. 伪代码:
4-5 行是核心代码,介绍卷积层操作:聚合与节点v相连的邻居(采样)k-1 层的 embedding,得到第 k 层邻居聚合特征
,与节点 v 第 k-1 层 embedding
拼接,并通过全连接层转换,得到节点 v 在第 k 层的 embedding
。
伪代码第 5 行可以使用不同聚合函数,本小节介绍五种满足排序不变量的聚合函数:平均、GCN 归纳式、LSTM、pooling 聚合器。(因为邻居没有顺序,聚合函数需要满足排序不变量的特性,即输入顺序不会影响函数结果)
a.平均聚合:先对邻居 embedding 中每个维度取平均,然后与目标节点embedding 拼接后进行非线性转换。
b. 归纳式聚合:直接对目标节点和所有邻居 emebdding 中每个维度取平均(替换伪代码中第5、6行),后再非线性转换:
c. LSTM 聚合:LSTM 函数不符合“排序不变量”的性质,需要先对邻居随机排序,然后将随机的邻居序列 embedding
作为 LSTM 输入。
d. Pooling 聚合器:先对每个邻居节点上一层 embedding 进行非线性转换(等价单个全连接层,每一维度代表在某方面的表示(如信用情况)),再按维度应用 max/mean pooling ,捕获邻居集上在某方面的突出的/综合的表现 以此表示目标节点 embedding 。
损失函数根据具体应用情况,可以使用基于图的无监督损失和有监督损失。
a. 基于图的无监督损失:希望节点 u 与“邻居”v 的 embedding 也相似(对应公式第一项),而与“没有交集”的节点
不相似(对应公式第二项)。
为节点 u 通过 GraphSAGE 生成的 embedding 。
表示负采样:节点
是从节点u的负采样分布
采样的,Q 为采样样本数。
b. 有监督损失:无监督损失函数的设定来学习节点 embedding 可以供下游多个任务使用,若仅使用在特定某个任务上,则可以替代上述损失函数符合特定任务目标,如交叉熵。
通过前向传播得到节点 u 的 embedding
,然后梯度下降(实现使用 Adam 优化器) 进行反向传播优化参数
和聚合函数内参数。
(分类器均采用 LR )
3.5 运行时间和参数敏感性
3.6 效果
原文链接:https://zhuanlan.zhihu.com/p/62750137
(*本文为 AI科技大本营转载文章,转载请联系作者)