前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >ICLR'23 || NAGphormer:用于大图节点分类的Tokenized Graph Transformer

ICLR'23 || NAGphormer:用于大图节点分类的Tokenized Graph Transformer

作者头像
Houye
发布2023-10-25 09:22:32
3750
发布2023-10-25 09:22:32
举报
文章被收录于专栏:图与推荐图与推荐

论文标题:NAGphormer: A Tokenized Graph Transformer for Node Classification in Large Graphs.

论文链接:https://openreview.net/pdf?id=8KYeilT3Ow

图1 作者信息

此文发表于ICLR2023,是一篇将Transformer推广到大图上的工作。此前绝大多数的Graph Transformer将整个图作为输入,由于注意力机制平方计算复杂度的影响, 无法扩展到大图上的图数据挖掘的任务上。为了解决这个问题,作者提出了一种名为Hop2Token的策略,将输入数据由整图变为由邻域信息所构成的节点序列,从而引入批训练的策略来控制模型的训练开销。

核心模块

这篇文章提出了一种名为NAGphormer的Graph Transformer模型,该模型包含了两个核心模块,一个是Hop2Token模块,用于构建基于多跳邻域信息的节点序列;另一个是Attention-based readout function模块,用于生成最终的节点表征。该模型的整体框架如图2所示。

图2 NAGphormer的框架图

Hop2Token

顾名思义,该模块是将多跳邻域(Multi-hop neighborhood)转化为Token的形式,用于为每个节点构造输入序列。具体而言,为了刻画每个节点的邻域信息,作者利用了图扩散的方式,通过邻接矩阵在图上传播节点的属性特征来计算节点的邻域特征。

图3 邻域信息的获取

在获得邻域信息后,作者将节点的邻域信息按照跳数从低到高进行排列,用于构建基于多跳邻域的节点序列。通过这种方式,NAGphormer便可将整个图转化为节点序列的形式。Hop2Token的伪代码如图4所示。

图4 Hop2Token的伪

Hop2Token的优势有两点:一是在模型训练前为每个节点构建独立的输入序列,这种模式使得NAGphormer可以利用批训练的方式来控制训练代价,从而达到在大图上训练模型的目的;二是每个节点的多跳邻域序列可用于捕捉邻域之间的语义关联,这种关联信息是被之前的GNN模型所忽略的。在实践中,由于Transformer模块无法捕捉位置信息,作者为每个节点添加了基于拉普拉斯特征向量所构成的位置编码,用于提升模型的效果。

图5 加入位置编码

Attention-based readout function

在将节点序列输入到标准的Transformer训练后,会得到每个节点不同跳邻域的表征。为了计算最终的节点表征,作者提出了一种基于注意力的读出函数,其核心想法是基于注意力机制来自适应地聚合多跳邻域的信息,以形成最终的节点表征。

图6 Attention-based readout function

实验部分

作者在各种规模的图数据集上测试了模型在节点分类任务上的性能。

图7 数据集统计信息

图8 小图上的节点分类性能

图9 大图上的节点分类性能

从实验结果上看,该方法在保证模型性能的同时,还能提升模型的可扩展性。其消融实验也表明,基于注意力的读出函数也能有效地提升模型的表现。

图10 不同读出函数的表现

总结

NAGphormer 是一种用于大图节点分类任务的Graph Transformer模型,它利用Hop2Token模块构建节点的输入序列,并通过attention-based readout function得到最终的节点表示。然而仅仅依靠邻域传播的方式构建的token list可能无法很好地代表图上的信息,如全局依赖,异质性等等。后面可以考虑如何结合图上复杂的信息来更好地构建节点的token list。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2023-10-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 图神经网络与推荐系统 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 核心模块
    • Hop2Token
      • Attention-based readout function
      • 实验部分
      • 总结
      相关产品与服务
      图数据库 KonisGraph
      图数据库 KonisGraph(TencentDB for KonisGraph)是一种云端图数据库服务,基于腾讯在海量图数据上的实践经验,提供一站式海量图数据存储、管理、实时查询、计算、可视化分析能力;KonisGraph 支持属性图模型和 TinkerPop Gremlin 查询语言,能够帮助用户快速完成对图数据的建模、查询和可视化分析。
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档