Graph Heterogeneous Multi-Relational Recommendation https://www.aaai.org/AAAI21Papers/AAAI-615.ChenC.pdf
1. 背景
用户与商品之间会存在许多行为,比如点击,购买,加购等。这些异构多关系数据可以提供结构良好的信息,作者认为以往的工作没有很好地捕获用户和商品之间的高阶(high-hop)关系,因此本文提出了 Graph Heterogeneous Collaborative Filtering (GHCF) 。为了探索高阶异构用户-项目交互,本文利用图神经网络学习节点和关系的表征。此外,为了充分利用整个异构数据,在多任务学习框架下执行先进的高效非采样优化。
2. 问题定义
用户和商品为别表示为U和V,用户-商品交互数据可以表示为
,其中
表示第k个交互行为是否存在当前用户和商品中,有则为1,反之为0。
3. GHCF
如图所示为GHCF的框架图,主要包含embedding propagation layer,multi-task prediction module,efficient non-sampling learning module。
上式为常见的GCN应用于推荐系统的公式,其中
为用户u节点相关联的邻居商品节点,w为可学习权重,N为节点邻居的集合。但是这种常用的方式受到过度参数化的影响,并且该方式只考虑了节点embedding,忽略了边的作用。因此,作者改进为新的方式,公式如下,这里通过函数
将节点embedding和边embedding结合起来。其中
表示边的embedding,w为可学习参数,σ表示LeakyReLU激活函数,
,两个向量逐元素相乘。
和lightGCN类似,本文所提方法只考虑邻居节点而不聚合周围节点。当进行上述信息传播之后,更新关系embedding
。原始输入,即第0层的输入为经过id embedding layer得到的u,v,r的embedding。
经过多次信息传播之后,将每一层的输出embedding求均值得到最终的embedding,公式如下:
为了预测用户在每个行为上的可能性,将学习到的每个行为的表征合并输入到预测层,令
表示第k个行为的表征,下式表示用户u在商品v上进行行为k的可能性。
无需采样的学习学习方式是近期提出的方法,详见文献[1],他比传统的采样方法(如BPR)更有效且更高效。以第k个行为为例,一个batch中用户的集合为B,商品的集合为V,传统的加权回归可以定义为下式,其中c为每个
对应的权重,他的复杂度为O(|B||V|d)。
借鉴文献[1],作者将其改写为下式,其中表示和用户在k行为有交互的商品的集合,这个可以理解为就是正样本了。总体的复杂度为,由于仅仅表示正样本的集合,因此。从而缓解了计算复杂度,并且可以避免进行负采样。当然除了加权回归的损失函数,其他函数也都可以改写。
最终的损失函数为下式,将每一种交互行为作为一个子任务。
4. 实验结果
image.png
5. 总结
本文所提方案是针对多类型交互的异构关系进行建模的,即可以是点击、加购、购买等行为,作者将每一种行为作为一个子任务进行建模,最后通过多任务学习框架进行损失函数构建。在构建图信息传播的过程中,作者不仅仅采用节点上的信息,同时采用边的信息,进一步加强了不同信息的举个。并且,在损失函数构建时,采用不采样的方式改写损失函数,从而只需要用到正样本的集合就能进行训练,节省了时间。
Chen, C.; Zhang, M.; Zhang, Y.; Liu, Y.; and Ma, S. 2020c. Efficient Neural Matrix Factorization without Sampling for Recommendation. ACM Trans. Inf. Syst. 38(2). ISSN 1046- 8188.