前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >推荐系统遇上深度学习(一三零)-[阿里]电商搜索CTR预估中页面级反馈建模

推荐系统遇上深度学习(一三零)-[阿里]电商搜索CTR预估中页面级反馈建模

作者头像
石晓文
发布2022-04-06 19:32:48
9670
发布2022-04-06 19:32:48
举报
文章被收录于专栏:小小挖掘机小小挖掘机

今天来介绍一篇阿里在WSDM2022上中稿的文章,与之前的用户兴趣建模的论文引入单点用户行为序列不同,本文引入了页面级的用户行为序列,充分建模用户反馈的上下文信息和页面兴趣演化过程。出发点较新颖,一起来研究一下。

1、背景

电商场景下,搜索扮演着十分重要的角色。典型的搜索场景如下图所示,当用户输入搜索关键词后,搜索引擎会选择一堆物品并以翻页( Search Result Page,简称SRP)的形式展现给用户。每当用户翻到页面的底端或者重新输入搜索关键词,搜索引擎会展示新的SRP。在用户最终下单前,通常会浏览多个SRP同时与多个item产生交互行为。为了达到更好的推荐效果,建模用户在这些SRP上的反馈显得十分重要。

传统的用户行为建模,大都建模用户正向的反馈(只使用点击或下单序列),如DIN,DIEN。而在DFN(Deep Feedback Network)中,证明了同时建模用户正向反馈和负向反馈能够取得更好的效果。但是,上述的方法只引入了用户的单点反馈信息,同时将用户的反馈信息拆成单独的队列,忽略了展现在同一SRP上不同item的相互影响以及其他的上下文信息。

那么为了解决上述所提出的问题,将传统的单点行为序列建模升级为页面级用户行为建模,充分建模用户反馈的上下文信息。

那么,这种页面级历史行为的建模核心是什么呢?论文从两方面展开:

1)页面内上下文信息建模(Intra-page context information):用户对item的反馈受相邻展示的item的影响。建模页面的上下文信息能够更好的推测用户的兴趣。一方面,用户的正向反馈是存在一定噪声的,举例来说,如果页面上展示的大部分是同一品牌的item,那么用户的点击行为并不一定能代表用户对该品牌的偏好。另一方面,用户通常会对同一页面上的物品进行相互比较,如果页面上展示了许多不同品牌的item,那么用户的点击行为更能反应用户对该品牌的偏好。 2)页面间用户兴趣演化(Inter-page interest evolution):论文对用户在不同页面上的兴趣演化做出了一定的假设。用户在搜索时的意图和兴趣可以认为是一个逐渐收敛的过程,用户在之前页面中的动态意图可以通过后续页面中的交互进行去噪,因为后续页面中的交互与最终的决策更加相关。这样假设个人感觉是合理的,用户在刚进入搜索时可能只知道想买某一类型的商品,如情人节礼物,但具体买何种礼物不太清楚。随着不断的下刷,不断的对比,用于可能逐渐明确哪种礼物比较适合,意图逐渐清晰(例子可能不太恰当,欢迎一体探讨)。

为了建模上述两方面的信息,论文提出了RACP(Recurrent Attention over Contextualized Page se- quence),通过一种层级结构建模用户的页面级行为反馈。下一节对具体的细节进行介绍。

2、RACP介绍

2.1 整体介绍

如下图所示,RACP的主要结构从下到上主要包含四部分:Embedding Layer, Intra-page Context-aware Interest Layer, Inter-page Interest Backtracking Layer和Page-level Interest Aggregation Layer。接下来对这几部分进行分别介绍。

2.2 Embedding Layer

模型的输入包含以下几方面:

目标item特征:item特征包括item id,品类id,品牌id,店铺id和一些统计特征(点击数和下单数)等等 用户特征和Query特征:用户画像特征包括年龄,性别,购买力等级等。Query特征包含query id,query字符串,分词信息以及预测的query对应的品类id等特征。 用户页面级历史行为SRPs:用户的页面级历史行为序列并非只包含带有正反馈的页面序列,如果一个页面没有用户的反馈,也同样会包含在历史行为中。每一个SRP包含展示的item列表信息,页面对应的query特征等。

这里要注意一点是,用户的页面级行为序列经过特殊处理,即对应页面的query要和当次搜索的query的品类需要相同,从而避免无关的搜索行为对预测产生影响,这相当于SIM中的Hard-Search的方法对历史行为进行过滤。

2.3 Intra-page Context-aware Interest Layer

Intra-page Context-aware Interest Layer主要建模页面内的信息,引入了页面粒度的attention机制。计算过程如下:

pi是最终的页面信息表示,那么公式中的其他符号代表的含义是什么呢?Qi代表的是用户当前页面的意图表示,具体的计算过程在下一节介绍。xi,j代表页面中第j个item的特征,fi,j代表用户对页面中第j个item的反馈特征(点击与否),ci,j代表页面中第j个item对应的上下文信息,论文中给出了5个方面的上下文信息:1)query以及query对应的品类,2)页面中与第j个item相同品类的item的个数,3)页面中与第j个item相同品牌的item的个数,4)页面中与第j个item相同卖家的item的个数,5)第j个item在价格,展示位置,销量等信息上的相对排序。

2.4 Inter-page Interest Backtracking Layer

Inter-page Interest Backtracking Layer主要建模用户的兴趣演进过程,这里比较有意思的点是,与DIEN建模用户兴趣演化不同,这里采用的是兴趣回溯的方式,即从用户的最后一个页面信息,对用户在每个页面上的兴趣进行回溯(Backtracking)。这里采用GRU结构,计算过程如下:

这里使用GRU同时采用回溯的方式,基于我们前文所介绍的假设,即认为用户的兴趣在搜索过程中是一个不断收敛的过程,使用用户在后续页面的交互行为可以推测用户在前面页面的兴趣。上面公式中的符号这里稍作解释,Qt代表用户第t个页面历史行为对应的意图表示,通过GRU计算得到,初始的兴趣表示QT为用户特征,当前搜索特征以及target item特征的拼接,为用户当前的意图表示。pt为第t个页面历史行为的页面向量。

这里个人感觉公式有些混乱,pt应该改为pt+1是更加合理的。

2.5 Page-level Interest Aggregation Layer

经过上面的介绍可以看出,每个页面的表示是通过Intra和Inter两个模块共同得到的,接下来就是类似于DIN的过程,与当前用户意图更相近的页面信息能够对预测产生更大的影响。计算公式如下:

2.6 模型训练

最后,用户特征u,query向量qT,目标item特征xt和加权页面行为表示s进行拼接,输入到MLP层得到点击率预估值,并使用logloss进行训练:

3、实验结果

论文将RACP与许多经典的Baseline方法在两个数据集上进行了对比,均取得了一定程度的提升:

4、总结

在用户行为建模逐渐进入深水区的情况下,论文创新性的引入了页面级的历史行为序列,充分考虑页面中item的相互影响以及页面兴趣的演化过程,具有一定的借鉴意义。不过个人认为还是存在一些值得考虑的问题,首先,CTR预估为单点兴趣预估,无法获取到同一页面中相邻展示的item信息,那么使用页面向量与单一item向量做attention的方式是否合理?这种页面兴趣反馈是否更加适用于重排等阶段?其次,即使对页面行为限定在同一品类的搜索词下,将用户兴趣回溯运用在不同的搜索过程中是否合理?是否可以考虑类似DSIN的方式,用户意图在同次搜索下进行回溯?以上是我个人的一些想法,可能存在不合理的地方,欢迎大家一起交流想法!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-02-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 小小挖掘机 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1、背景
  • 2、RACP介绍
    • 2.1 整体介绍
      • 2.2 Embedding Layer
        • 2.3 Intra-page Context-aware Interest Layer
          • 2.4 Inter-page Interest Backtracking Layer
            • 2.5 Page-level Interest Aggregation Layer
              • 2.6 模型训练
              • 3、实验结果
              • 4、总结
              领券
              问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档