前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >QQ浏览器:小说召回中的DSSM模型优化实践

QQ浏览器:小说召回中的DSSM模型优化实践

作者头像
腾讯大讲堂
发布2021-02-01 10:40:11
1.9K1
发布2021-02-01 10:40:11
举报
文章被收录于专栏:腾讯大讲堂的专栏

作者:jessiexyliu  腾讯PCG算法工程师

|导语 随着小说召回业务的需求发展,在注重点击率的同时,还需要关注阅读转化率的效果,故此我们开始了多目标召回模型的探索之旅。

一. 背景介绍

在一般的召回场景中,以点击为正样本来训练模型就基本可以满足需求,但是在小说推荐场景,点击其实只是用户很浅的小说行为,我们更关注的是如何让用户产生真正的阅读。在这样的背景下,我们希望可以搭建一个以阅读为目标的模型,无奈现实是骨感的,用户真实阅读的样本数远远小于推荐系统展现给用户的数量,同时有真实阅读的用户也仅占全量用户的一小部分,即存在数据稀疏问题(data sparsity,DS)。由此,我们考虑将点击和阅读相结合,用点击数据帮助训练阅读指标,多目标召回模型也就应运而生。

二. 多目标召回模型的演进

1. 初版模型:添加辅助loss

当我们要同时考虑点击和阅读效果时,最直观易行的方式就是先保持DSSM双塔结构不变,在原有的点击单目标loss基础上,加入阅读的辅助loss,希望模型在训练用户与点击书籍的向量相似度的同时,提升用户与阅读书籍的相似度。具体loss公式如下:

这样做的优点比较明显,操作简单易行,同时可以有效的防止过拟合。但模型的问题也显而易见,因为两者的embedding是完全共享的,我们的美好预期是一个embedding就可以既表达点击又表达阅读,但是实际由于点击和阅读向量本身会存在一定差异,强行用一个embedding表示,可能会同时折损两方信息,最后事倍功半。从离线效果评估来看,这版的指标也确实没有明显的效果,由此说明,还是要对模型结构做出一定调整,来适配多目标的需求。

离线指标:

2. 基于多塔结构的多目标召回模型:

由前面的离线验证效果可知,双塔结构一定程度会束缚模型对user和item的表达,这时很自然的就想到,需要用多塔来进行user和item的表征,但如何在“互相掣肘”和“互不干预”之间找到平衡,是多目标模型一直在力求解决的问题。我们这里同时尝试了多种模型构造方式。

1)四塔结构:这里是借鉴ESSM的思想,只共享底层embedding look-up table,上层用两个塔分别训练两个label对应的embedding向量。这里是希望在embedding层面完全将两个label的训练分开,只在计算loss的时候做两者的聚合,优点是不会再出现上面提到的“相互掣肘”的情况,缺点是没有解决阅读label样本稀疏问题,会导致对应user embedding的过拟合问题。

2)三塔结构:在上面四塔结构的基础上,将user合并为一个塔训练,item用两个塔分别训练两个label对应的embedding。这里的考虑还是阅读label的样本稀疏问题,所以user tower选择将两个目标合并训练,而相对来讲书籍的稀疏性并不明显,所以可以保留书籍侧的双塔双目标结构。

下面是两个结构的离线指标,可以看出两者在点击和阅读的hit ratio(即召回率指标)都有小幅的提升,但也都不显著。

3.基于MMOE的多目标召回模型

到目前为止,我们其实只是在“互相掣肘”和“互不干预”之间相互摇摆,还远没有达到“相辅相成”的程度。不论是Share Bottom Model的模型结构,还是soft参数共享的相关结构,都或多或少也存在现在的问题。那么该如何让两个目标既能相互作用,又能保留自己的独特信息呢?这时MMOE模型进入了我们的视野。

MMOE结构如下:

由于很多文章都已经介绍过MMOE模型,在此我就不再赘述了,对我们的场景进行MMOE的适配后,离线实验效果如下:

可以看到借鉴mmoe结构的离线效果最好,于是我们选取这版模型上线实验,最后从实验效果来看,这版模型也确实带来了阅读转化率的提升。

三. 后续优化

1. 多目标loss的不同组合方式:目前我们只采用了简单的线性加权,在确定模型结构后对权重值做微调,但其实这里的花样是很多的,比如用时长作为label的加权,或者ESSM一样的乘积方式等等,这里我们后续也会做更多的尝试。

2.模型结构的尝试:我们现有的优化逻辑,都是基于最初的单目标版本层层改进,但其实很多其他类型的模型结构都没有尝试过,比如阿里从MIND到ComiRec的Capsule网络系列等。

多目标召回领域还有很多东西可以实践探索,非常欢迎感兴趣的朋友们一起交流共同进步。

参考文献:

[1] Huang, Po-Sen, et al. "Learning deep structured semantic models for web search using clickthrough data." Proceedings of the 22nd ACM international conference on Information & Knowledge Management. 2013.

[2] Ma, Jiaqi, et al. "Modeling task relationships in multi-task learning with multi-gate mixture-of-experts." Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2018.

[3] Ma, Xiao, et al. "Entire space multi-task model: An effective approach for estimating post-click conversion rate." The 41st International ACM SIGIR Conference on Research & Development in Information Retrieval. 2018.

近期热文

浅谈SWOT分析法

《QQ炫舞》十二年成熟游戏的求变思新之路

基于Scrapy的爬虫解决方案

让我知道你在看

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-01-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯大讲堂 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 浅谈SWOT分析法
  • 《QQ炫舞》十二年成熟游戏的求变思新之路
  • 基于Scrapy的爬虫解决方案
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档