前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >多任务学习——【SIGIR 2018】ESMM

多任务学习——【SIGIR 2018】ESMM

作者头像
小爷毛毛_卓寿杰
发布2021-09-10 11:33:34
2790
发布2021-09-10 11:33:34
举报
文章被收录于专栏:Soul Joy HubSoul Joy Hub

CVR预估面临两个关键问题:

  • Sample Selection Bias (SSB) 转化是在点击之后才“有可能”发生的动作,传统CVR模型通常以点击数据为训练集,其中点击未转化为负例,点击并转化为正例。但是训练好的模型实际使用时,则是对整个空间的样本进行预估,而非只对点击样本进行预估。即是说,训练数据与实际要预测的数据来自不同分布,这个偏差对模型的泛化能力构成了很大挑战。
  • Data Sparsity (DS) 作为CVR训练数据的点击样本远小于CTR预估训练使用的曝光样本。

点击—>转化,本身是两个强相关的连续行为,作者希望在模型结构中显示考虑这种“行为链关系”,从而可以在整个空间上进行训练及预测。这涉及到CTR与CVR两个任务:

在这里插入图片描述
在这里插入图片描述

可以看到左侧就是我们要求解的目标pCVR,通过引入右侧的两个辅助任务pCTCVR和pCTR:

在这里插入图片描述
在这里插入图片描述

将乘法转化为除法,我们可以得到pCVR的计算:

在这里插入图片描述
在这里插入图片描述
  • 在整个样本空间建模,而不像传统CVR预估模型那样只在点击样本空间建模
  • 共享特征表示。由于CTR任务的训练样本量要大大超过CVR任务的训练样本量,ESMM模型中特征表示共享的机制能够使得CVR子任务也能够从只有展现没有点击的样本中学习,从而能够极大地有利于缓解训练数据稀疏性问题
  • 损失函数由两部分组成,即pCTCVR和pCTR输出的交叉熵:
在这里插入图片描述
在这里插入图片描述
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2021-05-11 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档