前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >论文阅读-----强化学习在推荐系统中的应用

论文阅读-----强化学习在推荐系统中的应用

原创
作者头像
邵维奇
修改2021-01-14 17:49:08
9010
修改2021-01-14 17:49:08
举报

Reinforcement Learning to Optimize Long-term User Engagement in Recommender Systems

看这篇文章主要是在知乎和腾讯云上看的,主要是文章发在KDD2019上没有下载渠道。这篇文章主要的亮点在于对feedback,dwellingtime,return backtime等的考虑来提高用用户的长期喜爱度。

首先利用log_data训练一个模拟器S-NET(采用监督学习,使其能够在未发生数据上有一个不错的generation),S-NET的主要功能是模拟对未有数据的输出,for example:强化学习在收集数据时会产生很多没有发生过的数据S ,S--input--》S-NET 得到feedback,dwellingtime,return back time等需要的参数。

offline--training:

state

F,D,BT,IS_LIKE=S-NET(state)

update state

store-transition(state,return,done,state_next)

sample data from store-transition

training-DQN

sample data from stor-transition

trianing-S-NET

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Reinforcement Learning to Optimize Long-term User Engagement in Recommender Systems
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档