前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >一文梳理冷启动推荐算法模型进展

一文梳理冷启动推荐算法模型进展

作者头像
张小磊
发布2021-08-06 10:06:13
1.5K0
发布2021-08-06 10:06:13
举报
文章被收录于专栏:机器学习与推荐算法

| 作者:朱勇椿

| 单位:中国科学院大学

| 研究方向:跨域推荐、多任务学习

如何给新加入的用户推荐可能感兴趣的物品?如何将新上架的物品推荐给潜在的用户?这两个问题分别是用户冷启动和物品冷启动,统称为冷启动推荐。冷启动问题是推荐系统中极具挑战的一个问题,也是一个业界学术界同时高度关注的问题,本期为大家分享一些冷启动推荐算法层面的思路。

冷启动推荐特指如何给新用户或者新物品进行推荐。“新”也就意味着交互数据少,因此很难抓获冷启动用户兴趣偏好,以及冷启动物品的特质。如何进行好的冷启动推荐,主要可以从以下几个方面着手:

  • 高效地利用side information
  • 高效地利用有限的交互数据
  • Explore & exploit

除了常见的用户和物品冷启动推荐以外,还有一些其他场景的冷启动问题,本文也会简单进行介绍。


一、高效地利用side information

我们把除了id信息以外的别的信息统称为side information,比如属性特征,用户性别、年龄特征,物品的类别、价格,额外的补充信息比如知识图谱,辅助领域等等。现有的推荐模型已经将用户、物品属性用到模型中,但是针对冷启动问题,这些辅助信息还可以有更加高效的使用方法。

1、高效利用属性特征

1.1 DropoutNet[1]

这篇文章改变了模型训练方式,在训练过程中加入dropout的机制,使得模型不过度依赖于ID embedding,而是其他内容特征。从而使得冷启动推荐主要是根据内容特征来进行推荐,减小了不好的ID embedding的影响。

1.2 MetaEmbedding[2]

冷启动推荐效果不佳,主要原因在于交互数量少,ID embedding学不好。那么为了更好地学习ID embedding,应该给ID embedding一个不错的初始化值。MetaEmbedding提出使用物品(广告)其他特征,通过一个生成器来输出一个ID embedding的初始化值。该方法通过使用已有的物品来模拟冷启动的过程来学习这个生成器,对于每一个新加入的物品,都是用这个生成器预测ID embedding的初始化值,基于这个初始化值再做后续的训练及预测。

1.3 Meta Warm Up Framework (MWUF)[3]

冷启动物品的ID embedding和非冷启动物品的ID embedding的分布不相同,而深度推荐模型的深度模块更适合非冷启动物品(大量数据都是在非冷启动物品上产生)。换句话说冷启动的ID embedding和深度模型之间存在一个gap。MWUF提出通过一个元拉伸网络从物品特征中预测一个拉伸函数,对冷启动ID embedding进行一个特征变换,将其变换到一个更好的特征空间中。另外MWUF还使用一个元偏移网络利用所有的交互过的用户的表示,来输出一个偏移向量,巩固ID embedding的表示(高效利用有限的交互数据)。

2、利用知识图谱[4]

现在有很多知识图谱可以直接使用,比如电影图谱、书籍图谱等等。知识图谱蕴含丰富的结构性知识,虽然冷启动的物品只有有限的交互数据,但是通过知识图谱可以挖掘到更多的信息,比如这个电影的演员、导演等等,通过这些关联的信息,也可以推断出哪些用户可能对这个电影感兴趣。

3、跨领域推荐

冷启动的用户或者物品在目标领域没有交互,但是他们在另外一些领域可能存在一些交互数据。跨领域推荐旨在使用辅助领域的数据来帮助目标领域上的推荐,是一种有效的解决冷启动推荐的方法。

基于映射的方法是一种高效的解决冷启动推荐的方法[5]。这类方法通过学习一个从源领域到目标领域的映射函数,将用户或者物品在源领域的embedding映射到目标领域,来作为目标领域的初始化。但是现有的这类方法在冷启动物品或者用户上泛化能力不足,TMCDR[6]提出了一种新的框架,来提升这类方法在冷启动上的泛化能力。

4、多行为推荐

一个用户可能只有很少的购买行为,在购买这个目标上,该用户是冷启动用户,但是该用户可能有很多其他行为,比如点击、加购物车等等。通过利用这些辅助行为也可以帮助目标行为上用户冷启动推荐[7,8]。


二、高效地利用有限的交互数据

对于没有交互数据的冷启动,只能尝试使用side information来提升效果,但有的冷启动场景是存在少量交互数据,因此如何高效地利用这有限的交互数据变得尤为重要。

1、Twitter recommendation[9]

针对推特上的冷启动物品推荐,使用用户交互过的物品,来预测一个分类器,然后使用该生成的分类器判断用户是否对冷启动的物品感兴趣,这个思想和metric-based meta learning很相似。

2、MeLU[10]

MeLU采用一种基于梯度的元学习算法MAML来学习一个深度推荐模型公共的初始化参数,然后针对每一个冷启动用户,使用有限的交互数据来对这个初始化模型进行微调,得到用户定制化的模型进行推荐。

3、MetaHIN[11]

异构图通常也含有大量额外的信息。MetaHIN在Melu的基础上引入异构信息网络,进一步提升了冷启动的效果。


三、Explore & Exploit

还有一大类冷启动方法集中在探索和利用上,主要思想是在冷启动的过程中,什么时候应该去探索用户额外的兴趣偏好,什么时候应该基于现有的兴趣偏好进行推荐。针对物品侧也是同理,什么时候应该尝试进行推广。这一块编者了解不多,想继续深入了解可参考[12,13]


四、其他场景的冷启动问题

1、冷启动场景

在推荐系统中有时会有新的场景出现,比如亚马逊电商推荐,增加一个母婴场景,新的场景通常只有少量交互数据,如何利用其他场景帮助冷启动场景进行推荐。S^2meta[14]提出了一种基于元学习的方法,思想和少样本学习类似。

2.冷启动市场营销任务

在推荐系统中每天会有大量新的市场营销任务来推广各种内容、广告等等。这些新的市场营销任务通常只会给有限的种子用户(对定向内容感兴趣的用户,可以理解为交互数据),如何根据少量种子用户进行更大规模的推广。MetaHeac[15]提出了一种基于元学习的方法,该方法同时可以建模多个市场营销任务之间的关系。


五、总结

本文主要介绍了算法层面的冷启动问题的解决方案。实际上解决冷启动问题仅仅依赖算法是不够的,还有很多其他途径来解决冷启动问题。比如产品可以制定一些产品策略,新用户加入时填表;up主上传视频时勾选合适的标签;模型的天级更新改为实时更新等等。最后,冷启动推荐需要高效地利用side information、有限的交互数据、Explore & Exploit。


参考文献

[1] DropoutNet: Addressing Cold Start in Recommender Systems. NeurIPS2017.

[2] Warm Up Cold-start Advertisements: Improving CTR Predictions via Learning to Learn ID Embeddings. SIGIR2019.

[3] Learning to Warm Up Cold Item Embeddings for Cold-start Recommendation with Meta Scaling and Shifting Networks. SIGIR2021.

[4] Knowledge-aware Graph Neural Networks with Label Smoothness Regularization for Recommender Systems. KDD2019.

[5] Cross-Domain Recommendation: An Embedding and Mapping Approach. IJCAI2017.

[6] Transfer-Meta Framework for Cross-domain Recommendation to Cold-Start Users. SIGIR2021.

[7] Multi-behavior Recommendation with Graph Convolutional Networks. SIGIR2020.

[8] Modeling the Sequential Dependence among Audience Multi-step Conversions with Multi-task Learning in Targeted Display Advertising. KDD2021.

[9] A Meta-Learning Perspective on Cold-Start Recommendations for Items. NeurIPS2017.

[10] MeLU: Meta-Learned User Preference Estimator for Cold-Start Recommendation. KDD2019.

[11] Meta-learning on Heterogeneous Information Networks for Cold-start Recommendation. KDD2020.

[12] A Contextual-Bandit Approach to Personalized News Article Recommendation. WWW2010.

[13] Policy Gradients for Contextual Recommendations. WWW2019.

[14] Sequential Scenario-Specific Meta Learner for Online Recommendation. KDD2019.

[15] Learning to Expand Audience via Meta Hybrid Experts and Critics for Recommendation and Advertising. KDD2021.

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-07-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习与推荐算法 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、高效地利用side information
  • 二、高效地利用有限的交互数据
  • 三、Explore & Exploit
  • 四、其他场景的冷启动问题
  • 五、总结
相关产品与服务
灰盒安全测试
腾讯知识图谱(Tencent Knowledge Graph,TKG)是一个集成图数据库、图计算引擎和图可视化分析的一站式平台。支持抽取和融合异构数据,支持千亿级节点关系的存储和计算,支持规则匹配、机器学习、图嵌入等图数据挖掘算法,拥有丰富的图数据渲染和展现的可视化方案。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档