01 什么是冷启动 推荐系统的主要目标是将大量的物品推荐给可能喜欢的用户, 这里就涉及物品和用户两类对象,任何平台,物品和用户都是不断增长变化的,所以一定会频繁的面对新的物品和新的用户, 推荐系统冷启动问题指的就是对于新注册的用户或者新入库的物品 另外,如果是新开发的平台,初期用户很少,用户行为也不多,常用的协同过滤、深度学习等依赖大量用户行为的算法不能很好的训练出精准的推荐模型,怎么让推荐系统很好的运转起来,让推荐变得越来越准确,这个问题就是系统冷启动 SIGIR22 | 基于行为融合的冷启动推荐算法 近期推荐系统冷启动顶会论文集锦 一文梳理冷启动推荐算法模型进展 总之,推荐系统冷启动主要分为物品冷启动、用户冷启动和系统冷启动三大类。 物品冷启动:当一个系统中出现了新的物品时,我们需要向用户推荐这个物品,然而系统中并没有关于该物品的任何信息,用户无法感知新产品的存在,这就给推荐系统的推荐带来一定的麻烦。 根据相似度,将它们推荐给喜欢过和它们相似物品的用户,这就用到了基于项目的协同过滤算法,具体实现方案,可以参考第三章的内容。
今天给大家简要分享的是发表在SIGIR2022会议上的一篇关于冷启动推荐算法的短文,其核心思想是通过设计基于上下文的自适应嵌入算法来抵消特征分布的差异,以此将冷启动用户的特征嵌入转化为与现有“热”用户相似的特征状态 对数据有限的冷启动用户进行有效推荐是一个固有挑战。 现有的深度推荐算法利用用户的内容特征和行为数据来产生个性化的推荐列表,但由于存在以下挑战,使得在冷启动用户身上往往面临着显著的性能下降:(1)冷启动用户可能与现有用户存在非常不同的特征分布。 (2) 冷启动用户的少量行为数据很难被算法有效且高效利用。基于此,本文提出了一个名为Cold-Transformer的推荐模型来缓解以上问题。 图1:本文提出的基于双塔框架的模型示意图。 最后,为了进行大规模的工业推荐任务,本文基于双塔结构,将用户和目标物品进行解耦。
个人网站、项目部署、开发环境、游戏服务器、图床、渲染训练等免费搭建教程,多款云服务器20元起。
这两个问题分别是用户冷启动和物品冷启动,统称为冷启动推荐。冷启动问题是推荐系统中极具挑战的一个问题,也是一个业界学术界同时高度关注的问题,本期为大家分享一些冷启动推荐算法层面的思路。 3、跨领域推荐 冷启动的用户或者物品在目标领域没有交互,但是他们在另外一些领域可能存在一些交互数据。跨领域推荐旨在使用辅助领域的数据来帮助目标领域上的推荐,是一种有效的解决冷启动推荐的方法。 ? MeLU采用一种基于梯度的元学习算法MAML来学习一个深度推荐模型公共的初始化参数,然后针对每一个冷启动用户,使用有限的交互数据来对这个初始化模型进行微调,得到用户定制化的模型进行推荐。 MetaHeac[15]提出了一种基于元学习的方法,该方法同时可以建模多个市场营销任务之间的关系。 ? ---- 五、总结 本文主要介绍了算法层面的冷启动问题的解决方案。 实际上解决冷启动问题仅仅依赖算法是不够的,还有很多其他途径来解决冷启动问题。比如产品可以制定一些产品策略,新用户加入时填表;up主上传视频时勾选合适的标签;模型的天级更新改为实时更新等等。
-- 转载请声明来源和作者信息 -- 冷启动算法基于令牌桶算法实现。 令牌桶算法的原理是:按一定的速率往令牌桶中放入令牌,当接收到请求时,从令牌桶申请令牌,只有拿到令牌的请求才能通过。 例如,想要使用令牌桶算法限制接口的最大QPS为200,那么就要每5毫秒就要生产一个令牌放入令牌桶,且生产令牌放入的速度不变。 冷启动算法用于控制令牌桶的令牌生产速率,即控制每个令牌生产的时间间隔。 假设冷启动时长为10秒,初始状态为冷启动状态,限流阈值为200QPS,正常情况下生产令牌的速率应该为5毫秒/个,而在冷启动阶段,速率会从最小值上升至5毫秒/个,最小速率与冷启动系数有关,与冷启动周期时长有关 Sentinel与Guava的实现不同,Sentinel可能是出于对性能的考虑,并不控制每个请求的通过时间间隔,只控制每秒钟能通过的请求数。 通过下面这张图来理解冷启动算法。 ? thresholdPermits:从冷启动到正常的令牌桶中令牌数量的阈值,当令牌桶中的令牌数量超过该值时,则进入冷启动阶段。
跨域冷启动推荐是推荐系统中一个日益新出现的问题。现有的工作主要集中于解决跨域用户推荐或冷启动内容推荐。然而,当一个新域在其早期阶段发展时,它具有与源域相似的潜在用户,但交互要少得多。 为了弥补这一差距,我们提出了一个自我训练的跨主题用户偏好学习(对)框架,该框架针对具有各种语义标签的冷启动推荐,比如项目或视频类型的属性。 更具体地说,我们考虑了三个层次的偏好,包括用户历史记录、用户内容和用户组,以提供可靠的推荐。由于用户历史记录由一个领域感知的序列模型表示,一个频率编码器被应用于用户内容偏好学习的底层标签。 在两个数据集上的大量实验证明了在用户和内容冷启动情况下耦合的效率。通过部署为期一周的在线A/B测试,我们发现夫妻的点击率(CTR)优于淘宝应用程序上使用的其他基线。 冷启动推荐的跨领域用户偏好学习.pdf
算法,以更好地缓解 I2I 推荐的冷启动问题。 然而对很多新品较多的场景和应用上,例如优酷新视频发现场景和闲鱼这种二手电商社区,由于没有历史行为累计,商品的冷启动问题异常严重,behavior-based 算法在这些商品上的效果较差。 冷启动一直以来都是推荐系统重要的挑战之一, 常见的 content-based 方法是引入商品的内容信息,利用商品之间的文本、描述、类目等内容信息进行 I2I 相似度矩阵的计算。 因此,本文提出结合商品行为 & 内容信息的半参表示算法 SPE (Semi-Parametric Embedding), 以缓解 I2I 推荐中的冷启动问题。 另外本文引入 sDAE 来帮助学习更强力的内容表示,以达到更鲁棒的效果。3 个真实数据集、3类对比推荐算法、4 种评价指标上的对比实验,验证了该算法的可靠性和鲁棒性。
2.冷启动和EE问题 推荐系统需要根据历史的用户行为和兴趣偏好预测用户未来的行为和兴趣,因此历史用户行为某种程度上成为推荐推荐的重要先决条件。 实际过程中,我们面对大量的新用户,这些用户我们并不知道他们的profile,对于这些用户,常用的冷启动的算法包括根据已有的个人静态信息(年龄、性别、地理位置、移动设备型号等)为用户进行推荐。 与用户的冷启动相对应的,则是item的冷启动,当一个新物品加入站内,如何快速的展现的用户。 比较简单的方式我们可以可以根据ctr排序,给冷启动用户推荐最热门点击率最高的物品,给足球迷推荐点击率最高的足球相关物品,显然这样做会保证我们推荐结果的ctr会比较高。 6.结束语 本文简单介绍了推荐系统中一直存在的两大问题:冷启动和EE问题,并简单阐述了业界解决这两大问题的一些常见解决方法和算法。
推荐系统里面有两个经典问题:EE问题和冷启动问题。 什么是EE问题?又叫exploit-explore问题。 除了bandit算法之外,还有一些其他的explore的办法,比如:在推荐时,随机地去掉一些用户历史行为(特征)。 COFIBA算法 基于这些思想,有人提出了算法COFIBA(读作coffee bar)13,简要描述如下: 在时刻t,用户来访问推荐系统,推荐系统需要从已有的候选池子中挑一个最佳的物品推荐给他,然后观察他的反馈 3.2 基于bandit的主题冷启动强化策略 首轮纯冷启动,会主动推给用户随机的10个主题样例,获得前期样本; 后进行迭代操作。 这边笔者在模拟实际情况,譬如在做一个新闻推荐的内容,需要冷启动。
本文是推荐系统遇上深度学习系列的第五十一篇文章,来谈谈推荐系统中冷启动的解决吧。 1、冷启动问题的分类 咱都知道,冷启动问题是推荐系统中面临的难题之一。 冷启动问题主要分为以下三类: 1)用户冷启动:用户冷启动主要解决如何给新用户做个性化推荐的问题。 2)物品冷启动:物品冷启动主要解决如何将新的物品推荐给可能对它感兴趣的用户这一问题。 3)系统冷启动:系统冷启动主要解决如何在一个新开发的网站上(还没有用户,也没有用户行为,只有一些物品的信息)设计个性化推荐系统。 今天咱们主要来谈谈用户冷启动和物品冷启动问题的解决。 最后简要介绍一些深度学习方法的解决方案。 2、用户冷启动的解决方案 2.1 使用热门榜单 当新用户来的时候,把近一周、近一个月比较热门的item推荐给用户。 每首歌都可以标识为一个400维的向量,然后通过常见的向量相似度算法计算出歌曲的相似度。 4、基于深度学习的方法 基于深度学习的冷启动方案也有不少了。这里咱们简单谈一谈。
顺序推荐者面临的一个基本挑战是捕获用户的顺序模式,以便对用户如何在商品之间传输进行建模。然而,在许多实际场景中,有大量的冷启动用户只有很少的交互记录。 因此,现有的顺序推荐模型将失去它们的预测能力,因为与只有有限交互的用户相比,学习顺序模式很困难。 在这项工作中,我们的目标是通过一个名为MetaTL的新框架来改进冷启动用户的顺序推荐,该框架通过元学习来学习建模用户的转换模式。 具体来说,提议的MetaTL:(i)将冷启动用户的顺序建议作为一个少量学习问题;(ii)采用基于翻译的架构,提取用户之间的动态转换模式;(iii)采用元过渡学习,使冷启动用户在有限的交互下能够快速学习, 使用元过渡学习对冷启动用户的顺序推荐.pdf
一、推荐的概述 在推荐系统中,通常是要向用户推荐商品,如在购物网站中,需要根据用户的历史购买行为,向用户推荐一些实际的商品;如在视频网站中,推荐的则是不同的视频;如在社交网站中,推荐的可能是用户等等,无论是真实的商品 推荐的算法有很多,包括协同过滤(基于用户的协同过滤和基于物品的协同过滤)以及其他的一些基于模型的推荐算法。 二、基于图的推荐算法PersonalRank算法 1、PersonalRank算法简介 在协同过滤中,主要是将上述的用户和商品之间的关系表示成一个二维的矩阵(用户商品矩阵)。 而在基于图的推荐算法中,将上述的关系表示成二部图的形式,为用户A推荐商品,实际上就是计算用户A对所有商品的感兴趣程度。 PersonalRank算法对通过连接的边为每个节点打分,具体来讲,在PersonalRank算法中,不区分用户和商品,因此上述的计算用户A对所有的商品的感兴趣的程度就变成了对用户A计算各个节点B,C,
一、推荐的概述 在推荐系统中,通常是要向用户推荐商品,如在购物网站中,需要根据用户的历史购买行为,向用户推荐一些实际的商品;如在视频网站中,推荐的则是不同的视频;如在社交网站中,推荐的可能是用户等等 推荐的算法有很多,包括协同过滤(基于用户的协同过滤和基于物品的协同过滤)以及其他的一些基于模型的推荐算法。 二、基于图的推荐算法PersonalRank算法 1、PersonalRank算法简介 在协同过滤中,主要是将上述的用户和商品之间的关系表示成一个二维的矩阵(用户商品矩阵)。 而在基于图的推荐算法中,将上述的关系表示成二部图的形式,为用户A推荐商品,实际上就是计算用户A对所有商品的感兴趣程度。 PersonalRank算法对通过连接的边为每个节点打分,具体来讲,在PersonalRank算法中,不区分用户和商品,因此上述的计算用户A对所有的商品的感兴趣的程度就变成了对用户A计算各个节点B,C,
如何解决深度推荐系统中的Embedding冷启动问题? 今天我们聊一聊Embedding的冷启动问题。 当然,解决冷启动问题也没必要总是执着于从Embedding的角度解决,因为Embedding也是作为一类特征输入到主推荐模型,或者主CTR预估模型之中的。 再比如根据用户/物品的特征训练一颗决策树,再把冷启动的用户/物品根据有限的信息分配到决策树的某个分支中去,再根据分支对应的默认列表进行推荐等等。 3、推荐系统工程框架的改进 下面一个角度我想谈一谈通过“推荐系统工程架构上的改进”来解决冷启动问题。或者从更高的层面来说,冷启动的问题其实有一半是系统实时性的问题。 那么这样基于“边缘计算”的推荐系统,无论在解决用户冷启动,还是物品冷启动,都可以实时处理新的信号,帮助用户或者物品以最快的速度渡过冷启动阶段。
一、推荐算法概述 对于推荐系统(Recommend System, RS),从广义上的理解为:为用户(User)推荐相关的商品(Items)。 常用的推荐算法主要有: 基于内容的推荐(Content-Based Recommendation) 协同过滤的推荐(Collaborative Filtering Recommendation) 基于关联规则的推荐 (Association Rule-Based Recommendation) 基于效用的推荐(Utility-Based Recommendation) 基于知识的推荐(Knowledge-Based Recommendation) 组合推荐(Hybrid Recommendation) 在推荐系统中,最重要的数据是用户对商品的打分数据,数据形式如下所示: ? image.png 二、基于矩阵分解的推荐算法 2.1、矩阵分解的一般形式 image.png 2.2、利用矩阵分解进行预测 image.png 2.2.1、损失函数 image.png 2.2.2、损失函数的求解
一、推荐算法概述 对于推荐系统(Recommend System, RS),从广义上的理解为:为用户(User)推荐相关的商品(Items)。 常用的推荐算法主要有: 基于内容的推荐(Content-Based Recommendation) 协同过滤的推荐(Collaborative Filtering Recommendation) 基于关联规则的推荐 (Association Rule-Based Recommendation) 基于效用的推荐(Utility-Based Recommendation) 基于知识的推荐(Knowledge-Based Recommendation) 组合推荐(Hybrid Recommendation) 在推荐系统中,最重要的数据是用户对商品的打分数据,数据形式如下所示: ? 在推荐系统中有一类问题是对未打分的商品进行评分的预测。 二、基于矩阵分解的推荐算法 2.1、矩阵分解的一般形式 矩阵分解是指将一个矩阵分解成两个或者多个矩阵的乘积。
基本概念 基于内容的过滤算法会推荐与用户最喜欢的物品类似的物品。但是,与协同过滤算法不同,这种算法是根据内容(比如标题、年份、描述),而不是人们使用物品的方式来总结其类似程度的。 例如,如果某个用户喜欢电影《魔戒》的第一部和第二部,那么推荐系统会通过标题关键字向用户推荐《魔戒》的第三部。 与基于物品的协同过滤方式类似,推荐系统会根据用户之前评价过的书籍,来推荐其他书籍中相似度最高的。区别在于:相似度是基于书籍内容的,准确来说是标题,而不是根据使用数据。 图六是为某个用户生成的推荐结果,选取用户之前评论过的书籍目录,找出与每本书籍最相似的两本,再对用户尚未评论过的书籍进行推荐。 优缺点分析 1、优点 (1)不需要惯用数据 (2)可以为具有特殊兴趣爱好的用户推荐罕见特性的项目 (3)可以使用用户内容特征提供推荐解释,信服度较高 (4)不需要巨大的用户群体或者评分记录,只有一个用户也可以产生推荐列表
冷启动和探索利用问题是推荐系统技术中的两个关键问题,本文结合达观数据的技术实战,对问题的解决方案进行了梳理和介绍。 2 冷启动和EE问题 推荐系统需要根据历史的用户行为和兴趣偏好预测用户未来的行为和兴趣,因此历史用户行为某种程度上成为推荐推荐的重要先决条件。 实际过程中,我们面对大量的新用户,这些用户我们并不知道他们的profile,对于这些用户,常用的冷启动的算法包括根据已有的个人静态信息(年龄、性别、地理位置、移动设备型号等)为用户进行推荐。 与用户的冷启动相对应的,则是item的冷启动,当一个新物品加入站内,如何快速的展现的用户。特别是在某些场景下,推荐列表是给用户展示的唯一列表,那么显而易见,只能在推荐列表中尝试给用户推荐新物品。 6 结束语 本文简单介绍了推荐系统中一直存在的两大问题:冷启动和EE问题,并简单阐述了业界解决这两大问题的一些常见解决方法和算法。
推荐算法图推荐 基于图的模型(graph-based model)是推荐系统中的重要内容。 原理展示 将用户的行为数据表示为二分图后,接下来的就是基于二分图为用户进行推荐,那么给用户u推荐物品就可以转化为度量用户顶点Vu和Vu没有直接边相连的顶点在图上的相关性,相关性越高的物品在推荐列表上的权重九越高 下面介绍一种基于随机游走的PersonalRank算法(和PangRank算法相似,pageRank算法参考,直通车1,textRank直通车2,直通车3) 假设要给用户u进行个性化推荐,可以从用户 d,b 其中大写的代表用户小写的代表item 问题说明 虽然PersonalRank算法可以通过随机游走进行比较好的理论解释,但该算法在时间复杂度上有明显的缺点。 因为在为每个用户进行推荐时,都需要在整个用户物品二分图上进行迭代,直到整个图上的每个顶点的PR值收敛。这一过程的时间复杂度非常高,不仅无法在线提供实时推荐,甚至离线生成推荐结果也很耗时。
在之前的文章长尾预测效果不好怎么办?试试这两种思路中,我曾经介绍了两种解决推荐系统中长尾、冷启动问题的方法。其中,图学习解决冷启动和长尾问题,是业内目前研究非常多的一个方向。 通过构造复杂的关系图,利用邻居节点的信息帮助中心冷启动节点的学习,可以大幅提升冷启动样本的预测效果。 今天对图学习解决冷启动问题这个方向进行了详细整理,整理了5种类型7篇顶会工作,帮助大家系统性理解如何利用图学习解决推荐系统冷启动问题。 Graph-guIded Feature Transfer for Cold-Start Video Click-Through Rate Prediction(CIKM 2022)这篇文章中,主要解决的是视频推荐的冷启动问题 通过图神经网络,将中心节点的user/item邻居以及属性信息都进行汇聚。 6 总结 本文梳理了推荐系统中,使用图学习解决冷启动问题的5种方法7篇顶会工作。
引言 在文章《微信读书冷启动书籍推荐初探:一个借助微信用户画像的方法 》1,我们发现用户的阅读偏好与用户属性(性别、年龄、n 线城市、公众号阅读偏好)相关。 基于这个发现,我们利用用户属性,给冷启动的新注册用户做个性化推荐,效果较编辑推荐提升约 50%。 ? 思路 假设具有相似用户属性的用户,有相似的阅读偏好。 A/B 测试设计 微信读书搭建了书籍推荐 A/B 测试的基础设施,通过如下方法统计不同推荐策略的转化率: 在推荐书籍时,后台记录日志:『用户 推荐书籍 推荐策略 推荐位置标识符 时间』 在用户把书籍加入书架时 (实验组) 编辑推荐组(对照组) 对个性化推荐组的用户,把用户所在群体热门书单推荐给他们。 推荐算法实现 把用户按属性(性别、年龄、n 线城市)划分成多个群体 对每个群体,统计群体用户最喜欢的书籍,按热度排序,做成推荐书单 对于每个新注册的用户,根据用户属性找出他所属的群体对应的推荐书单,以新手卡片的形式展示
集生态、技术、场景于一体,采用业界领先的AI学习技术和智能推荐算法,基于腾讯多年在超大型场景中积累的最佳实践方法论,助力客户业务实现增长的企业级应用产品。
扫码关注腾讯云开发者
领取腾讯云代金券