首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

生成式推荐系统初探

随着 ChatGPT 的横空出世与 GPT-4 的重磅登场,生成式 AI(Generative AI)引起了前所未有的关注,基于 GPT(Generative Pre-Trained Transformer)的模型在各类 NLP 和 CV 任务上取得了惊人的效果。生成式 AI 模型可以根据训练过的数据创建新的内容、模式或解决方案,一些典型应用包括 ChatGPT、Stable Diffusion 和 DALL·E 等(封面图片来自 DALL·E)。然而,在推荐系统(RS)领域研究中,受限于推荐系统 User/Item ID 的范式,以及大多情况下为非通用、非常识知识,因而直接将基于 GPT 的模型作为推荐模型具有一定的局限性。例如,在电影、图书和音乐等领域推荐场景直接将 ChatGPT 作为推荐模型可以取得较好的效果,然而,在其他一些领域推荐场景直接利用 ChatGPT 效果有限。随着各类生成式模型层出不穷,部分研究人员开始考虑如何在 RS 中有效引入生成式 AI。本文主要关注 RS 和生成式 AI 可能存在的结合点,调研了 RecSys'23 等会议录用的若干相关工作,以及最新已公开的若干方法。

02

重读经典 | 亚马逊“一键下单”的背后——个性化推荐系统的发展历程

一般都认为,亚马逊的成功要归功于它鼎鼎大名的“一键下单”功能,但“一键下单”的背后,还需要一个成单量极高的智能推荐系统,来驱动消费者不停地在亚马逊上“买!买!买!”。这就是用户点击分析、机器学习和个性化推荐的综合力量。本文的目的,正是回顾亚马逊这个以成单率著称的个性化推荐系统的发展历程。 本文作者是2003年那篇“久经考验”的亚马逊推荐系统论文的作者,他们在这里分享的是这篇经典论文发布后的新发现与新见解。如果你想阅读这篇经典论文,请在公众号会话回复“亚马逊”,即可获得完整论文。 作者 | Brent

06

Bandit算法学习与总结(一)

MAB问题又称多臂老虎机问题,一个老虎机上有多个老虎臂,每次摇动不同的臂会得到不同的收益,那么如何才能让多次尝试后整体收益最大?这就是多臂老虎机问题。 MAB问题可以采用Bandit算法来解决,Bandit算法的思想是希望在多次摇臂后的累积遗憾最小,遗憾即为最好收益与实际收益的差值。这类方法通常包含三个方面,环境、臂和回报。在推荐系统中,不同的策略或者不同的物料池就是不同的臂,而回报就是指用户的反馈。 在推荐系统中Bandit算法通常可用于冷启动和EE问题,冷启动问题即当新用户或新商品出现时,在系统中缺乏他们的交互数据,从而对兴趣推荐造成困扰;推荐系统中的EE问题为Exploration(探索)和Exploitation(利用)问题。

03
领券