前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >RecRanker: 用大型语言模型充当排序器提升个性化推荐

RecRanker: 用大型语言模型充当排序器提升个性化推荐

作者头像
张小磊
发布2024-01-11 11:57:47
2160
发布2024-01-11 11:57:47
举报

作者:养生的控制人 链接:https://zhuanlan.zhihu.com/p/675928984

TLDR:本文提出一种新的推荐算法RecRanker,其为指令调优大语言模型量身定制,并可将其作为Top K推荐的排序器。具体的,该论文提出了重要性感知采样、基于聚类的采样和对重复采样的惩罚,基于此以采样高质量、有代表性和多样化的用户作为训练数据。

为了增强提示,本文引入了位置转移策略以减轻位置偏差,并使用传统推荐模型的辅助信息来增强提示,从而丰富了大语言模型的上下文理解。另外,还利用采样的数据来组装一个指令调优数据集,其增强提示由三个不同的排名任务组成: 逐点排名、成对排名和列表排名。随后本文进一步提出一种混合排序方法,通过集成这些排序任务来提高模型性能。实验评估证明了所提出的RecRanker在直接和序列推荐场景中的有效性。

链接: https://arxiv.org/abs/2312.16018

论文概要

大型语言模型已显示出非凡的能力,并已在各个领域广泛部署,包括在推荐系统领域。许多研究采用了专门的提示来利用大模型固有的上下文学习能力。例如,大模型被提示充当列表排序的零样本排序器,评估检索模型生成的候选项目以进行推荐。最近的研究进一步使用指令调优技术使大模型与人类的偏好相一致,以获得更有希望的建议。尽管有潜力,但目前的研究忽视了整合多个排序任务来提高模型性能。此外,传统推荐模型的信号没有融合到大模型中,限制了当前系统的性能。

在当今信息泛滥的时代,推荐系统在我们的日常生活中扮演着至关重要的角色。它们帮助我们在庞大的数据海洋中筛选出与个人偏好最匹配的内容。研究者们一直致力于探索如何让推荐系统变得更智能和更具个性化。本论文中,作者介绍了一种新型方法RecRanker。这种方法利用了“指令调优”的大型语言模型,将其转化为推荐系统中的“排名器”,从而提高推荐的准确性和质量。

方法介绍

RecRanker的关键特点在于它有效地利用了大型语言模型的上下文理解能力。它通过巧妙设计的提示来指导模型完成排名任务。具体而言,RecRanker运用了以下几个核心技术:

  • 重要性感知抽样(Importance-aware Sampling):为了确保训练数据的高质量,RecRanker优先选取那些互动频率较高的用户数据。这种方法基于一个假设:频繁互动的用户提供的数据更能真实地反映其偏好。
  • 聚类抽样(Clustering-based Sampling):RecRanker通过实施用户聚类策略,能有效捕捉到用户偏好的多样性。这种方法有助于保证训练数据具有更广泛的代表性。
  • 重复抽样惩罚(Penalty for Repetitive Sampling):为了防止训练数据中某些用户或物品的过度重复,RecRanker对重复抽取的样本实施了惩罚机制。这样做的目的是为了提高样本的多样性。
  • 位置偏移策略(Position Shifting Strategy):为了降低模型对于列表中物品位置的偏见,RecRanker在训练和推理过程中均采用了随机改变物品位置的策略。
  • 提示增强(Prompt Enhancement):RecRanker通过将传统推荐模型的预测结果整合进提示中,能够更深入地理解和捕捉用户的偏好。
  • 混合排名方法(Hybrid Ranking Method):RecRanker融合了点对点(pointwise)、成对(pairwise)和列表(listwise)三种排名方法,通过加权集成这些方法来提升其推荐性能。

实验结果

RecRanker在包括MovieLens和BookCrossing在内的三个真实世界数据集上进行了广泛测试。测试结果显示,RecRanker在大部分情况下明显胜过了基准模型。特别是在BookCrossing数据集上,RecRanker展现出了显著的性能提升。这一成绩可能归功于该数据集更为精细的评分系统,使得模型能够进行更准确的预测。

作者还开展了一系列消融研究,用以验证RecRanker中各个组件的有效性。研究结果显示,每个组件都对提升整体性能做出了显著贡献。其中,位置偏移策略和提示增强尤其重要,它们在减少模型偏见和提高推荐准确性方面起到了关键作用。

在最终的比较中,RecRanker与GPT-3.5模型相比也表现出了优秀的性能,这进一步印证了通过指令调优专门针对推荐任务训练大型语言模型的有效性。

综合来看,RecRanker通过融合多种排名方法、实施位置偏移策略和增强提示等技术,显著提高了推荐系统的性能。这项研究不仅为推荐系统领域提供了新的洞察,还为如何有效利用大型语言模型贡献了重要的实践经验。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2024-01-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习与推荐算法 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档