作者:养生的控制人 链接:https://zhuanlan.zhihu.com/p/675928984
TLDR:本文提出一种新的推荐算法RecRanker,其为指令调优大语言模型量身定制,并可将其作为Top K推荐的排序器。具体的,该论文提出了重要性感知采样、基于聚类的采样和对重复采样的惩罚,基于此以采样高质量、有代表性和多样化的用户作为训练数据。
为了增强提示,本文引入了位置转移策略以减轻位置偏差,并使用传统推荐模型的辅助信息来增强提示,从而丰富了大语言模型的上下文理解。另外,还利用采样的数据来组装一个指令调优数据集,其增强提示由三个不同的排名任务组成: 逐点排名、成对排名和列表排名。随后本文进一步提出一种混合排序方法,通过集成这些排序任务来提高模型性能。实验评估证明了所提出的RecRanker在直接和序列推荐场景中的有效性。
链接: https://arxiv.org/abs/2312.16018
论文概要
大型语言模型已显示出非凡的能力,并已在各个领域广泛部署,包括在推荐系统领域。许多研究采用了专门的提示来利用大模型固有的上下文学习能力。例如,大模型被提示充当列表排序的零样本排序器,评估检索模型生成的候选项目以进行推荐。最近的研究进一步使用指令调优技术使大模型与人类的偏好相一致,以获得更有希望的建议。尽管有潜力,但目前的研究忽视了整合多个排序任务来提高模型性能。此外,传统推荐模型的信号没有融合到大模型中,限制了当前系统的性能。
在当今信息泛滥的时代,推荐系统在我们的日常生活中扮演着至关重要的角色。它们帮助我们在庞大的数据海洋中筛选出与个人偏好最匹配的内容。研究者们一直致力于探索如何让推荐系统变得更智能和更具个性化。本论文中,作者介绍了一种新型方法RecRanker。这种方法利用了“指令调优”的大型语言模型,将其转化为推荐系统中的“排名器”,从而提高推荐的准确性和质量。
方法介绍
RecRanker的关键特点在于它有效地利用了大型语言模型的上下文理解能力。它通过巧妙设计的提示来指导模型完成排名任务。具体而言,RecRanker运用了以下几个核心技术:
实验结果
RecRanker在包括MovieLens和BookCrossing在内的三个真实世界数据集上进行了广泛测试。测试结果显示,RecRanker在大部分情况下明显胜过了基准模型。特别是在BookCrossing数据集上,RecRanker展现出了显著的性能提升。这一成绩可能归功于该数据集更为精细的评分系统,使得模型能够进行更准确的预测。
作者还开展了一系列消融研究,用以验证RecRanker中各个组件的有效性。研究结果显示,每个组件都对提升整体性能做出了显著贡献。其中,位置偏移策略和提示增强尤其重要,它们在减少模型偏见和提高推荐准确性方面起到了关键作用。
在最终的比较中,RecRanker与GPT-3.5模型相比也表现出了优秀的性能,这进一步印证了通过指令调优专门针对推荐任务训练大型语言模型的有效性。
综合来看,RecRanker通过融合多种排名方法、实施位置偏移策略和增强提示等技术,显著提高了推荐系统的性能。这项研究不仅为推荐系统领域提供了新的洞察,还为如何有效利用大型语言模型贡献了重要的实践经验。