复旦卢暾：以人为中心的推荐系统--大模型驱动的Agent建模方法

文章来源：企鹅号 - NLP观察员

本文整理自11月23日达观大讲堂上复旦大学计算机学院教授、博导，上海市数据科学重点实验室副主任，复旦大学社会计算研究中心主任卢暾教授《以人为中心的推荐系统模拟——大模型驱动的Agent建模方法》的主题分享。

随着互联网和数字化技术的迅猛发展，推荐系统已经成为了许多在线平台和应用程序中不可或缺的一部分。传统的推荐系统主要基于机器学习和协同过滤等方法，通过分析用户行为和项目特征来提供个性化的推荐。然而，随着数据规模和复杂性的增加，传统方法在面对大量用户和项目，特别满足用户良好推荐体验上，存在较大局限性。因此，以人为中心的推荐系统逐渐引起了研究者和工程师们的关注。大模型驱动的Agent建模方法是实现以人为中心的推荐系统的一种重要方式。这种方法借助于强大的大规模语言模型，如GPT等，构建智能代理（Agent）。其可以对用户的查询和上下文进行深入理解，并利用大规模数据和深度学习技术提供高质量的推荐结果。这种建模方法通过模拟人类决策和个性化需求，可以更好地理解用户的行为和意图，从而提供更加智能和贴近用户期望的推荐。并且，通过将用户放在推荐系统的核心位置，这种方法可以有效地解决传统推荐系统中的一些挑战，并提供更加个性化和满足用户需求的推荐体验。

面临的问题和挑战

1. 复杂交织的期望价值目标

推荐系统需要满足用户的多样化和动态化需求。用户的期望价值目标包括个性化、多样性、时效性等方面的要求。然而，这些目标之间可能存在冲突，如个性化推荐可能导致信息过滤的问题，多样性推荐又可能降低了个性化程度。因此，实现这些复杂交织的目标是一个巨大的挑战。

2. 数据主导与支配的机制算法

推荐系统的核心在于对海量数据的处理和分析。传统方法主要依赖于机器学习和协同过滤等技术，但这些方法容易受限于数据的稀疏性和冷启动问题。此外，数据主导的算法往往会优先考虑热门和流行的项目，导致长尾项目的推荐效果不佳。因此，如何设计有效的算法来平衡数据驱动和用户需求之间的关系，是推荐系统领域需要解决的难题。

3. 极化的正反馈闭环放大效应

推荐系统中的正反馈效应是一把双刃剑。当用户接收到与自己兴趣相符的推荐时，会更愿意进行交互和消费，进而形成正向的反馈循环。然而，这种正反馈循环也可能导致信息过滤和舆论偏见的问题，使用户陷入“信息茧房”。如何在推荐过程中平衡正反馈效应，增强推荐的多样性和广度，是推荐系统需要面对的挑战之一。

4. 多环节无处不在的各种偏差

推荐系统涉及多个环节，包括数据收集、特征提取、模型训练和结果展示等。每个环节都可能引入各种偏差，如数据采样偏差、特征选择偏差、算法偏差等。这些偏差可能导致推荐结果的不准确性和不公平性。解决这些偏差问题需要综合考虑数据质量、算法可解释性和结果评估等方面的因素。

基于大模型Agent 的微观推荐系统框架RAH

1.微观层面临的问题挑战

在微观层面上，以人为中心的推荐系统在个性化需求多样性、兴趣演化时效性、隐私保护和解释透明度等方面面临着诸多挑战。解决这些挑战需要结合用户行为研究、隐私保护技术和解释性算法等多个领域的知识。通过不断创新和改进，以人为中心的推荐系统将能够更好地满足用户的个性化需求，并提供具有良好用户体验的推荐服务。

2.解决方法与启示

以人为中心的推荐：对推荐系统进行改进，考虑用户的需求，提升用户的满意度

大语言模型增强的推荐系统：基于大模型构建推荐系统，利用世界知识理解物品特征，利用推理能力实现个性化筛选和精细排序

大语言模型驱动的智能体：明确大模型智能体的定义，提出设计框架，实现适配具体领域和场景的智能体

3.以人为中心的推荐框架RAH

RAH (Recsys-Assistant-Human) 是一个基于大模型Agent的推荐框架，旨在解决推荐系统中以人为中心的问题，例如降低用户负载、缓解推荐偏见、增强用户控制。RAH框架从人类用户的视角出发，核心思想就是增加个人助手Assistant，用于在推荐场景中协助人类用户。进一步说，在这个框架中，个人助手基于大语言模型的知识储备和推理能力，从用户行为中学习和理解用户的个性；然后，个人助手再根据用户的个性提供定制的操作。

在这个RAH框架下，个人助手能够代理用户并协助用户优化推荐系统、缓解偏见和增强用户对推荐结果和个人隐私的控制。每个助手都由几个基于LLM的智能体组成：

(1) 感知智能体：理解和解释推荐信息，包括Item特征和用户反馈的含义。

(2) 学习智能体：从用户行为中分析用户个性，并将它们存储在个性库中。

(3) 行动智能体：根据学到的个性执行操作，例如为用户过滤不喜欢的项目。

(4) 评判智能体：验证执行的操作是否与用户的偏好一致，并分析调整以减少差异。

(5) 反思智能体：审查和优化积累的个性，例如解决重复和冲突等问题。

此外，我们通过添加学习-行动-评判循环和反思机制来增强我们提出的助手与用户的一致性。在学习-行动-评判循环中，学习、行动和评判智能体合作处理用户操作，不断改进对用户个性的理解。这个迭代循环会一直持续下去，直到行动智能体准确地反映学到的个性。同时，反思机制使用反思智能体定期修订学到的个性，减少累计个性中存在的冗余和冲突。在我们的实验中，我们使用真实世界数据在三个推荐领域评估RAH框架。首先，我们发现学习-行动-评判循环和反思机制显著增强了个人助手与用户个性的对齐程度。第二个实验表明这些代理操作可以协助用户调优推荐系统，减少了用户的交互次数，降低用户的操作负担。此外，在第三部分实验，我们研究了使用经过对用户个性学习的助手来代理用户对低流行度Item的反馈，缓解选择偏见，从而减轻系统中的偏见。最后，我们研究发现了RAH框架在解决与用户控制相关的问题时的潜力，包括通过二次过滤来帮助用户控制推荐结果，以及调整推荐系统对用户敏感数据的可见性来控制个人隐私。

预训练大模型驱动的宏观模拟系统SimuLine

1.宏观层面临的问题挑战

以人为中心的推荐系统在宏观层面面临着社会影响、公平性、信息多样性和隐私安全等方面的挑战。解决这些挑战需要从技术、政策和法律等多个角度进行思考和创新。推荐系统的发展应注重用户的长期利益和社会效益，在个性化推荐的同时保持公平、多样和可持续的推荐环境。

2.解决方法与启示

基础工作：合成数据生成For Synthetic Data。学习数据分布，并面向特殊推荐场景或需求生成数据集

方向一：面向模型训练的模拟器For Model Training of RecSys。通过框架定义数据分布学习，将静态数据增强为动态生成的多轮交互数据，进而实现面向用户多轮交互效用的推荐算法优化

方向二：面向推荐系统社会影响的模拟器For Social Impact of RecSys。针对推荐系统长期交互过程中所产生的特定社会问题，基于Agent based Modeling 等建模方法设计有针对性的模拟框架，重现研究所关注的相关现象，并使用模拟数据予以解释

3.宏观模拟系统SimuLine

SimuLine是一个基于预训练大模型的推荐宏观模拟系统，旨在解决推荐系统中面临的问题和挑战，并提供更准确、全面和多样化的推荐体验。该系统通过强大的模拟能力和大规模数据驱动，为用户提供个性化、实时和多维度的推荐结果。其核心是一个预训练的大模型，具备深度学习技术和自然语言处理能力。这个模型经过大量数据的训练，能够理解和捕捉用户的兴趣偏好、行为模式和语义信息。它能够对用户进行精确建模，并从海量数据中挖掘潜在的关联和推荐机会。该系统还具备强大的模拟能力，可以模拟用户的兴趣演化和行为变化。SimuLine考虑到用户的兴趣和需求是动态变化的，可能受到季节性、时事热点或个人发展等因素的影响。因此，该系统能够模拟用户在不同场景和时间段的兴趣变化，及时调整推荐策略，提供与用户当前兴趣相关的推荐结果。此外，SimuLine注重推荐的多维度性。它不仅考虑用户的个人兴趣，还将其他因素融入推荐过程，如社交关系、地理位置、时效性需求等。这使得推荐结果更加全面和多样化，能够满足不同用户的个性化需求。SimuLine还关注隐私保护和用户参与。系统采取严格的隐私保护措施，对用户的个人信息和行为数据进行安全处理。同时，该系统提供用户参与推荐过程的机制，例如用户可以主动指定偏好、提供反馈和评价推荐结果，从而增强用户对推荐算法的参与感和信任度。

未来展望：技术发展与治理趋势

在大模型时代，复杂系统模拟的发展对于“以人为中心的推荐系统”变得更加重要。这是因为大模型不仅能够处理和分析海量数据，还能通过深度学习技术理解人类行为和需求，从而提供更准确、个性化的推荐服务。"以人为中心的推荐系统"的主题突出了用户体验和参与的重要性。随着大模型的兴起，可以更好地理解用户的兴趣、偏好和行为模式，从而根据个体的需求进行更精准的推荐。这种个性化的推荐有助于提高用户满意度，并增强他们对推荐系统的信任。此外，大模型可帮助推荐系统更好地理解和模拟人类行为的复杂性。它们能够捕捉到用户的动态兴趣演化、情感变化和社交互动等方面的特征。通过模拟复杂系统中的各种因素和相互作用，这些模型能够更准确地预测用户的行为和需求，为其提供更加个性化的推荐。然而，在利用大模型进行复杂系统模拟时，也需要注重“以人为中心”的原则。这意味着系统应该确保用户的隐私和数据安全，并提供可解释性的推荐结果。用户应该有权选择参与推荐过程，并对推荐结果进行反馈和调整。此外，公平性也是一个重要的考虑因素，推荐系统应该避免偏见和歧视，确保每个用户都能获得公正和中立的待遇。因此，在实现这些目标的同时，也需要关注用户体验、隐私保护、参与机制和公平性等方面，以确保推荐系统真正以人为中心，并提供积极的社会影响。

感谢上述两个工作的共同作者：张光平、舒钰博、张鹏、尚笠、顾宁（复旦），李东胜（MSRA）

复旦卢暾：以人为中心的推荐系统--大模型驱动的Agent建模方法

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐