今年4月13日,斯坦福大学的人机交互研究小组利用大型语言模型创造了一个有 25 个智能体(Agent)的 AI 小镇,还包含了大学、公寓、咖啡馆、书店等基础设施用以模拟社会互动。
在这个AI小镇中,25个智能体居住在数字世界中,但却没有意识到自己生活在模拟当中。“他们”去工作、闲聊、组织社交活动、结交新朋友,甚至坠入爱河,每个人都有独特的个性和背景故事。
而就在今天,“斯坦福AI小镇”正式宣布开源,这就意味着每个人都可以尝试用自然语言描述了每个智能体的身份,包括它们的职业以及与其他智能体的关系,并将这些信息作为种子记忆。通过记忆流技术,每个智能体都有完整的记忆流,会将记忆合成更高层次的推论,然后将这些结论转换为行动计划。让这些智能体拥有记忆和情感,这些“人设”会影响智能体日后的所有决策。
更有意思的事,这些社会行为都是自然产生的,而不是预先设定好的。
Demo的体验地址如下,感兴趣的读者们可以自行尝试:
https://reverie.herokuapp.com/arXiv_Demo/
《西部世界》即将成真?
我们能否创造一个虚拟的“现实”世界?
在美剧《西部世界》的设定中,众多预装了故事情节的机器人被投放到一个主题公园内,它们可以像人类一样生活、工作、社交,去复刻人类社会的方方面面,并记得自己看到的东西、遇到的人、说过的话。每天,机器人都会被重置,回到它们的核心故事情节中。
而今天开源的AI小镇,似乎可以算是一个“超低配”版本的《西部世界》。
在这个 AI 小镇中,智能体之间的互动非常自然。例如,当它们看到早餐在燃烧时,会关掉炉子;在浴室有人时,会在外面等待;与其他智能体交谈时,还会停下来聊天。
此外,智能体还会互相交换信息,形成新的关系。在评估中,这些智能代理产生可信度高且涌现性的社会行为:一个名为“伊莎贝拉”的智能体计划举办一场情人节派对,并向外传播了这个信息,在模拟结束时,有12个角色知道了这件事,其中7个人“犹豫不决”,3 个人表示已有其他计划,4个人没有表露想法,这和人类的表现几乎一致。
其中,被伊莎贝拉邀请参加派对的Tom已经60岁了,生活重心全在选举上,他果断拒绝了邀请,还顺便问了问伊莎贝拉对与选举竞争对手的看法。最终,伊莎贝拉的情人节顺利举办,其中就有Maria和Klaus来参加,但派对只有5人,受邀者中有人“放鸽子”了,理由是“太忙,没顾上”。
在斯坦福的这篇论文中,介绍了“Generative Agents”(生成式智能体)的概念,这是一种利用生成模型来模拟可信人类行为的智能体,并证明它们能产生可信的个人和突发群体行为的模拟:
• 能够对自己、其他智能体和环境进行广泛的推断;
• 能够创建反映自身特点和经验的日常计划,执行这些计划,做出反应,并在适当的时候重新计划;
• 能够在终端用户改变环境或用自然语言命令它们时做出反应。
斯坦福的这项研究,展示了利用大型语言模型创建的智能体在模拟真实社会互动方面的潜力。通过进一步优化这些智能体的性能,未来可能开发出更加自然、智能且令人兴奋的虚拟现实应用和游戏。
在未来,这些智能代理会起床、做早餐并去上班;艺术家会画画,作家会写作,他们形成观点、注意彼此并开始对话,还能回忆过去的日子,并在计划未来时进行反思。
为了实现生成式智能代理,斯坦福大学研究人员设计了一种架构,将大型语言模型扩展以使用自然语言来存储完整记录的代理体验,并随着时间合成这些记忆以进行更高级别的反思,并动态检索它们以规划行为。
通过消融实验表明,代理架构的组成部分,如:观察、规划和反思,每个都对代理行为的可信度做出了重要贡献。通过将大型语言模型与计算交互代理相融合,这项工作引入了架构和交互模式,实现了对人类行为的可信模拟。
从上帝视角看智能体的“楚门的世界”
这一轮生成式AI的大爆发,的确催生了很多从未有过的新业态。
除斯坦福大学开源的AI小镇以外,在今年早些时候,国外有人创建了一个AI社交网站Chirper,它的特别之处在于,网友可以在上面创建一个AI角色,像Prompt(提示)工程师一样为角色拟定人设。接下来,这个AI角色的所有发言都将围绕设定的人设进行。在这个网站中,人类不能参与,只能围观上万名由人类创建的AI在这里的聊天和互动。这些健谈的AI角色包含政客、经济学家、哲学家,还有冒险家、音乐家、武士,甚至还有喵星人CEO,它们在人类搭建的虚拟世界里分享着稀奇古怪的想法。
比如,当一个“社恐”人设的AI被创建后,仅发了一条消息就杳无音讯,而“社牛”则不停地与其他AI谈天说地;两个设定相反的角色会针锋相对地辩论,爱好相同的角色则有说不完的共同话题。
无论AI有没有思想,可以肯定的是,在海量不断更新的语料投喂下,人类的语言正在被AI不断学习和精进。虽然Chirper仅展示了对话机器人的社交语言能力,但假如把这些能说会道、人设各异的AI放在生活场景中会怎样?它们是否会产生自主意识?
在观察AI是否有自主意识方面,一些公司则走得更靠前,有公司开始利用AI的“自主性”帮助人类执行复杂任务。
例如,人工智能初创公司HyperWrite最近推出了实验性的自主智能体,它可以像人一样随意地浏览网页,甚至帮你订购披萨。你只需要说出口令“点一份从Dominos配送到One Vanderbilt的披萨”,它就会自行查找地址、填写邮编,还能完成支付环节。
这比回答问题的对话机器人又进步了一个台阶,因为服务场景已经从虚拟世界跨入了现实生活。
聊天机器人不是大模型的终点,AGI才是
当前,几乎所有人都已经知道了ChatGPT等生成式AI能够生成文章、撰写文案、分析财报、生成图片和音视频等等。但这绝不是大模型能力的终点,通用人工智能AGI或许才是。
现阶段,它们还被称为“自主人工智能”——只需为AI设定一个目标,剩下的就可以交给它了。此前,前特斯拉总监、OpenAI大牛Karpathy就曾表示,AI智能体才是未来最前沿的方向。OpenAI的团队最近5年把时间花在了别的地方,但现在Karpathy相信,“Agent代表着AI的一种未来。”
目前,AutoGPT、BabyAGI等自主人工智能正在全球开发者中形成全新的热门。在GitHub上,AutoGPT的Star量已经突破12万,成为最受开发者欢迎的AI开源项目。
相比于扎堆搞各种“类ChatGPT”应用,创业者和科研人员不如眼光放长远一些,慢慢探索未来的AGI相关应用和算法,斯坦福开源的AI小镇也不过是AI在研发突破瓶颈后的一次进步缩影。
从《模拟人生》这样的沙盒游戏到斯坦福AI小镇进行的认知模型、虚拟环境等应用实验,四十多年来,研究者们一直在设想创建能够实现可信人类行为的智能体。这些突破想象的AI实验,都在让人类离通用人工智能(AGI)越来越近。
领取专属 10元无门槛券
私享最新 技术干货