首页
学习
活动
专区
圈层
工具
发布

The Innovation Informatics | 城市移动计算中的生成式智能体框架

传统的城市移动计算模型大多基于物理规则和数据拟合,当前的大语言模型涌现出惊人的推理能力。如果交通系统要素不再是无意识的数值,而是拥有感知、理解、决策和记忆的生成式智能体,城市计算范式会发生怎样的变化?

导  读

人类移动计算应当突破单纯的预测,转向可解释的意图与交互理解。传统深度学习和基于物理规则的模型往往被动接收输入数据,难以捕捉深层的社会交互与动态意图。本文提出基于生成式智能体(Generative Agents)的计算框架,通过构建感知、理解决策的认知闭环,推动城市移动计算的范式转变。

图1 面向人类移动计算的生成式智能体认知架构

主动感知与意图推断:生成式智能体通过主动感知与意图推断,改变了传统模型被动输入数据的模式。生成式智能体能够充当语义指令导航的角色,主动调用天气服务、社交媒体检索等外部工具来增强感知能力,从而构建跨源、多维的因果链,进而解释城市交通出行的变化特征。例如,智能体可以通过识别社交网络上的事件热度来预判大型活动导致的交通出行压力。针对人类意图异质性与模糊性的特点,生成式智能体不再输出单一的确定性预测,而是动态维护一组包含时空范围与置信度的意图候选集,并利用大语言模型的推理能力,根据新证据对这些候选意图进行合并或修剪。这种候选机制可让系统不再过早下定论,从而能更敏锐地捕捉到那些尚未完全显现的早期出行需求。

情境理解与行为预演:在获取感知信息后,理解阶段作为认知引擎,将初始感知转化为结构化的情境表征与行为动作。这一过程首先通过语义抽象将嘈杂的多模态输入提炼为特征,并整合进动态的认知图谱中,该图谱清晰地映射了人、车、环境等实体的属性,以及它们之间复杂的社会关联与相互影响。基于上下文模型,智能体并不急于作出最终决策,而是进行前瞻性的行为预演,生成一系列行为动作选项。这些动作并非最终定案,而是标注了效率、舒适度、安全及社会规范等预期结果的可行轨迹。为了应对感知输入中的噪声与冲突,智能体可采用不确定性感知的调制机制,通过置信度估计动态加权不同的意图候选,或在低置信度场景下触发长思维链推理,从而确保在复杂的城市环境中具备稳健的情境理解能力。

可解释决策和主动引导:决策制定作为执行核心,不仅关注个体层面的可解释性,更致力于系统层面的主动引导。在个体尺度层面,智能体结合情境理解与因果推理,首先生成符合用户目标的抽象计划,然后利用基于物理现实的模型将其落地为具体的时空轨迹,并能与其他智能体协商实现如拼车等社会协作功能。在系统尺度上,代表管理平台的智能体利用内部世界模型模拟动态定价或路由激励等策略,在拥堵形成前选择全局最优方案,实现从被动资源分配到主动社会动态管理的转变。然而,面对生成式智能体决策不可靠(由于幻觉以及快速变化的环境等原因)与计算成本高昂的挑战,通过将检索增强生成(RAG)技术引入领域常识信息与跨领域一致性校验(如结合路网与政策约束)功能来修正不可行行为,是将智能体真正应用于城市治理的关键保障之一。

总结与展望

在工程应用上,可以通过设计数据层、智能体核心、规划层及记忆库来实现生成式智能体框架。在该框架下,从感知、理解到决策的全流程被记录于记忆模块,形成反馈闭环,促使出行系统通过经验积累不断演化。展望未来,系统性地记录、整合和管理出行系统中全生命周期尺度下的个体交互行为数据,有望构建一种与人类社会协同演化、具备深层认知与推理能力的高保真城市社会模拟系统,从而为复杂社会过程的精细化推演与城市治理决策提供理论与技术支撑。

责任编辑

刘   峰   上海交通大学心理学院

王   洋   The Innovation

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OJcqe8A5SFkL5BXefNkRT0Yw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。
领券