首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >大语言模型中因果世界模型的零样本物理推理

大语言模型中因果世界模型的零样本物理推理

原创
作者头像
用户11764306
发布2025-08-13 09:26:40
发布2025-08-13 09:26:40
1420
举报

大型语言模型(LLMs)虽然具备先进的语义能力,但本质上缺乏对物理动态的直观理解,这限制了其在需要因果推理的现实场景中的有效性。本文提出因果世界模型归纳(CWMI)框架,旨在LLM中嵌入显式的因果物理模型。该框架包含专用的因果物理模块(CPM)和新型训练目标——因果干预损失,通过多模态数据促使模型学习因果关系。

与仅捕捉统计相关性的传统方法不同,CWMI通过训练模型预测假设干预的结果,从而建立对物理定律的鲁棒内部表征。实验结果表明,在零样本物理推理任务中,包括PIQA基准和新提出的PhysiCa-Bench数据集,CWMI显著优于最先进的LLMs。这些发现表明,诱导因果世界模型是构建更可靠、更具泛化能力AI系统的关键步骤。

(技术要点说明:

  1. 提出专用因果物理模块架构
  2. 创新性采用干预损失函数设计
  3. 构建新型物理推理评估数据集
  4. 实现模型参数规模与物理推理能力的解耦)

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档