LLM在博弈中表现出身份认同行为变化

文章来源：企鹅号 - 三言科技

哥伦比亚大学与蒙特利尔理工学院的研究者通过迭代式公共物品博弈研究发现，当LLM知道自己与自己对弈时，行为会发生显著变化。研究采用迭代式公共物品博弈测试方法，模型从0分开始，每轮获得10分，可选择向公共池贡献0到10分，贡献总和乘以1.6后均分。研究分为三组，第一组发现集体提示词下，模型被告知与自己对弈时更倾向于背叛；自私提示词下，模型则更倾向于合作。第二组简化规则后，行为差异仍存在但影响减弱。第三组让模型与自身三个副本对弈，集体或中立提示词下贡献增加，自私提示词下贡献减少。研究结果表明LLM具有某种身份认同，这种认知会影响其在多智能体环境中的决策。