科学家们发现,人工智能(AI)在理解情绪方面似乎超越了人类,尤其是在处理情绪激动场景时表现尤为出色。这一发现挑战了我们对计算机能力的传统认知。
在一项发表于5月21日《通信心理学》杂志的研究中,来自日内瓦大学(UNIGE)和伯尔尼大学(UniBE)的科学家们对多种大型语言模型(LLM)进行了广泛使用的情商(EI)测试,包括ChatGPT-4、ChatGPT-o1、Gemini 1.5 Flash、Claude 3.5 Haiku、Copilot 365和DeepSeek V3。研究有两个目标:一是比较AI与人类在情商测试中的表现,二是评估AI生成符合情商测试要求的新测试题的能力。
研究显示,AI在情商测试中选择“正确”答案的概率高达81%,远超人类的56%。当ChatGPT被要求生成新测试题时,人工评估员认为这些题目在难度和区分度上与原始测试相当,相关系数达0.46(1.0表示完全相关,0表示无相关性)。这表明,AI在“理解”情绪方面表现出色。
更深层的思考。然而,专家们在接受《Live Science》采访时提醒,研究结果需谨慎解读。当前情商测试多为多项选择题,难以反映现实世界中复杂的人际互动。金融与信息安全专家Taimur Ijlal指出:“人类对情绪的理解并不总是一致的,即使是心理学家也可能对情绪信号有不同解读。AI在测试中‘击败’人类,只是说明它更擅长给出统计上预期的答案。”
CliniScripts创始人兼首席执行官Nauman Jaffar补充道,AI在模式识别上表现优异,尤其是在处理面部表情或语言信号等结构化线索时。但将其视为对人类情感的“更深层理解”可能有些夸大。专家们认为,AI在结构化测试中表现出色,但难以捕捉人类情感体验中的细微差别。
Hennessy Digital创始人Jason Hennessey将这项研究比作“读心术”测试,指出AI在处理标准化情绪线索时表现优异,但当环境变量(如光线或文化背景)变化时,其准确性会显著下降。
现实中的AI情绪识别。尽管如此,AI在某些场景下展现了惊人潜力。以巴西6000多名长途卡车司机使用的对话式AI“Aílton”为例,其开发者、HAL-AI首席科学家Marcos Alves表示,Aílton能以约80%的准确率识别压力、愤怒或悲伤,超出人类约20个百分点。在一个案例中,一名司机在同事遭遇致命事故后发送了15秒悲痛语音,Aílton迅速以哀悼语气回复,提供心理健康资源,并通知车队经理,展现了细腻的应对能力。
Alves表示:“多项选择测试简化了情绪识别,但真正的同理心是多维且连续的。AI通过分析海量对话数据,能捕捉人类常忽略的微妙语调线索。我们的WhatsApp数据表明,现代AI在检测和响应情绪方面已超越大多数人,能大规模提供'可扩展的同理心'。”
虽然AI在情商测试中的表现令人印象深刻,但专家们认为,称其比人类更懂情绪尚需更多证据。AI在模式识别和标准化场景中的优势明显,但在复杂、动态的现实世界中,真正的情感理解仍充满挑战。
在朋友圈分享这个故事;关注『跟着大事跑的人』,每天了解全球热点!