首页
学习
活动
专区
圈层
工具
发布

当大模型面对“不完整的信息”:为何通用AI目前难以撼动临床推理的基石

先说结论,在医疗这类专业领域,诊断还得靠医生,或者找专业的AI寻求帮助。

作为一位长期耕耘于临床推理教学领域的教师,我时常被年轻医生和医学生问:“老师,AI诊断这么准,我们未来会被取代吗?”

近期发表在《JAMA Network Open》上由哈佛大学医学院等团队完成的研究,为我们提供了极具价值的冷静思考素材。

这项研究测试了Cha tGPT、Gemini、DeepSeek等21款主流通用大模型,深入剖析了它们在临床推理过程中的表现。作为一名教学者,我读罢全文,最深的感触反而是对人类临床推理起始环节价值的再确认。

该研究显示,当病例所有信息(包括化验单、影像结果)输入完毕后,模型得出最终正确诊断的概率超过90%。

这个数据无疑令人印象深刻,从这个维度上说,AI真的会超越很多医生。然而,当视线聚焦于鉴别诊断的形成阶段时,尤其是早期推理步骤,所有通用大模型的表现都堪称“灾难”——在80%以上的病例中,通用AI未能提出合适的鉴别诊断列表。

这一矛盾的现象,恰恰揭示了当前通用AI在医学应用中的核心软肋:擅长在确定性的、完整的数据集中寻找答案,却难以在不确定的、开放的临床迷雾中构建问题列表。

通用大模型为何在此折戟?原因在于它们处理的是“字面信息”,而人类医生处理的是“语境信息”与“感知信息”。

第一,信息获取的被动性与主观性陷阱。AI必须依赖人类输入的文本。

当患者说“我胸口痛”,人类医生会通过眼神观察、语气感知、肢体语言解读,在脑海里自动过滤出这是“濒死感的压榨感”还是“一闪而过的刺痛”。这种基于非语言线索的信度评估,是大模型无法跨越的物理屏障。通用AI可能会将“胸痛”机械地关联到心绞痛、胃食管反流甚至焦虑症,而经验丰富的医生在触摸到患者湿冷皮肤的瞬间,鉴别诊断的优先级就已悄然浮现。

第二,体格检查的数据闭环缺失。

临床推理并非线性的“病史采集-体格检查-诊断”单向推进,而是一个不断假设-验证-再假设的循环。医生的双手在腹部触诊时感受到的压痛反跳痛,听诊器在肺部下捕捉到的细湿啰音,这些动态反馈会实时修正大脑中的贝叶斯概率模型。

而通用大模型无法像人类医生那样,在叩诊发现移动性浊音后,立刻调整思路去追问饮酒史。这种动态交互式推理能力的匮乏,导致通用大模型生成的鉴别诊断列表往往是基于症状引申的教科书式的罗列,而非基于特定患者画像的精准刻画。

第三,诊断检查的“效费比”失控风险。

正如您所担心的,鉴别诊断的拉胯会直接导致后续检查的针对性丧失。在教学中,我们强调“最小侵入、最大获益”的高价值医疗原则。若通用AI无法将鉴别范围从广泛的“腹痛待查”收敛至“急性胰腺炎或十二指肠穿孔”,它开具的检查清单就会趋于宽泛——CT平扫加增强、全套肿瘤标志物、甚至不必要的内镜。

该研究结论也为临床教学提供了极佳的佐证:AI的强大在于处理“已知的未知”,而医生的核心价值在于探索“未知的未知”。

因此,对于普通人而言,使用通用AI进行咨询确有其便利性,但它更像是一个索引工具而非决策工具。

用户输入症状,AI反馈可能的方向和就医建议,这有助于提高疾病认知与健康管理素养,但不能替代医生的临床思维。

有意思的是,该研究也为我们审视国内的AI健康应用提供了参照。

通用大模型在“鉴别诊断”上的乏力,很大程度上源于信息输入环节的被动与粗糙。而像蚂蚁阿福这类深耕垂直领域的AI应用,恰恰在设计逻辑上尝试弥补这一短板。

一方面,它试图在交互中逼近“主动追问”的医生思维。根据其公开的技术资料,阿福的“AI诊室”基于多轮问答技术,并非被动等待用户扔来一句话,而是会像实习医生采集病史那样,根据症状描述进行多维度追问。例如用户说头痛,它会追问部位、性质、持续时间及伴随症状。

这种结构化的引导式问诊,虽然仍无法替代体格检查的视触叩听,但在一定程度上改善了通用大模型仅凭“字面意思”盲目推理的缺陷,将模糊的主观不适转化为相对清晰的鉴别诊断要素。对于缺乏医学常识的普通大众而言,这无疑降低了误判的风险。

另一方面,它展现了垂直模型在“数据对齐”上的优势。阿福能打通主流智能穿戴设备数据,并解读体检报告。这意味着它在面对个体时,掌握的不仅是当下的主诉,还有连续的血压趋势、血糖波动、既往病史背景。当信息维度从单一的文本指令扩展为多维度的健康档案时,AI推理的基石才会稳固一些。

比如,同样是咳嗽,结合了用户健康档案中的“过敏性鼻炎史”与单纯的文字提问,AI给出的分析方向会更具针对性。甚至在其辅助基层村医的实践中,当村医面对复杂病情“没有头绪”时,这类垂直AI能成为增强基层诊疗力量的某种延伸。

作为临床教师,我也在思考我的教学,临床教师的责任不再是教学生如何记住AI也能背出的知识点,而是教会他们如何在信息不全、证据矛盾时,精准补充采集信息,敏锐地构建假设,针对性选择检查检验手段,同时总是给予患者以心灵安慰。

AI终将成为听诊器、X线等划时代诊疗手段之后的又一个重要工具,无论是通用大模型还是垂直健康助手,它们最大的价值在于让医生从繁杂的信息检索和文书工作中抽身,从而更专注于床边那个独一无二的人。

它越是强大,人类医生那充满人文洞察与逻辑跳跃的推理艺术,便越是弥足珍贵。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/Oqk8Lt3wB5V3SM0Ih8VQINzg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券