前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >ChatCAD:使用大型语言模型对医学图像进行交互式计算机辅助诊断

ChatCAD:使用大型语言模型对医学图像进行交互式计算机辅助诊断

作者头像
医学处理分析专家
发布2023-09-20 18:42:49
3870
发布2023-09-20 18:42:49
举报

最近大型语言模型 (LLM) 展示了在临床应用中的潜力,提供了宝贵的医学知识和建议。比如像ChatGPT这样的对话LLM,已经顺利通过了部分美国医学执照考试。然而,LLM在处理图像方面还是存在困难,这使得解读医学图像中的信息是具有挑战性的,而医学图像中包含丰富的支持临床决策的信息。另一方面,用于医学图像的计算机辅助诊断(CAD)网络通过使用先进的深度学习算法来支持临床决策,这在医学领域取得了重大成功。本文介绍了一种将LLM集成到医学图像CAD网络中的方法。所提出的框架使用 LLM 通过总结和重组以自然语言文本格式呈现的信息来增强多个CAD网络的输出,例如诊断网络、病变分割网络和报告生成网络。目标是将LLM的医学领域知识和逻辑推理的优势与现有医学图像CAD模型的视觉理解能力相结合,为患者创建一个比传统CAD系统更加用户友好和易于理解的系统。未来,LLM的医学知识还可以用于提高基于视觉的医学图像CAD模型的性能。

建立医学影像到文本的桥梁策略:1) 将检查图像(例如 X 射线)输入经过训练的CAD 模型得到输出;2)将这些输出(通常是张量)转换成自然语言;3)使用语言模型对结果进行归纳,得出最终结论;4) 基于视觉模型的结果和语言模型中预训练的医学知识,进行有关症状、诊断和治疗的对话。

1)、上述分类网络,病灶分割网络产生的结果是向量和mask,这是无法被LLM所理解的。

2)、将向量或mask翻译成用于LLM的提示语句。例如对于分类网络输出有如下所示的三种提示语句类型,提示语句1类型是疾病和对应概率分数,这与放射科医生的报告是有很大区别的,因为具体的诊断评分在临床环境中并不经常使用。提示语句2类型是一个评级系统,将提示语句1的具体分数转换成疾病严重程度。提示语句3类型是简明提示,在提示中报告诊断分数高于0.5的疾病。如果疾病概率都小于0.5,则提示“未发现”。一般提示语句2和提示语句3都是可以接收和理解的。

3)、然后将这些文本形式的结果连接在一起,作为LLM的输入提示词,LLM会总结所有CAD网络的结果。如上图所示,改进的报告结合了所有三个网络的结果,提供了对患者状况的清晰简洁的总结,突出了肺炎的存在和左下肺叶的感染程度。

4)、可以利用LLM广泛而强大的医学知识来提供交互式解释和医学建议。例如,基于图像和生成的报告,患者可以询问适当的治疗方案或定义医学术语,例如“气腔实变”。或者根据患者的描述,LLM可以解释为什么会出现这种症状。通过这种方式,患者可以更有效地深入了解他们的症状、诊断和治疗,可有效帮助患者降低临床专家的会诊成本,还可以显著提升在线医疗保险服务质量。

局限与思考:

1、LLM生成的报告在某种程度上不像人类产生的。有效的解决方案是在ChatGPT 之后添加一个模块来过滤生成的报告或添加提示。

2、只设计了三种典型的直观提示词,还有改进的空间。

3、只对提示词设计进行了定性分析,没有进行定量分析。

4、实验证明语言模型大小对诊断准确性的显着影响,语言模型越大,诊断准确性越高。更大、更先进、更真实的LLM(例如即将推出的GPT-4),可能会进一步提高准确性和报告质量。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2023-02-16 14:14:38,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 最新医学影像技术 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档