MIT机器学习模型对ICU患者死亡风险的预测更为准确

编译:chux

出品:ATYUN订阅号

麻省理工学院的研究人员开发了一种机器学习模型,可以根据健康状况将患者分为亚群,以更好地预测患者在ICU住院期间死亡的风险。该技术优于“全球”死亡率预测模型,并揭示了这些模型在特定患者亚群中的性能差异。

在重症监护室,患者出现各种健康状况,急救分类在很大程度上依赖于临床判断。ICU工作人员进行许多生理测试,例如血液检查和检查生命体征,以确定如果没有积极治疗,患者是否即刻面临死亡风险。

近年来已经开发了许多机器学习模型来帮助预测ICU中的患者死亡率,基于他们逗留期间的各种健康因素。然而,这些模型具有性能缺陷。一种常见类型的“全球”模型是针对单个大型患者群体进行训练的。这些可能在平均水平上有效,但在一些患者亚群中效果不佳。另一方面,另一种类型的模型分析不同的亚群,例如,按类似条件,患者年龄或医院部门分组的那些,但通常用于训练和测试的数据有限。

在最近“Proceedings of Knowledge Discovery and Data Mining”会议上发表的一篇论文中,麻省理工学院的研究人员描述了一种机器学习模型,该模型在两个方面都是最好的:它专门针对患者亚群进行训练,但也在所有亚群中共享数据以获得更好的效果预测。通过这样做,与严格的全球模型和其他模型相比,该模型可以更好地预测患者在ICU最开始两天的死亡风险。

该模型首先在以前入住的ICU患者的电子健康记录中处理生理数据,其中一些患者在住院期间死亡。通过这样做,它学习了死亡率的高预测因子,如低心率、高血压,以及各种实验室测试结果,在最初的几天里,高葡萄糖水平和白细胞计数,并根据他们的健康状况将病人分成亚群。给定一名新患者,该模型可以从头24小时查看该患者的生理数据,并通过分析这些患者亚群,了解新患者在接下来的48小时内死亡的可能性。

此外,研究人员发现,通过特定亚群评估(测试和验证),模型还突出了全球模型在预测患者亚群死亡率方面的性能差异。这是开发模型的重要信息,可以更精确地研究特定的病人。

“ICU患者很多,”论文第一作者,计算机科学与人工智能实验室(CSAIL)研究生Harini Suresh说,“重要的是要提前弄清楚患者是否处于危险之中并且更需要立即引起注意。”

该论文的共同作者是CSAIL研究生Jen Gong和John Guttag,电气工程教授Dugald C. Jackson。

多任务处理和患者亚群

该项工作的一项重要创新是,在训练期间,该模型将患者分为不同的亚群,这些亚群捕获患者整体健康状况和死亡风险的各个方面。它通过计算按小时分解的生理数据的组合来实现。生理数据包括例如葡萄糖,钾和氮的水平,以及心率,血液pH,氧饱和度和呼吸率。血压和钾水平升高(心力衰竭的迹象),可能表明健康问题超过其他亚群。

接下来,该模型采用多任务学习方法来构建预测模型。当患者被分成亚群时,为每个亚群分配不同的调整模型。然后,每个变体模型可以更准确地对其个性化患者组进行预测。这种方法还允许模型在进行预测时在所有子群体之间共享数据。当给予新患者时,它将患者的生理数据与所有亚群匹配,找到最佳拟合,然后从那里更好地估计死亡风险。

Suresh说,“我们正在使用所有患者数据并在相关的人群中共享信息,通过这种方式,我们不会遇到数据稀缺问题,同时考虑到不同患者亚群之间的差异。”

患者入住ICU的原因和健康状况是不同的。因为这样,他们的待遇会非常不同。临床决策辅助工具应该考虑到这些患者群体的异质性并确保有足够的数据进行准确的预测。

Gong说,这种方法的一个关键见解来自于使用多任务处理方法来评估模型在特定子群体上的表现。通常在整个患者群体中评估全局模型的整体表现。但研究人员的实验表明,这些模型实际上在亚人群中表现不佳。本文测试的全球模型总体上相当准确地预测了死亡率,但在对个体亚群进行测试时,准确度下降了几个百分点。

如果不通过亚人群进行评估,这种表现差异难以衡量,Gong表示,“我们想要评估我们的模型的效果,不仅仅是对整个患者队列进行评估,而且当我们为每个具有不同医学特征的队列分解时,我们也要评估。这可以帮助研究人员更好地进行预测模型培训和评估。”

获得结果

研究人员使用来自MIMIC重症监护数据库的数据测试了他们的模型,该数据库包含有关异质患者人群的大量数据。在该数据约32000名患者中,超过2200名患者死于该医院。他们使用80%的数据集进行训练,20%用于测试模型。

在使用前24小时的数据时,该模型将患者聚集到具有重要临床差异的亚群中。例如,两个亚群包含在最初几个小时内血压升高的患者,但一个随着时间的推移而降低,而另一个则在一整天内保持升高。该亚群的死亡率最高。

使用这些亚群,该模型在接下来的48小时内以高特异性和灵敏度以及各种其他指标预测患者的死亡率。多任务处理模型的表现明显优于全球模型几个百分点。

接下来,研究人员的目标是使用来自电子健康记录的更多数据,例如患者接受的治疗。他们还希望将来训练模型,从数字化临床笔记和其他信息中提取关键词。

这项工作得到了美国国立卫生研究院的支持。

原文发布于微信公众号 - ATYUN订阅号(atyun_com)

原文发表时间:2018-08-31

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

赛后跟踪:如何在 ImageNet 比赛中获得冠军?

近两个月,国内团队先后在全球权威的人脸检测评测平台 FDDB 和全球自动驾驶算法公开排行榜 KITTI 以及 Cityscapes 上取得非常好的成绩,这在一定...

3715
来自专栏机器之心

业界 | 人工智能看走眼的图像都长什么样?

选自the Verge 作者:James Vincent 机器之心编译 参与:Ellen Han、黄小天 威廉·吉布森(William Gibson)写于 2...

3507
来自专栏AI科技评论

一张 AI 的「自画像」

AI 应该长什么样子?人们给出常见的答案不外乎是:像个机器人,像一组闪烁的 LED 灯,或者像电脑屏幕上一组变幻莫测的波形。那么在 AI 的眼中,一个 AI 应...

1183
来自专栏机器之心

深度学习即将非法?欧盟《一般数据保护条例》五月生效

2757
来自专栏腾讯技术工程官方号的专栏

Fashion-MNIST 一周年 | Google NIPS最爱,还登上了Science

? 导语:本文回顾了Fashion-MNIST发布后的一年里在人工智能/机器学习学术圈和社区中所取得的进展。该数据集的初衷是替代MNIST,为机器学习提供一个...

1852
来自专栏AI科技评论

澳门大学陈俊龙:颠覆纵向的「深度」学习,宽度学习系统如何用横向扩展进行高效增量学习?

AI 科技评论按:想必各位读者对深度神经网络及深度学习都不会感到陌生,不论是在数据处理或是应用层面,都取得了斐然的成绩。但囿于结构的复杂性及超参数的数量巨大,一...

42811
来自专栏安恒信息

安恒信息两篇核心AI异常检测论文入选IEEE DSC国际会议

6月18日-21日,“第三届IEEE网络空间数据科学国际会议”在广州召开。业界代表及专家齐聚一堂,并就网络空间数据科学的科研和前沿发展方向进行交流。而安恒信息的...

1994
来自专栏杂七杂八

CS231n学习笔记--计算机视觉历史回顾与介绍1

首先我们来看看官方对这门课的介绍: 计算机视觉在社会中已经逐渐普及,并广泛运用于搜索检索、图像理解、手机应用、地图导航、医疗制药、无人机和无人驾驶汽车等领域。...

1462
来自专栏新智元

【CVPR最强参会指南】深度学习走下神坛,中国AI独角兽强势抢镜

1893
来自专栏ATYUN订阅号

利用深度学习模型提取信号做临床预测,或将提高医护质量

预测接下来会发生什么是机器学习的应用领域。那么在你通勤时预测交通状况,或者在英语翻译到西班牙语时预测下一个词,这些类型的机器学习是否也可以用于临床预测呢?在实践...

1063

扫码关注云+社区

领取腾讯云代金券