业界 | 心力衰竭患者的福音,IBM 利用 AI 技术帮助病人提前确诊

近几十年,心脏病是导致美国人死亡的主要因素,所以患有心脏衰竭 (Heart Failure) 的美国人越来越多一点也不奇怪。预计到2030年,确诊患有心脏衰竭的美国成年人将会增加46%,这意味着患病人数将达到八百万,一半左右的人在确诊五年内死亡。

( AI 科技评论按:心力衰竭简称心衰,是指由于心脏的收缩功能和/或舒张功能发生障碍,不能将静脉回心血量充分排出心脏,导致静脉系统血液淤积,动脉系统血液灌注不足,从而引起心脏循环障碍症候群)

心脏衰竭很难早确诊,在美国国家卫生研究院 (National Institutes of Health) 帮助下, IBM Research 的一个科学家团队联合 Sutter Health 的科学家与 Geisinger Health System 的临床专家,利用基于电子病历 (Electronic Health Records) 背后可能隐藏的信息,研究和预测心力衰竭。在过去三年里,利用自然语言处理、机器学习和大数据分析等 AI 最新进展,该团队训练了一个比现今典型诊断早一至两年确诊心力衰竭的模型。这项研究提出了关于训练模型所需数据以及实际权衡等方面的重要见解,并开发了更容易应用在未来模型的新应用方法。

正常心脏和衰竭心脏

来源:美国心脏协会

现在的医生通常会对病人安排心力衰竭测试,并在病历中记录患者心力衰竭的体征和症状。尽管已经做出了最大的努力,但是患者通常是在急性事件接受住院治疗之后,才被诊断出心力衰竭,此时疾病已经对身体造成了不可逆转的渐进性器官损伤。

该团队的研究重点是,在典型临床诊断的前一年或前几年,通过利用电子病历系统中包含的数据,检测和预测出病人患有心力衰竭的风险有多大。

为了实现他们的目标,应用自然语言处理和机器学习方法,该团队开发和应用了几种认知计算和 AI 技术来分析项目中的患者数据。

在项目过程中,团队致力于实现一系列目标,得到了一些意想不到的发现,其中包括:

1.第一个目的是了解 Framingham Heart Failure Signs and Symptoms (FHFSS) 用于早期检测的有效性, FHFSS 是临床医生通常用来诊断心力衰竭的传统风险因素。研究者使用自然语言处理技术(NLP),通过解析信息和识别概念(包括富氏风险标准 (Framingham risk criteria) 或其他类型的症状),从非结构化数据(如医生笔记)中提取信息。有趣的是,研究结果显示,28 例原始 FHFSS 体征和症状中,只有6例确定是未来呈现心力衰竭的可靠预测因子。

2.第二个目的是,通过将医生笔记的非结构化数据与结构化电子病历数据相结合,确定能否更准确地预测心力衰竭。为此,团队应用机器学习方法来构建考虑变量组合的预测模型。研究结果显示,与 FHFSS 联合使用时,收集在电子病历中的其他常规数据类型(如疾病诊断,药物处方和实验室检查)可能是预测患者心力衰竭发作更有用的预测因素。

以上显示了心力衰竭预测研究的模型图,该模型可比当前手段早一到两年确定心力衰竭。

使用纵向电子病历数据(EHR),研究者在观察期中提取和分析了各种结构化和非结构化数据类型,其中索引日期代表可以进行预测的最早日期,预测期( prediction window )指的是传统手段诊断前,模型能够做出预测的一个时间段。

在帮助检测个体心力衰竭的可能性方面,研究还使团队深入认识到特定数据类型与实用性之间的权衡。例如,当使用更多样化的数据类型时,模型的性能得到了改善,其中诊断、用药遗嘱和住院数据三者之间的两两组合是最重要的数据类型。利用知识驱动的药物和诊断本体,将变量概括为更高层次的概念,并开发出数据驱动的方法来识别和选择最显着的变量,创建出更小和更强大的变量子集。最终,团队开发出性能和实用性都优良的预测模型。

这从临床的角度来看至关重要,因为模型中使用的患者因素可能超过了1000个,但是没有医疗保健专业人员希望输入如此多的变量。对于训练有效预测疾病模型所需数据的最低数量和类型,这些研究成果提出了可实现的指导方针。去年11月,发表在 Circulation: Cardiovascular Quality and Outcomes 的一篇论文 (“Early Detection of Heart Failure Using Electronic Health Records”) 和另一篇论文 (“Learning About Machine Learning: The Promise and Pitfalls of Big Data and the Electronic Health Record”) 记录了这一研究的其他实际意义。

以上三方将继续合作,进一步推进目前的研究结果。这项工作令人振奋的一面是,它有适用于其他疾病的潜在可能性。大数据的可用性联合革新的认知计算,有望令临床诊断和早期疾病检测方面取得重大进展。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-04-09

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI2ML人工智能to机器学习

机器学习平台的优化器 (平台篇)

机器学习的开源平台越来越多了, 绝大部分平台都是牛人读博期间的产物 (所以大家一定要珍惜读博能做开发的日子)。 先说一下, 主流平台也分工业和研究, 大体这...

930
来自专栏CDA数据分析师

从"深蓝"到 AlphaGo丨AI 在游戏领域的升级打怪之路

? 可以说,AI的发展进化史就是AI在游戏领域的升级史。 SciShow是Youtube上热门的科普向脱口秀节目。它的内容包罗万象,无论什么问题在这里都会得到...

1978
来自专栏新智元

“世界最美机器人之父”陈小平:机器人灵巧性可解决不确定性问题

演讲嘉宾:陈小平 【新智元导读】新智元AI WORLD 2017 世界人工智能大会,中国科技大学教授陈小平教授做了以《机器人灵巧性——人工智能的新挑战》为题的分...

36815
来自专栏PPV课数据科学社区

当禅师遇到一位理科生,后来禅师疯了!!知识无极限!!

老禅师忙着给各种年轻人指导人生,总是用一些模凌两可的语句,想着想着你自己似乎就想透了。但当满口心灵鸡汤的老禅师遇上理科生……于是有了下面的对话↓↓↓ 1、青...

3693
来自专栏程序员叨叨叨

1.4 本书主要内容和结构

本书旨在引导初级 GPU 学习者步入 GPU 编程的大堂,并普及一些在国内资料中较少见到的 GPU 算法,例如光照渲染中的 bank BRDF,以及体绘制中的光...

922
来自专栏量子位

机器翻译简史:八十多年来,人类就是要再造一座通天塔

《圣经》中记载,人类曾经联合起来兴建能通往天堂的高塔,为了阻止人类的计划,上帝让人类说不同的语言,使人类相互之间不能沟通,计划因此失败,人类自此各散东西。

992
来自专栏量化投资与机器学习

【解读】遗传基因程序二元机器代码自动归纳合成算法

可能这个算法出来已经一段时间了,今天在一个策略网站上偶然发现,觉得很有意思,因此,查阅了一些资料进行学习。 遗传基因程序二元机器代码自动归纳合成算法(Autom...

1906
来自专栏大数据文摘

资源 | 机器学习高质量数据集大合辑

在机器学习中,寻找数据集也是非常重要的一步。质量高或者相关性高的数据集对模型的训练是非常有帮助的。

1084
来自专栏量子位

Google人工智能面试·真·题(附参考答案+攻略)

然而想要“应试”成功,考验的不仅仅是开发人员的编程技术,还能侧面考验着参赛者的渠道来源是否广泛、背景力量是否强大、脑洞回路是否清奇……

1303
来自专栏大数据文摘

视觉研究的前世今生(上)

2286

扫码关注云+社区