前沿 | Science:自学习式人工智能可协助预测心脏病发作

选自Science

作者:Matthew Hutson

机器之心编译

参与:蒋思源、黄小天

近年来,将人工智能应用于医疗健康已经在蓬勃发展,机器之心也曾报道过医疗方面的文章,变革的开始,深度学习将如何改变医疗成像领域?纽约客特稿 | 把癌症诊断交给机器,医疗服务会更好吗? 《科学》的这篇文章注重于使用机器学习算法解决最难以预测的心脑血管疾病,希望能有助于心脑血管疾病的预防。

即使医生有很多工具可以预测患者的健康,但是他们仍会告诉你这些工具远远不能应对人体的复杂性。而心脏病发作就特别难以预测。现在,科学家已经表明,自我学习式计算机可比标准医疗指导方针实现更好的性能,显著提高预测率。如果推广开来,这项新方法每年可挽救数千甚至数百万的生命。

加州斯坦福大学血管外科医生 Elsie Ross 说:「这种方法简直太重要了,我真的希望医师们能够开始使用人工智能帮助照顾患者。」

每年有近 2000 万人死于心脑血管疾病,包括心脏病、脑溢血、阻塞性动脉和其他循环系统功能性障碍。为了预测这些疾病,许多医师使用和美国心脏病学会/美国心脏协会(ACC/AHA)相似的指导方针。这些方针都是基于包括年龄、胆固醇水平和血压在内的八个风险因素,这些因素是医生不断积累起来的。

但是这太单一以至于无法解释患者服用的许多药物,或者其他疾病和生活因素。英国诺丁汉大学流行病学家 Stephen Weng 说:「生物系统中有很多相互作用。」这些相互作用是违反直觉的:在某些情况下,身体大量的脂肪实际上可防止心脏病发作。Weng 说:「这是人类身体的真实情况,计算机科学可帮助我们探索这些因素之间的关联。」

在一项新研究中,Weng 和其同事对比了 ACC/AHA 指导方针和 4 个机器学习算法:随机森林(random forest)、logistic 回归(logistic regression)、梯度提升(gradient boosting)以及神经网络(neural networks)。为了在没有人类指示的情况下得出预测工具,所有这 4 项技术分析了大量数据,被分析的数据来自英国 378256 名患者的电子医疗记录,目标是在与心血管疾病有关的记录之中找出发病模式。

首先,人工智能(AI)算法必须自我训练。模型使用 78% 的数据(约 295267 条记录)来搜索模式并构建它们自己的内部「指导方针」。然后使用剩余的记录对自己进行测试。在使用 2005 年的可用记录数据后,系统能预测在未来十年内哪些患者会首次发生心脑血管疾病,然后再使用 2015 年的记录检查预测结果。与 ACC/AHA 指导方针不同,机器学习方法可考虑超过 22 个的特征,包括民族、关节炎和肾脏疾病等。

所有 4 种人工智能方法的表现都优于 ACC/AHA 指导方针。我们使用 AUC(其中 1.0 表示 100% 的精确度)的统计量,ACC/AHA 指导方针达到 0.728,而 4 种人工智能方法的精确度在 0.745 到 0.764 之间,Weng 的团队这个月在 PLOS ONE 报告了这一成果。最好的神经网络方法的精确与测量不仅比 ACC/AHA 指导方针多出 7.6%,同时还减少了 1.6% 的错误预警。在大约有 83000 条记录的测试样本中,这相当于多挽救了 355 名额外的患者。Weng 说,这是因为预警通常就会导致患者通过服用降低胆固醇的药物或改变饮食进行预防。

英国曼彻斯特大学数据科学家 Evangelos Kontopantelis(其使用基层医疗数据库开展工作)说:「这是一项高质量研究,更强的计算能力或者更多的训练数据有助于解决这一问题,并获得更大的研究成果。」

ACC/AHA 指导方针并不包含被机器学习算法认定为最强预测因子的几个风险因素,比如拥有严重的心理疾病和服用皮质类固醇(corticosteroid)。同时,没有一个机器学习算法认为 ACC/AHA 列表上的糖尿病是 10 大预测因子之一。Weng 继而希望计算机算法能涵盖其他生活因素和遗传因素而提升其精确度。Kontopantelis 注意到了这项研究工作的一个局限性:机器学习算法就像黑箱,你可以看到输入数据和输出结果,却无从得知黑箱之中发生了什么。这使得人类难以调整算法,算法也无法泛化到新场景中的预测。

医师很快会在实践中采取相似的机器学习算法吗?Ross 说:「医师对自己的专长感到自豪,但是我,作为新一代人,发现计算机可以协助我们。」

原文链接:http://www.sciencemag.org/news/2017/04/self-taught-artificial-intelligence-beats-doctors-predicting-heart-attacks

本文为机器之心编译,转载请联系本公众号获得授权。

原文发布于微信公众号 - 机器之心(almosthuman2014)

原文发表时间:2017-04-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

DOTA2中打败Dendi的AI如何炼出?OpenAI公布两周集训细节(含实战视频)

2013
来自专栏量子位

资源警告!有人收罗了40个中文NLP词库,放到了GitHub上

最近,在GitHub上,有人收罗了一份资源,汇集了40个关于中文NLP词库,涵盖了各个方面。

2673
来自专栏新智元

【不含CPU,超越GPU 1000x】Wave公司发布数据流处理架构DPU

【新智元导读】Wave Computing 在日前举行的高性能芯片峰会Hot Chips上介绍了他们的数据流处理器产品DPU(Dataflow Processi...

3005
来自专栏ATYUN订阅号

AI Benchmark可以测试智能手机的神经网络性能

芯片制造商高通,华为和联发科有什么共同之处?所有这三种市场硬件架构都可以加速计算机视觉,自然语言处理以及智能手机,平板电脑和其他移动设备中的其他机器学习任务。麻...

1955
来自专栏新智元

【Science重磅】自学习人工智能在预测心脏病发作上击败人类医生

【新智元导读】Science 今日报道,科学家使用能够自学习的人工智能技术,让计算机在预测心脏病的发作上击败了人类医生。一旦投入使用,这一新的诊疗手段每年将拯救...

3766
来自专栏机器学习算法与Python学习

资源 | 中文NLP资源库

最近,在GitHub上,有人收罗了一份资源,汇集了40个关于中文NLP词库,涵盖了各个方面。

2082
来自专栏大数据挖掘DT机器学习

【趣味】数据挖掘(4)——借博客点击兼谈干预规则

讲过长课的老师,常在受众将发生审美疲劳之时段,安排一点有趣的内容。为消除疲劳,现来一段有趣的、与博友的自尊心和荣誉感相关的博文,议题是:挖掘科学博客的平均...

3237
来自专栏AI研习社

普林斯顿联合Adobe 连声音都能PS了 | 2分钟读论文

来源 / Two Minute Papers 翻译 / 季伟 校对 / 贤儿响叮当 整理 / 雷锋字幕组 AI 研习社出品系列短视频《 2 分钟论文 》,带大...

2944
来自专栏奇点大数据

入门深度学习应该学什么

最近被人问的最多的一个问题是“我想入门深度学习,我应该学些什么”。 老实说,这个问题不是那么好回答,毕竟每个人的知识背景和技能背景实在是太不一样了。如果要假设...

3777
来自专栏数据派THU

独家 | 6步教你用R语言制作动图

原文标题:How to create animated GIF images for data visualization using gganimate (i...

2967

扫码关注云+社区

领取腾讯云代金券