学界 | 吴恩达团队展示全新医疗影像识别技术:肺炎诊断准确率超过人类医生

选自Stanford ML Group

作者:Pranav Rajpurkar等

机器之心编译

参与:李泽南

机器学习在医疗领域的应用一直是 AI 的重要发展方向,深度学习著名学者吴恩达和他在斯坦福大学的团队一直在这一方面做着努力。近日,该团队提交的一篇新论文提出了名为 CheXNet 的新技术。研究人员在论文中表示:新的技术已经在识别胸透照片中肺炎等疾病上的准确率上超越了人类专业医师。吴恩达表示,或许放射科医生们需要开始担心他们的工作了。

仅在美国,每年就有超过 100 万成年人因为肺炎住院,5 万人因为该病而死亡(CDC, 2017)。目前,胸部 X 光检查是诊断肺炎的最佳方法(WHO, 2001),这种方法在临床护理和流行病学研究中发挥着重要作用。然而,通过 X 光片诊断肺炎是一个具有挑战性的任务,需要放射科医师专家级的判断能力。在斯坦福大学发表的新论文中,计算机科学院和医学院的研究人员共同提出了一种新的机器学习模型,可以让计算机通过胸透照片自动诊断肺炎,其诊断准确率超过了放射科医师。

图 1. ChexNet 是一个 121 层的卷积神经网络,以胸透图片为输入,输出患病概率。在这个例子中,CheXnet 准确地探测到了肺炎,同时定位了图片中最有可能患病的位置。

CheXNet 可以输出肺炎存在可能性的热区图。研究人员在最近发布的 ChestX-ray14 数据集(Wang et al., 2017)上训练了 CheXNet。该数据集包含 112,120 张各自标注最多有 14 种不同胸部疾病(包括肺炎)的正面胸透图像。研究人员使用密集连接(Huang et al., 2016)与批归一化(Ioffe & Szegedy, 2015)来优化这一深度神经网络。

图 2. CheXNet 在使用胸透图像识别肺炎任务上的表现要超过放射科医师的平均水平。在测试中,CheXNet 与四名人类放射科医师在敏感度(衡量正确识别阳性的能力)以及特异性(衡量正确识别阴性的能力)上进行比较。放射科医生的个人表现以橙色点标记,平均值以绿色点标记。CheXNet 输出从胸透照片上检测出的患肺炎概率,蓝色曲线是分类阈值形成的。所有医师的敏感度-特异性点均低于蓝色曲线,这意味着 CheXNet 在肺炎上的诊断水平与放射科医师相同,甚至更高。

从胸部 X 光检查照片中检测肺炎对于放射科医师而言是一个困难的任务。因为肺炎在照片上的表现经常难以识别——它可能会与其他病症重叠,也可以与其他很多良性异常类似。这些原因导致放射科医师在诊断肺炎时表现差异很大(Neuman et al., 2012;Davies et al., 1996;Hopstaken et al., 2004)。为了评估放射科医师的表现,斯坦福大学的研究人员找来了四名专业放射科医师,使用 ChestX-ray14 子集的 420 张图片对他们进行了测试。在这 420 张图片里,诊断正确与否的标准为其他大多数放射科医生的投票结果,与此同时,CheXNet 模型也以同样的标准进行了测试。

研究人员发现,CheXNet 在敏感度与特异性两个方面均超过了放射科医师的平均水平。为了对比 CheXNet 与此前使用 ChestX-ray14 的模型的能力,研究人员横向对比了新模型与其他模型在 ChestX-ray14 上对于十四种疾病的诊断准确率,结果发现新模型的表现在所有方面均超过了前人的结果。以超过专业放射科医师的水平自动对胸透照片进行分析诊断疾病不仅在临床上可以为我们带来更多方便,也可以在医疗影像专业人士数量不足的情况下为病人带来帮助。

表 1. CheXNet 在 ChestX-ray14 数据集中 14 种病变的检测结果与另外两种模型的对比。在检测肿块、结节、肺炎、气胸和肺气肿时,CheXNet 的表现超越了此前业内最佳水平至少 0.05。

图 3. 使用 Class Activation Maps,ChexNet 定位了它识别出的病变,高亮区域是分析病症需要重点观察的位置。

论文:CheXNet: Radiologist-Level Pneumonia Detection on Chest X-Rays with Deep Learning

论文链接:https://arxiv.org/abs/1711.05225

摘要:我们开发了一种全新算法,能够从胸透照片里检测肺炎,且水平超越专业放射科医生。我们的算法被称为 CheXNet,它是一个 121 层的卷积神经网络。该网络在目前最大的开放式胸透照片数据集「ChestX-ray14」上进行训练。ChestX-ray14 数据集包含 14 种疾病的 10 万张前视图 X-ray 图像。在实验中,4 名专业的放射科学者在测试数据集上进行手动注释,并与 CheXNet 的表现进行对比。我们发现,在肺炎检测的敏感性与特异性上,CheXNet 的准确率超越了普通的放射科医生。我们把 CheXNet 应用到对 ChestX-ray14 数据集中 14 种疾病的检测上,也取得了顶尖的结果。

本文为机器之心编译,转载请联系本公众号获得授权。

原文发布于微信公众号 - 机器之心(almosthuman2014)

原文发表时间:2017-11-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

耶鲁编程马拉松:用神经网络学习超级马里奥游戏

? Joe Crozier 和我最近刚从YHack 回来,那是一个耶鲁大学举办的36小时编程马拉松,有1500人参加。这是我们连续第二年参加这个比赛,也是我们...

41280
来自专栏ATYUN订阅号

谷歌Move Mirror机器学习实验:你一动,8万张图像跟着动作匹配

谷歌在博客文章中展示了“Move Mirror”,这是一个机器学习实验,可以将你的姿势与同一姿势的其他人的图像相匹配。

13320
来自专栏专知

【AlphaGo Zero 核心技术-深度强化学习教程笔记09】探索与利用

【导读】Google DeepMind在Nature上发表最新论文,介绍了迄今最强最新的版本AlphaGo Zero,不使用人类先验知识,使用纯强化学习,将价值...

31140
来自专栏思影科技

高功能自闭症患者的脑网络动力学

近日,来自伦敦大学学院认知神经系的Takamitsu Watanabe和Geraint Rees在nature communications期刊上发表了一项研究...

36890
来自专栏机器之心

业界 | Nature:能自主学习的人工突触,为无监督学习开辟新的路径

选自Nature 机器之心编译 参与:蒋思源、刘晓坤 近日,Nature 发表了一个研究团队开发的一种能自主学习的人工突触,它能提高人工神经网络的学习速度。该研...

294110
来自专栏AI研习社

如何在 Python 内使用深度学习实现 iPhone X 的 FaceID

在最近推出的 iPhone X 中,它被讨论最多的特点之一是它采用了新的解锁方法,即 TouchID:FaceID。

13930
来自专栏大数据文摘

“蝴蝶效应”也能预测了?看机器学习如何解释混沌系统

24470
来自专栏奇点大数据

耶鲁编程马拉松:用神经网络学习超级马里奥游戏

来源:Medium 作者:Nikolai Savas 翻译:王婉婷 ? Joe Crozier 和我最近刚从YHack 回来,那是一个耶鲁大学举办的36小时编程...

38850
来自专栏视觉求索无尽也

【Research】Explore ChestX-ray Dataset

肺部疾病是威胁现代人健康的重要疾病之一,如何使用快速且廉价的方法对肺病进行诊断是医学界的重要课题。 随着深度学习方法的兴起,世界各地越来越多的研究员在尝试用深...

91440
来自专栏专知

【前沿】自动从CT医疗影像中生成诊断报告,卡内基梅隆大学CMU邢波教授团队最新基于深度学习的医疗影像研究成果

【导读】CMU邢波(Eric Xing)团队最近在arXiv上发布新论文,采用深度学习方法自动地从CT医疗影像中生成诊断报告,大大提高医生诊疗效率。写作报告对经...

547110

扫码关注云+社区

领取腾讯云代金券