动态 | 准确率远超人类病理学家!谷歌用深度学习算法检测癌症

AI科技评论按:为了解决诊断时间有限和诊断结果不一致的问题,谷歌研究院正在研究如何让深度学习在数字病理学领域发挥作用,通过创建一个自动检测算法,在病理学家的工作流中提供辅助工具。本文作者为谷歌的技术主管Martin Stumpe和产品经理Lily Peng,由AI科技评论编译。

在检查患者的生物组织样品后, 病理学家的报告通常是许多疾病的黄金诊断标准。特别是对于癌症,病理学家的诊断对患者的治疗具有深远的影响。病理切片审查是一个非常复杂的任务,需要多年的培训才能做好,丰富的专业知识和经验也是必不可少的。

尽管都经过培训,但不同病理学家对同一患者给出的诊断结果,可能存在实质性的差异,而这可能导致误诊。例如,在某些类型的乳腺癌诊断中,诊断结论一致性竟低至48%,前列腺癌诊断的一致性也同样很低。诊断缺乏一致性低并不少见,因为如果想做出准确的诊断,必须检查大量的信息。病理学家通常只负责审查一张切片上所有可见的生物组织。然而,每个患者可能有许多病理切片,假设以40倍的放大倍数进行数字化切片图像,每个患者的图像数据都超过10亿个像素点。想象一下,要遍历1张1千万像素的照片,并且必须对每个像素的判断结果负责。不用说了,这里有太多的数据需要检查,而时间往往是有限的。

为了解决诊断时间有限和诊断结果不一致的问题,我们正在研究如何让深度学习数字病理学领域发挥作用,通过创建一个自动检测算法,在病理学家的工作流中提供辅助工具。谷歌研究院使用由Radboud大学医学中心提供图像数据来训练诊断算法,这些图片也在2016 ISBI Camelyon Challenge中使用,目前该算法已被优化,用于定位出乳腺癌向乳房相邻的淋巴结扩散。

在乳腺癌扩散定位任务中,使用现成的标准深度学习方法如Inception(也称为GoogLeNet),表现也是相当不错,虽然生成的肿瘤概率预测热图还是存在噪点。我们对这个训练网络做了增强定制,包括用不同的放大倍数的图片来训练模型(非常像病理学家所做的),从训练结果来看,我们有可能训练出一个系统,它的能力可以相当于一个病理学家,甚至有可能超过病理学家的表现,并且它拥有无限的时间来检查病理切片。

图1 左图是来自两个淋巴结活检的图像,中图是早期深度学习算法检测肿瘤的结果,右图是我们当前的成果,注意第二个版本的可见噪声(潜在误判)已降低。

事实上,由该算法产生的预测热图已经改善了很多,该算法的定位得分(FROC)达到89%,明显超过没有时间约束的病理学家,他们的得分仅为73%。我们不是唯一一组认为这种方法是有希望的,其他组别的算法模型在同一数据集中获得了高达81%的分数。对我们来说更令人兴奋的是,我们的模型鲁棒性非常强,从不同的医院使用不同的扫描仪获得的图像都可以识别。相关的详细信息,请参阅谷歌研究院的相关文章“在千兆像素病理图像上检测癌症转移”。

图2 淋巴结活检的特写镜头。组织包含乳腺癌转移以及巨噬细胞,其看起来与肿瘤相似,但是是良性正常组织。我们的算法成功识别肿瘤区域(亮绿色),不会被巨噬细胞干扰。

虽然这些结果看来振奋人心,但有几个重要的注意事项需要考虑:

· 像大多数指标一样,本地化的FROC分数并不是完美的。在这里,FROC分数定义是预设带有少量假阳性的灵敏度,假阳性是指将正常组织错判为肿瘤,灵敏度则是每个载玻片所检测到肿瘤的百分比。但病理学家很少做假阳性的误判,例如上述73%的得分对应于73%的灵敏度和零假阳性。相比之下,假设允许更多的假阳性个数,我们的算法的灵敏度可以提升。如果每个载玻片允许有8个假阳性,我们的算法的灵敏度可达到92%。 · 这些算法在执行训练过的任务时表现良好,但相比人类病理学家,还是缺少丰富的知识和经验。人类病理学家可以检测出模型还没有训练的异常分类,例如炎症过程、自身免疫疾病或其他类型的癌症。 · 为了确保患者得到最佳的临床结果,这些算法需要作为病理学家的辅助工具,融入到他们的工作流中。我们设想我们的算法可以提高病理学家的诊断效率和诊断结果的一致性。例如,病理学家可以通过重点排查最靠前的肿瘤预测区域,以及每个载玻片多达8个假阳性区域,来降低其假阴性率,假阴性是指未检出肿瘤的百分比。另外,这些算法可以让病理学家准确地测量肿瘤大小,这与肿瘤预测的结果相关。

训练模型只是将有趣的研究转化为真实产品的第一步。 从临床验证到监管批准,还有很多困难需要征服。但我们已经起了一个非常有希望的开头,我们希望通过分享我们的工作,能够加快在这个领域的进步。

via Assisting Pathologists in Detecting Cancer with Deep Learning,Google Research Blog

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-03-06

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI研习社

上交大卢策吾团队开源 AlphaPose, 在 MSCOCO 上稳超 Mask-RCNN 8 个百分点

I 研习社消息,日前,上海交通大学卢策吾团队开源 AlphaPose。AlphaPose 是一个多人姿态估计系统,具有极高的精准度。 据卢策吾团队介绍, Alp...

37415
来自专栏BestSDK

四大机器学习开源框架:Theano、Caffe、Torch 和 SciKit-learn你最喜欢哪款?

1.Theano Theano 在深度学习框架中是祖师级的存在。它的开发始于 2007,早期开发者包括传奇人物 Yoshua Bengio 和 Ian Good...

3085
来自专栏ATYUN订阅号

OpenAI算法掌握困难游戏,AI智能体胜过人类玩家

OpenAI最新论文中,详细介绍了在复古平台游戏Montezuma’s Revenge中AI胜过人类玩家。表现最佳的迭代发现了第一关中24个房间中的22个,偶尔...

511
来自专栏BestSDK

谷歌用深度机器算法检测癌症,准确率高过医学博士!

在检查患者的生物组织样品后, 病理学家的报告通常是许多疾病的黄金诊断标准。特别是对于癌症,病理学家的诊断对患者的治疗具有深远的影响。病理切片审查是一个非常复杂的...

3075
来自专栏人工智能头条

英特尔院士概述深度学习愿景与优化,Caffe for Xeon Phi成亮点

1675
来自专栏人工智能快报

人工智能帮助医生将癌症诊断准确率提升至99.5%

2016年6月16日,美国Newswise新闻网站(www.newswise.com)发布消息称,人工智能可以帮助医生将癌症的诊断准确率提升至99.5%。 病理...

3986
来自专栏斜述视角

数数背后的数学思维

在那个原始时代,那个时候人类还没有文字、没有数学,原始人都一起住在山洞里面,每天就是靠打猎、采集水果为生。

622
来自专栏新智元

【3万患者11万图像14类病理】NIH公开大规模胸部X光数据集

【新智元导读】NIH临床中心最新发布了一个含有超过100,000个胸部X光图像及其相应数据的数据集,免费开放,供全世界研究人员使用,这些数据将用于训练计算机学习...

32910
来自专栏AI科技评论

微软为什么要用英伟达的GPU来支持CNTK?

今天下午,在北京举行的GTC CHINA 2016(GPU技术大会)中,英伟达深度学习研究院对CNTK中图像识别功能进行了简单介绍。 首先,我们来了解下CNTK...

2573
来自专栏AI科技评论

学界|盘点四大民间机器学习开源框架:Theano、Caffe、Torch 和 SciKit-learn

在上期的《谷歌、微软、OpenAI等巨头七大机器学习开源项目 看这篇就够了》这篇文章里,我们盘点了 TensorFlow,CNTK,SystemML,DeepM...

42212

扫码关注云+社区