前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Google用深度学习做癌症病理检测,准确率达89%

Google用深度学习做癌症病理检测,准确率达89%

作者头像
量子位
发布2018-03-21 16:17:04
1.4K0
发布2018-03-21 16:17:04
举报
文章被收录于专栏:量子位量子位
王新民 编译自Google Research Blog 量子位·QbitAI 出品

Google Brain技术主管Martin Stumpe和产品经理Lily Peng在官方博客上发表文章,描述了他们将深度学习用于病理检查的研究。这项工作由Google Brain和研究生命科学的兄弟公司Verily共同完成的。

以下内容来自 Google Research Blog

诊断疾病时候,需要病理学家在检查患者的生物组织样品后给出诊断意见,这份诊断报告通常是疾病治疗中的黄金标准。特别是癌症,病理学家的诊断报告对患者的治疗具有十分深远的影响。对病理切片的检查是一项非常复杂的任务,只有通过多年的训练,具有丰富的专业知识以及经验,方能成为病理学家。

即使通过这种高标准的训练,由不同病理学家对同一患者给出的诊断可能存在实质性差异,这可能导致误诊现象的产生。例如,在对于某些形式乳腺癌的诊断中,其病理一致性可以低至48%,这种情况同样存在于前列腺癌中。

病理学家必须检查大量的信息来做出准确的诊断,所以结果缺乏一致性并不奇怪。同时他们还需要审查切片上可见的所有生物组织。然而,每个患者有许多病理切片,当以40X的放大倍数进行数字化时,一个病理切片将超过10万像素。想象一下,要试图观察多张千万像素级的照片,并且注意到照片里的每个像素点,这是一项多么艰巨的任务。这不仅仅是数据量的样本大小问题,往往时间有限也无法覆盖到每一个点。

为了节约时间,提高诊断的一致性,我们创造了一个能够对病理学家工作流程进行补充的自动检测算法,来研究如何将深度学习应用于数字病理检查。我们使用的病理图片集是由Radboud大学医学中心提供的,同时也被用于2016 ISBI Camelyon Challenge1来训练对乳腺癌进行定位的算法,在数据集中,大多乳腺癌患者病情已经扩散到与乳房相邻的淋巴结。

结果怎么样呢?我们通过训练好的GoogLeNet进行网络微调,用于训练执行病理组织检测任务的深度神经网络。尽管得到的肿瘤预测热学图存在噪声,但是已经可以像病理学家所做的一样,以不同的放大倍数来检查病理图像。我们通过实验表明,我们有可能训练一个深度网络模型,能够像病理学家一样具有专业的病理检测技术,同时有无限的时间来检查病理幻灯片。

:两个淋巴结的活体组织检测图像; :经过深度网络模型进行肿瘤检测后的早期结果; :模型的分析结果,可见目前的检测模型存在假阳性。

实际上,该算法产生的病理预测热力图效果是不错的,肿瘤的定位准确率(FROC)已经达到了89%,而在没有时间约束的情况下,病理学家对肿瘤的定位正确率约为73%。其他课题组在同一数据集中的肿瘤定位上达到了81%的准确率,这个结果也表现地很好。

让我们高兴地是,我们的模型泛化能力非常好,没有过拟合现象,当输入从不同的医院使用不同的扫描仪获得的图像集,也能较好地识别和标注。 关于这方面的详细工作,请参考文章《对千兆像素级的病理图像进行癌症转移检测》。

论文地址(需要访问外国网站): https://drive.google.com/file/d/0B1T58bZ5vYa-QlR0QlJTa2dPWVk/view

图中是淋巴结活体组织检测的特写图像。该组织包含乳腺癌转移现象以及巨噬细胞,其外观与肿瘤细胞相似,但是属于良性正常组织。结果显示我们的算法成功识别肿瘤区域(亮绿色),没有误标巨噬细胞。

虽然目前模型的检测效果不错并且有提升空间,但是还有以下几点需要注意。

1. 像大多数指标一样,FROC定位评分并不完美。FROC分数的定义是,在每个病理切片中,预定义允许假阳性的个数后,得到所检测肿瘤的灵敏度。病理学家很少把正常细胞作为误认为是肿瘤细胞,上述73%的得分对应于73%的肿瘤灵敏度和零误认率。相比之下,我们模型的算法灵敏度增加的同事,也允许了更多的误认。对于每张病理幻灯片存在8个误认操作时,我们的算法灵敏度达到了92%。

2. 这些算法在执行病理检测时表现良好,但是不能检测病理幻灯片里的其他异常现象。但是病理学家可以在识别肿瘤细胞的同时,利用本身专业的系统知识,识别患者的炎症过程、自身免疫疾病或其他类型的癌症等。

3. 为了确保患者的最佳临床结果,我们可以利用算法的检测报告来辅助病理学家的判断工作。我们希望通过我们的算法能够提高病理学家的工作效率和诊断准度。一方面,病理学家可以通过检查排名最靠前的肿瘤预测区域(包括每个病理幻灯片多达8个假阳性区域)来降低其假阴性率(未识别肿瘤区域的百分比)。另一方面,这些算法可以使病理学家更容易和更准确地测量肿瘤大小,这是一个与预测相关的因素。

训练识别模型只是将有趣的医学研究转化为现实产品里许多步骤中的第一步。从临床验证到监管批准,从“实验室到工厂”,还有很多工作仍需要完成 。我们已经在这个领域取得不错的研究成果,我们希望通过分享我们的工作,让更多人关注这个领域,加快在这个领域的研究工作。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-03-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 王新民 编译自Google Research Blog 量子位·QbitAI 出品
  • 以下内容来自 Google Research Blog
    • 论文地址(需要访问外国网站): https://drive.google.com/file/d/0B1T58bZ5vYa-QlR0QlJTa2dPWVk/view
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档