卷积神经网络检测皮肤癌已超越皮肤科专家

AiTechYun

编辑:chux

研究人员首次发现深度学习卷积神经网络(CNN)比经验丰富的皮肤科医生在检测皮肤癌方面表现更好。

在发表在主要癌症杂志Annals of Oncology [1]上的一项研究中,德国,美国和法国的研究人员通过向CNN展示100,000多张恶性黑色素瘤(皮肤癌最致命的形式)以及良性痣图像。他们将其表现与58位国际皮肤科医师的表现进行了比较,发现CNN与皮肤科专家相比,漏掉了更少的黑色素瘤,误诊了少量良性痣。

CNN是一种人造神经网络,它受工作中的生物学过程的启发,当大脑中的神经细胞(神经元)相互连接并对眼睛所见产生反应,能够从它“看到”的图像中快速学习,并从它学到的改进其性能的过程中教导自己(一种称为机器学习的过程)。

该研究的第一作者,德国海德堡大学皮肤病学系高级管理医师Holger Haenssle教授解释说:“CNN像小孩的大脑一样工作,为了训练它,我们向CNN展示了超过10万恶性和良性皮肤癌和痣的图像,并指出每张图像的诊断,只使用皮肤镜图像,即放大倍数为10倍的病变图像,在每一个训练图像中,CNN提高了区分良性和恶性病变的能力。在完成训练后,我们从海德堡图书馆创建了两组测试图像,这些图像从未用过,因此对CNN来说是未知的。一组300幅图像测试CNN的性能。我们选择了100个最困难的病变来测试真皮肤科医生,与CNN的结果相对比。”

小组邀请了来自世界各地的皮肤科医生,来自全球17个国家的58位同意进行测试。其中17人(29%)在皮肤镜检方面的经历不到两年,11人(19%)有2至5年的经验,30人(52%)拥有超过5年的专家经验。

实验要求皮肤科医生首先根据皮肤镜检查(第一级)对恶性黑色素瘤或良性痣做出诊断,并决定如何管理病情(手术,短期随访或无需采取措施)。然后,四周后,他们获得了关于患者的临床信息(包括年龄,性别和病变部位)以及同样100例患者的特写图像(II级),并再次要求做出诊断和管理决策。

在第一级,皮肤科医生准确地检测到平均86.6%的黑素瘤,并正确地确定了平均71.3%的非恶性病变。然而,当CNN调整到与医生相同的水平以正确识别良性痣(71.3%)时,CNN检测到95%的黑素瘤。在第二级,皮肤科医生改善了他们的表现,准确地诊断了88.9%的恶性黑素瘤和75.7%的非癌症。

Haenssle教授说:“CNN漏掉更少的黑色素瘤,这意味着它比皮肤科医生的敏感度更高,而且它误诊了更少的良性痣,意味着它具有更高的特异性,这将减少不必要的手术。“

当皮肤科医生在第二级接受更多的临床信息和图像时,他们的诊断性能得到改善,然而,CNN仍然仅依靠皮肤镜像进行工作,没有额外的临床信息,表现依然超出医师的诊断能力。

专家皮肤科医生比经验较少的皮肤科医生表现得更好,并且更善于发现恶性黑素瘤。 然而,他们在这两个层次上做出正确诊断的平均能力仍然比CNN差。

“这些研究结果表明,CNN能够比皮肤科医生,包括经过广泛培训的专家在检测黑素瘤的任务中表现更出色,”他说。

恶性黑色素瘤的发病率正在增加,估计全球每年有232,000例新病例和约55,500例死亡病例。如果在早期发现,是治愈的,但许多病例只有在癌症更加严重且难以治疗时才能被诊断。

Haenssle教授说:“我参与了近20年来在可治愈阶段发现黑色素瘤的研究项目,我和我正在关注的非侵入性技术可能有助于医生不会漏掉黑色素瘤,例如,在进行皮肤癌筛查时,当我遇到最近关于深度学习算法的报告时,它们在特定任务中胜过了人类专家,我立即知道我们必须探索这些用于诊断黑色素瘤的人工智能算法。”

研究人员并没有设想CNN将从皮肤科医生手中接管皮肤癌的诊断,但可以将其用作额外的辅助手段。

“CNN可能会为参与皮肤癌筛查的医生提供帮助,辅助他们决定是否对病变进行活检。大多数皮肤科医师已经使用数字皮肤镜系统对病变进行成像和存储以便进行记录和随访。快速评估存储的图像以获取关于黑色素瘤概率的“专家意见”,目前我们正在计划进行前瞻性研究,以评估CNN对医生和患者的实际影响。”

这项研究有一些局限性,其中包括皮肤科医生处于无需做出“决定生死”的人造环境中;测试集不包括全面的皮肤病变;来自非高加索人皮肤类型和遗传背景的验证图像较少;医生可能并不总能遵循他们不信任的CNN的建议。

在一篇社论中, Victoria Mar博士(澳大利亚墨尔本莫纳什大学)和H. Peter Soyer教授(澳大利亚布里斯班昆士兰大学)写道:“目前,黑色素瘤的诊断准确性取决于经验和培训…… Haenssle等人已经证明,使用卷积神经网络的计算机算法胜过了大多数58位测试的皮肤科医生…..这表明人工智能(AI)有望实现更加标准化的诊断准确性水平,这样所有的人,无论他们住在哪里,或者他们遇到了哪个医生,都能够获得可靠的诊断评估。”

他们强调了在AI可能成为诊所标准之前需要解决的一些问题,包括难以在手指,脚趾和头皮等部位对一些黑色素瘤进行成像,以及如何充分训练AI以识别未知的非典型性黑色素瘤。

他们得出结论:“目前,没有什么可以替代全面的临床检查,但是二维和三维全身照相能够捕获大约90%至95%的皮肤表面,并且我们预计成像技术呈指数级发展,自动化诊断将改变皮肤病学的诊断范式,然而,将这项令人兴奋的技术安全地应用于常规临床护理之前,还有很多工作要做。”

原文发布于微信公众号 - ATYUN订阅号(atyun_com)

原文发表时间:2018-05-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏思影科技

PTSD的心理治疗对前额皮层功能的选择性影响

暴露疗法是创伤后应激障碍(PTSD)的有效治疗方法,但心理治疗究竟如何影响仍缺乏综合的、以情绪为重点理解。来自斯坦福大学精神病和行为科学部的Gregory A....

4309
来自专栏量化投资与机器学习

【Python量化投资】涨跌幅度分级,使用SVM分类预测

流通市值最小500 引用情景因子初探 简单说明 开始的时候想做一个ZZ800成分股的小策略,然后受制于性能限制,也懒得自己造轮子,就改成SH50了 今天有空...

28810
来自专栏大数据文摘

资源 | 100+个自然语言处理数据集大放送,再不愁找不到数据!

29010
来自专栏机器学习算法与Python学习

超强干货 | Python金融数据量化分析教程+机器学习电子书

6422
来自专栏思影科技

腹内侧前额叶与脑岛皮层变化对儿童到青少年元记忆发育的影响

元记忆监控与内生回忆准确性的能力在儿童发育过程大大改善,但潜在的神经变化和对智力发育的影响在很大程度上是未知的。来自加州大学戴维斯分校心智与大脑中心(Cente...

4359
来自专栏AI研习社

玩机器学习要知道哪些开源数据库?

开发 AI 和机器学习系统从来没有像现在这样方便。 类似于 TensorFlow、Torch 和 Spark 这样的开源工具,在 AI 开发者群体中已是无处不在...

4914
来自专栏思影科技

FNIRS研究:额颞叶-顶叶系统在真实情景下目光接触中的脑内和脑间同步

3497
来自专栏量子位

癌细胞检测,只要0.0758秒 | 谷歌AR+AI显微镜问世

病理学家们要想从一团密密麻麻的组织细胞里,找到空间排列奇怪,细胞核形状诡异的癌细胞,就得守在显微镜后头,一张一张活检切片看过去,看到天荒地老,海枯石烂。

983
来自专栏思影科技

Neuron:人类个体大脑的精准功能成像

来自美国德州VISN 17 Center of Excellence的Evan M. Gordon等人在Neuron期刊上发文,主要介绍了其提供的MSC数据集,...

3006
来自专栏机器之心

神经网络诊断皮肤癌超越人类专家?来自医疗界的这篇论文给出了证明

1868

扫码关注云+社区

领取腾讯云代金券