诊断皮肤癌,人工智能比医生更出色

一项由多国科学家联合完成的研究表明,基于卷积神经网络的人工智能在诊断皮肤癌方面已达到比人类医生更出色的水准。

研究人员首次证明一种被称之为深度学习卷积神经网络(Convolutional Neural Network,CNN)的人工智能/机器学习技术在诊断皮肤癌方面比经验丰富的皮肤科医生表现更加出色。

在知名癌症领域期刊《肿瘤学年鉴》(Annals of Oncology)上发表的一项研究中,德国、美国和法国的研究人员通过向CNN展示超过10万张恶性黑色素瘤(一种最致命的皮肤癌)和良性葡萄胎(或痣)的影像,对其进行皮肤癌辨识训练。他们将CNN的表现与58位国际皮肤科医生的表现进行了比较,发现与皮肤科医生相比,CNN漏掉的黑色素瘤更少且将良性葡萄胎误诊为恶性的频率更低。

CNN是一种人造神经网络,受到大脑中的神经细胞(神经元)互相连接并对眼睛所见事物产生反应时作用的生物进程启发。CNN能够通过它“看到”的图像快速学习,并教会自己通过学到的内容改善自己的表现(称之为机器学习的过程)。

该研究第一作者、德国海德堡大学(University of Heidelberg)皮肤病学系高级主治医生霍尔格·亨斯尔(Holger Haenssle)教授解释道:“CNN像小孩子的大脑一样工作。为了训练它,我们向CNN展示了超过10万张恶性/良性皮肤癌和葡萄胎影像,并指明每张影像的诊断结果。我们只使用皮肤镜影像,即放大10倍的病变影像,这让CNN提高了其区分良性和恶性病变的能力。完成训练后,我们通过海德堡资料库创建了两组测试影像,这些图像从未用于训练,因而对于CNN来说是未知的。每组共有300张影像,专为测试CNN的表现而构建。在这样做之前,我们选择了100个最难的病灶用于测试真人皮肤科医生,以便与CNN的结果进行对比。”

该研究邀请了来自17个国家/地区的58位皮肤科医生参与,其中有17人(29%)表示他们在皮肤镜检查方面的经验不足两年;11人(19%)表示他们较为熟练,拥有两年到五年的经验;30人(52%)为专家级别,拥有超过五年的经验。

皮肤科医生被要求首先仅根据皮肤镜检查影像(I级)对恶性黑色素瘤或良性葡萄胎做出诊断,并决定如何管理病情(手术、短期随访或无需采取措施)。然后,他们会在四周后获得关于患者的临床信息(包括年龄、性别和病变部位)以及之前100个病例的特写影像(II级),并被再次要求做出诊断和管理决策。

在I级,皮肤科医生对黑色素瘤的平均检测准确率为86.6%,且对非恶性病变的平均正确辨识率为71.3%。但是,当CNN经过调整达到与医生相同的良性葡萄胎正确辨识水平(71.3%)时,CNN检测出了95%的黑色素瘤。在II级,皮肤科医生的表现得到改善,准确地诊断出88.9%的恶性黑色素瘤和75.7%的非癌症病变。

“CNN漏掉的黑色素瘤更少,这意味着它比皮肤科医生的敏感度更高,并且其将良性葡萄胎误诊为恶性黑色素瘤的次数更少,这意味着它拥有更高的特异性;这将减少不必要的手术,”亨斯尔教授说道。“当皮肤科医生在II级收到更多临床信息和影像时,他们的诊断表现得到改善。但是,CNN仍然仅依靠皮肤镜影像进行工作,没有额外的临床信息,却继续展现了优于医生的诊断能力。”专家级皮肤科医生在I级的表现比经验较少的皮肤科医生的表现更好,并且能够更好地检测出恶性黑色素瘤。但是,他们在两个级别做出正确诊断的平均能力仍然低于CNN。“这些研究结果表明,深度学习卷积神经网络在检测黑色素瘤这项任务中能够比皮肤科医生表现更加出色,包括接受过各种培训的专家,”他说道。

恶性黑色素瘤的发病率正在增加,估计全球每年会有232,000个新病例和约55,500个死亡病例。如果能够及早发现,黑色素瘤可以治愈,但许多病例在癌症病程更加严重且更难治疗时才能被诊断出来。

亨斯尔教授说道:“近20年来,我参与了旨在于黑色素瘤的可治愈阶段及早检测出黑色素瘤的研究项目。我的团队和我将重点放在可帮助医生避免漏掉黑色素瘤的非侵入性技术上,例如,在进行皮肤癌筛查时。当我看到最近关于深度学习算法在特定任务中胜过人类专家的报告时,我立即意识到,我们必须探索如何将这些人工智能算法用于诊断黑色素瘤。”

研究人员并未设想CNN将从皮肤科医生手中接管皮肤癌的诊断,但它可以用作额外的辅助手段。“此CNN可为参与皮肤癌筛查的医生服务,以帮助他们决定是否对病变进行活检。大多数皮肤科医师已在使用数字皮肤镜系统拍摄和存储病变影像,以进行存档和跟进。CNN随后可轻松、快速地评估存储的影像并提供有关黑色素瘤概率的“专家意见”。我们目前正在计划进行前瞻性研究,以评估CNN对医生和患者的实际影响。”

这项研究存在一些局限性,其中包括皮肤科医生处于人造环境中且他们知道自己不是在做出“生死决定”这一事实;测试集不包括所有皮肤病变;来自非白种人皮肤类型和遗传背景的经过验证的影像较少;以及医生可能不会总是遵循其不信任的CNN的建议这一事实。

在相关编辑评论中,维多利亚·马尔(Victoria Mar)博士(澳大利亚墨尔本莫纳什大学[Monash University])和H.彼得·索耶(H. Peter Soyer)教授(澳大利亚布里斯班昆士兰大学[University of Queensland])写道:“目前,黑色素瘤的诊断准确率取决于主治医生的经验和接受的培训.....亨斯尔等人已展示,使用卷积神经网络的计算机算法表现优于接受测试的58位皮肤科医生中的大多数人.....这表明人工智能(AI)有望实现更加标准化的诊断准确率水平,这样一来,所有人都能够获得可靠的诊断评估,而无论他们住在哪里,或者他们看的是哪个医生。”他们强调了在人工智能可能成为临床标准前需要解决的几个问题,其中包括难以对手指、脚趾和头皮等部位的一些黑色素瘤进行成像,以及如何充分训练人工智能以辨识非典型黑色素瘤和患者未意识到的黑色素瘤。

研究人员得出结论:“目前,没有全面临床检查的替代选择。但是,二维和三维人体摄影能够捕获约90%至95%的皮肤表面,考虑到成像技术的指数级发展,我们预计自动化诊断迟早会改变皮肤病学的诊断模式。然而,要将这项令人兴奋的技术安全地应用于常规临床护理,我们还有很多工作要做。”

原文发布于微信公众号 - 人工智能快报(AI_News)

原文发表时间:2018-06-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏JasonhavenDai

论文相关知识1.核心期刊2. A、B、C类3.相关概念4.阅读方法5.参考阅读

1.核心期刊 CCL,全国计算语言学学术会议 ACL,国际计算语言年会 NIPS,神经信息处理系统进展大会 SCI SCI即《科学引文索引》(Science ...

37050
来自专栏机器人网

机器人真空夹具改用人造肌肉?

据外媒报道,在工厂中使用的机器人通常配备真空夹具,用于夹住平面物体。通常,这些夹具由压缩空气提供动力,但这具有一些缺点。然而,现在科学家已经开发出一种使用人造肌...

26160
来自专栏灯塔大数据

分析 |《狄仁杰之四大天王》影评分析(爬虫+词云+热力图)

作为徐老怪的忠实影迷,《狄仁杰之四大天王》肯定是要去看的,看豆瓣评分和前两部相差不多,但其实作者本人并不是很喜欢前两部,所以在犹豫要不要去看,于是简单去分析了一...

12820
来自专栏思影科技

AJP:青少年饮酒后大脑发育轨迹发生改变

薛老师和他的猫推荐你关注思影科技 来自美国加州SRI国际健康科学中心、斯坦福大学等机构的研究人员联合在The American journal of psych...

32090
来自专栏思影科技

AJP事件相关电位研究:精神分裂症患者听觉感觉处理缺陷的临床和认知意义

来自塞拉利昂精神疾病研究、教育和临床中心,旧金山VA医疗保健系统,加州大学旧金山分校精神病学系和加州大学洛杉矶分校的心理学系以及精神病学系、生物行为科学系的研究...

35960
来自专栏新智元

邓侃解读:医疗关键数据时间序列敏感度分析的通用方法

---- 新智元专栏 作者:邓侃 【新智元导读】密歇根州立大学、康奈尔大学腾讯研究院的几位学者,联名发表了一篇题为 “Identify Suscept...

40260
来自专栏镁客网

南工大团队研制的可重复使用纸墨组合,刷新现有印刷模式的同时降低了成本 | 黑科技

18260
来自专栏应兆康的专栏

机器学习实战——训练你的 Flappy Pikachu

皮卡丘又回来啦,由于上一周有些事情要处理,就没有写文章,真的很对不起大家。不过这次笔者给大家带来了一个非常好玩的东西,看标题——机器学习实战——训练你的Flap...

18840
来自专栏BestSDK

如何用深度学习来识别恶意软件

这是一个悲伤的故事,你可能经历过。 你又热又渴,看到桌子上有一瓶看起来像水的东西,来不及思考,揭开瓶盖喝了一大口。哦!漏!是油! 时间回到10秒前,我们重来一次...

34690
来自专栏思影科技

脑电研究:睡眠中的婴儿大脑预测发育情况

传统观点认为九个月大之后的婴儿才能建立真正词汇的语义长程记忆,之前都处在呀呀学语的原词状态。来自德国柏林洪堡大学的学者Manuela Friedrich等人探索...

27440

扫码关注云+社区

领取腾讯云代金券