2月23日,由张康教授领导的广州妇女儿童医疗中心和加州大学圣迭戈分校团队,在顶级期刊《细胞》上发表了一篇AI(人工智能)在医疗领域应用的重磅研究成果:通过基于图像的深度学习让AI系统对疾病进行诊断与治疗。该系统在诊断眼病和肺炎两大类疾病方面,准确性已经能匹敌顶尖医生。其最具突破性的成果在于,借助“迁移学习”,帮助AI系统摆脱了对高质量注释图大型数据库的依赖,大幅提高了AI系统在临床应用中的实用性。
这不仅是中国研究团队首次在顶级生物医学杂志发表有关医学人工智能的研究成果;也是世界范围内首次在AI影像诊断系统中使用“迁移学习”并取得高度精确的诊断结果,达到匹敌甚至超越人类医生的准确性。
《细胞》以封面文章的形式刊登了来自中国的这项AI研究
论文首页
原有技术受限于对大型数据库的依赖
深度学习是AI的热门研究领域,我们所熟知的AlphaGo以及自动驾驶这些重量级应用,都是基于深度学习技术开发的。AI在医疗领域的应用更是十分令人期待。由于高质量的医疗资源极为稀缺,无论偏远地区还是大城市,都有大量的患者得不到及时的诊治,因此,科学家非常希望AI可以对疾病诊疗,甚至医疗科研与教学带来革命性的变革。
AI影像诊断可以说早已有之,2016年,Google的Gulshan团队采用近13万张已由54位美国专家标注过的视网膜眼底图像,对深度学习网络进行训练,检测准确率达到曲线下面积91%,能力与人类专家相当。2017年,斯坦福大学工程学院和医学院合作团队在谷歌用于识别猫和狗算法的基础上,经过13万张皮肤病变的图像训练后,开发出可用于识别皮肤癌的AI系统。在与皮肤科医生的较量中,AI系统的准确率达到69.4%,而人类专家的准确率在66%左右。在本次张教授团队的研究中,他们用10万张准确标注的视网膜OCT图像训练出的AI系统,在诊断眼疾时的准确性达到96.6%,灵敏性达到97.8%,特异性达到97.4%,ROC曲线下面积达到99.9%。
我们可以看到,AI在医学领域的探索已经取得了相当不错的成绩。但实际上,最终应用到临床却很少。其中的主要原因在于,人工智能系统在复杂的临床应用中,不能准确收集到高质量可应用的数据(即有效数据),需要依赖高质量注释图的大型数据库。正如前面Google和斯坦福大学,以及张康教授团队的研究所呈现的那样,训练出一个准确的AI疾病诊断系统需要数十万张高质量标注的图像。可世界上有那么多种疾病,给每种疾病都收集数十万张高质量的标注图像几乎是不可能实现的。这个问题不解决,现阶段AI在医疗领域的应用就很难全面展开。
“迁移学习”使AI系统学会举一反三
张康教授团队这个重磅研究,就很好的解决了这个问题。可以说,张教授团队就是在致力于实现用一个AI系统诊断多种疾病。“相比于传统的深度学习模型,我们使用的迁移学习模型所需的数据量极少,一般深度学习需要上百万的高质量的同一类型标注图片才能获得较为稳定和精确的输出结果,而我们的方法只需要几千张。”张康教授表示,“并且我们构建的诊断平台在诊断常见的致盲性视网膜疾病上,能够获得与人类眼科专家相似甚至更好的诊断结果。”
项目负责人张康教授
“迁移学习”(Transfer Learning),顾名思义就是就是把已训练好的模型参数迁移到新的模型来帮助新模型训练,也就是运用已有的知识来学习新的知识,找到已有知识和新知识之间的相似性,用成语来说就是“举一反三”。
比如,已经学会下围棋,就可以类比着来学习象棋;会打篮球,就可以类比着来学习排球;已经会中文,就可以类比着来学习英语、日语等等。如何合理的寻找不同模型之间的共性,进而利用这个桥梁来帮助学习新知识,就是“迁移学习”的核心。迁移学习被认为是一种高效的技术,尤其是面临相对有限的训练数据时。
相较于其他大多数学习模型的“从零开始”,迁移学习先利用卷积神经网络学习已有的已经标记好的预训练网络系统。以医学图像学习为例,该系统会识别预系统中图像的特点,研究人员再继续导入含有第一层图像相似参数和结构的网络系统,最终构建出终极层级。
在张教授团队开发的AI系统中,第一层网络就是视网膜OCT图像,第二级网络系统使用第一级的图像寻找相应的特点,通过前向传播固定低层图像中的权重,找到已经学习的可辨别的结构,再利用反向传播的方法提取更高层的权重,在其中进行反复的自我调整和反馈、传递,达到学习区分特定类型的图像的目的。这个模型可以使用极少的训练图像,更快、更高效的辨认图像的特定结构。
为了验证这个AI系统在迁移学习的帮助下能应用于视网膜疾病之外的其他疾病,在本研究中,张教授团队在10万张准确标注的视网膜OCT图像训练出来诊断眼疾的AI系统基础上,只用了5000张胸部X线图像,然后利用迁移学习,就构建出肺炎的AI疾病图像诊断系统。
这套AI系统在区分肺炎和健康状态时,准确性达到92.8%,灵敏性达到93.2%,特异性达到90.1%,ROC曲线下面积达到96.8%;更牛的是,它区分细菌性肺炎和病毒性肺炎的数据也是相当漂亮,准确性达到90.7%,灵敏性达到88.6%,特异性达到90.9%,ROC曲线下面积达到94%。
张康教授说,目前他们的AI系统已经在美国和拉丁美洲眼科诊所进行小规模临床试用,取得经验后再进行大规模推广。此外,在后续的研究中,他们还会进一步增加准确标注的图片数量,同时增加可诊断的疾病种类,并进一步优化系统等。
他们希望在不久的将来,这项技术将能应用到包括初级保健、社区医疗、家庭医生、专科医院等等,形成大范围的自动化分诊系统,为医生提供一种辅助诊断的方法,并可用于监测和维护人类健康,从而提高人类生活质量。
内容整理自:奇点网
领取专属 10元无门槛券
私享最新 技术干货