《自然》杂志:人工智能诊断需严谨对待

人工智能诊断或预测疾病风险的能力正迅速提升,一些人工智能工具已经进入临床实践。最近几周,研究人员公布了通过扫描视网膜图像即可预测眼睛和心血管疾病风险的人工智能模型,并可通过分析乳房X光线照片来检测乳腺癌。

人工智能诊断具备改善医疗服务的交付和提高效率的潜力,它代表了多年来计算能力和深度学习背后的神经网络研究的提升。研究人员认为,当一种算法能够像病理学家和放射科医师那样有效地从这些图像中识别出特定的病症,那么该算法可以说是成功的。

但这并不意味着人工智能诊断已做好了临床的准备。有关人工智能诊断的许多研究很成功,令人欢欣鼓舞,可是科学的研究过程要求详细描述研究方法和所用材料,并在研究的过程中反复试验,最后还需进行大量的临床试验。人工智能诊断在这些方面还远远不够。许多业内人士抱怨说,开发人员并没有把研究工作做得足够深入。他们没有采用像药物开发那样在成熟领域建立得以证据为基础的试验方法。他们没有想药物开发那样使用基于实证的研究方法

例如,许多关于新的人工智能诊断工具的报告,只会在网站的预印本或声明中出现。这些报告没有经过行业的评审,也可能永远不会。而行业的评审会验证这些研究的关键细节,如:基础算法代码和分析、用于训练模型的图像、与之类比的医生、用于神经网络做决定的特征、诊断的警告等。

这些细节至关重要。例如,去年发表的一项调查发现,将每个X光照片的评估时间限定为1分钟时,利用人工智能模型检测乳腺癌的效果要好于11名病理学家。 然而,当不再限制时间时,病理学家比计算机发现了更多难以检测的病例。

还一些问题只有在实际应用时才会出现。例如,诊断算法可能会错将某些特定设备生成的图像与某些疾病联系起来。但这仅仅可能是因为该算法在训练过程中,使用该设备的医疗机构检测的此类病人比使用不同设备的另一家医疗机构更多。

这些问题是可以克服的。一种方法是,对于医生来说,在医疗机构里使用人工智能诊断工具后,医生需要追踪结果并报告,这样回溯性研究就会暴露出该工具的缺陷。更好的方法是,这些工具应该被严格地开发——在大量数据上进行训练测试,并在经过行业评审的受控研究中进行验证。这是一个缓慢而困难的过程,一部分的原因在于隐私问题使得研究人员很难获得所需的大量医疗数据。

《自然》杂志的一篇报道探讨了一个可行的方法:研究人员正在构建基于区块链的系统,以鼓励患者安全地分享信息。目前,人类的监督可能会防止人工智能诊断中出现的问题酿成关乎性命的大问题。因此,美国食品和药物管理局等监管机构允许医生进行低风险的技术试验。

但缺乏严谨的态度确实会带来直接的风险:炒作失败周期可能会阻止其他人投资类似的技术,这可能会更好。 有时候,在竞争激烈的领域,如人工智能,一个广为人知的研究成果足以阻止对手进入同一领域。

细致而谨慎的研究是一种更好的方法。需要可靠的数据和强大方法支撑的研究可能需要更长时间,并且不会产生尽可能多的令人满意的结果。 但只有这样才能将人工智能诊断的研究引向正轨,并可防止因失误造成的病人死亡,从而真正改善我们的生活。

-END-

回顾与展望专题

点击阅读

©以上文章来源

《自然》杂志

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180321B14JQE00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券