13 次查看
近年来,医疗保健中人工智能的期望水平达到了高潮,一些试点项目取得了积极的早期成果。这些项目中的大多数涉及AI系统正在训练医学数据的样本数据集,例如X射线或其他医学图像,之后系统能够提供各种条件的早期检测。
许多这些系统面临的挑战是,他们通常接受来自单一医疗保健提供商的数据培训,并使用共同的健康IT系统。队最近的 一项研究 强调地点,当面对来自不同卫生系统的数据时,这种人工智能技术的表现通常比医生差得多。
这项由西奈山伊坎医学院进行的研究使用卷积神经网络(细胞神经网络)来分析一组胸部X射线图像,目的是诊断肺炎。该系统在三个医院系统中运行,试图模拟肺炎筛查。
不幸的是,在所进行的五次比较中,有三次,CNN在自己网络之外的医院进行的X射线表现不如原始网络的X射线。研究人员认为,这很大程度上是因为深度学习模型利用了太多的参数,这反过来又很难确定推动其预测的特定变量。这使得很难在多个系统中返回一致的性能。
研究人员表示,“我们的研究结果应该暂停那些考虑快速部署人工智能平台而不严格评估他们在现实临床环境中反映他们所处部署地点的表现的人。”
因此,作者建议CNN系统针对特定的临床问题进行定制,并在比现在更常见的现实场景中进行测试。如果不发生这种情况,那么它们在测试场景中的表现很可能会显着超过其潜在的实际性能。
该团队认为,在这些系统在野外被切断之前,他们需要能够准确有效地在各种医院系统中进行推广。如果他们不能,那么准确度水平可能远低于要求。这一发现强调了在产生如此多的炒作和期望的AI系统被削减之前仍然需要的工作。