原文作者:Eric J. Topol
器官损伤总是不易察觉,往往会因此错过最佳治疗时机。基于人工智能的新方法能持续监测病人的健康数据并及时预测即将发生的肾脏损伤。
在美国的医院中,急性肾功能损伤的发病率高达20%[1],包括异常血压和血容量等多种因素都会诱发这种十分普遍的病症。但目前医疗界却缺乏有效的手段来预测病人是否会发生以及何时会发生急性肾损伤。目前对于高危病人的临床处理手段是每天检测血液中的肌酸酐浓度,浓度过高就意味着肾功能出现了问题。
近日,来自DeepMind等多个机构的研究人员[2]提出了一种基于人工智能的新方法,能够有效预测病人即将发生的肾功能损伤。相较于传统方法,这种新方法可以提前一到两天检测出大部分病人的肾脏损伤的发生风险。由于肾脏损伤往往在最后阶段才被察觉,此时肾脏已经发生不可逆的损害,严重时将会留下需要暂时或长期透析的后遗症,甚至引起病人的死亡。对于肾脏损伤的早期检测方法将为有效的临床治疗赢得宝贵的时间。
深度学习作为近年来发展最快的人工智能方法,可以有效识别出数据中隐含的与特定结果相关的模式。在这一研究中,研究人员利用深度学习的方法来检测急性肾损伤。训练深度学习算法需要大量的数据,研究人员从美国退伍军人事务部(US Department of Veterans Affairs,为美国退伍军人及其家属提供服务)负责运营的172家医院和1062家门诊中,收集了超过70万例成年病例的数据(2011年-2015年)。这些经过匿名处理的数据为研究人员提供了人口统计信息、电子健康档案、化验结果、药物处方和过往治疗记录等数据。论文的第一作者Tomašev和同事们从数据中整理出了约60亿个数据点和60多万个记录特征,他们选择了一种被称为循环神经网络的深度学习方法来处理时序数据并对计算机进行训练,这种方法在深度学习领域被证明非常适合处理时序数据。
在训练完成后,研究人员利用事先分离出的独立数据集对算法的有效性进行了测试。基于测试数据,计算机将生成接下来48小时内连续的概率值来追踪每个病人随时间推移发生急性肾损伤的可能性。如果预测的概率值超过一定阈值,这个预测结果将被标记为阳性(如图一所示)。病人后续是否被检查出病情则会验证算法的预测精度。该模型同时还提供了预测概率值的不确定性,为医生提供了评估预测信号的强度指标。
图一:预测肾功能障碍的结果。图a表示Tomašev 团队提出的方法可以给出急性肾损伤的预警信号。研究人员利用人工智能中的深度学习方法来训练计算机从数据中检测与后续肾损伤相关的模式。研究人员利用这种算法来分析过往的医疗数据,包括电子健康档案和化验结果等等。计算机分析某个病人的历史数据后,将生成接下来48小时内的连续概率值,对应病人发生急性肾功能损伤的可能性。如果概率超过一定阈值,预测结果将被标记为阳性,并向医生发出警报(红点)。图b则表示检测病人肾功能的常规手段:每日监测血液中的肌酸酐。在此假设场景下,Tomašev团队的研究方法将提供比传统方法更早的预警信号,为医生和病人赢得了宝贵的治疗时间。
Tomašev 和同事们提出的新方法比其他基于统计或机器学习的方法更为精确地预测了即将要发生的肾损伤[3,4],而且对于医院内病人的预测精度最高——医院内病人发生急性肾损伤的比门诊诊所更为频繁,同时时间窗口也更为短暂。对于所有病人和所有类别的肾损伤,包括较为轻微的损伤,这一系统的平均预测精度达到了56%;而针对更为严重的肾损伤预测,对于后续30天和后续90天内需要透析的病人预测精度则分别达到了84%和90%。该模型在不同的医疗场所和不同时间周期内具有相似的预测精度。
此外,研究人员使用了消融性分析方法来鉴别与肾损伤发生风险相关的因素,结果发现有很多,这也许解释了为何过去让研究人员分析这种风险是一件棘手的事。
图一中的假设病例显示了研究人员所开发的新方法的重大应用潜力。如果利用传统方法检测,医生将在第四天才能获悉肾损伤的发生,而新方法则可以提前两天预测出来,为医务人员提供了更多宝贵的时间和更多干预治疗的手段,包括增加病人的液体摄取,或者避免使用可能造成肾毒性的药物。
然而这一系统也存在一定问题:生成一系列假阳性的预测结果,即误报一些没有发生的肾损伤。每个精确的预测会对应两个假阳性结果。假阳性绝大多数来源于患有慢性肾病的病人,疾病的症状会与急性肾损伤叠加,造成结果难以预测。
本研究的另一局限在于这是一项回顾性研究,利用回顾性研究构建的人工智能方法将在前瞻性研究中发生一定程度的退化[5],这可能是因为临床中的真实数据会比预先存在的经过清洗的"干净"数据要复杂得多。
前瞻性研究是检测预测系统的真实临床价值的根本所在,而预测成功与否不是唯一应加以评估的因素。要确定计算机生成的预警信号是否在临床中减少了急性肾损伤的发生率,一种方法是开展随机设计的临床试验,只将其中一半的预测传递给医生。此外,作者的模型也应该在其他的人群身上进行有效性测试。作者的研究只包含了不到7%的女性病例,那么模型对于不同性别的病人是否具有相同的预测精度,也值得在未来进行深入研究。
虽然这一研究包含了不同种类的数据,但还有其他数据源也值得纳入进来,例如病历上的手写内容,来自可穿戴传感器的连续生命监测信号,如心率等,这些都有可能提供有价值的相关信息。
对于非重症病人来说,常规监测方法是每天测量一次生命体征,但病人经常会突然出现病情急转直下的情况。Tomašev 和同事的研究对于这样的病人来说十分有用,可以在病人发生严重的器官衰竭之前发出预警,为病人赢得宝贵的救治时机。先前,很多临床背景下基于人工智能的预测性研究主要着重于研究疾病转归,包括死亡、再入院或住院时间等[6],而Tomašev 等人的研究结果则提供了独特的视角,为临床干预提供了有效的预测信号。
深度学习有望为医生提供针对任何器官状况的有力预警手段,它的广泛应用也许需要医疗界改变思维方式。但是从非经常的一次性测试转向系统性的连续监测,或将为医务人员提供更有效的手段来预测病人的病情变化。
参考文献:
1. Wang, H. E., Muntner, P., Chertow, G. M. & Warnock, D. G. Am. J. Nephrol. 35, 349–355 (2012).
2. Tomašev, N. et al. Nature572, 116–119 (2019).
3. Mohamadlou, H. et al. Can.J. Kidney Health 5, https://doi.org/10.1177/2054358118776326 (2018).
4. Pan, Z. et al. Preprint at https://arxiv.org/abs/1901.04364 (2019).
5. Keane, P. A. & Topol, E. J. NPJ Dig. Med. 1, 40 (2018).
6. Rajkomar, A. et al. NPJ Dig. Med. 1, 18 (2018).
原文以Deep learning detects impending organ injury in the clinic为标题
发布在2019年7月31日《自然》新闻上