编译 | 陈明聪(中南大学湘雅三医院)
本文介绍克利夫兰诊所Feixiong Cheng教授团队发表在PLOS MEDICINE的工作:作者利用基于拓扑的K-means聚类方法对来自一般人口统计学、超声心动图、实验室测试和心脏因素的数据进行无偏倚、基于系统的患者-患者网络分析,开发了一种纵向的患者-患者网络聚类方法,用于癌症患者在抗癌治疗期间的心脏风险分层。通过整合所有患者-患者网络模型,开发一个在线风险计算器。其可视化了癌症治疗前、中、后患者心脏风险分层的决策边界,为识别新的心脏风险亚群和临床可操作的生物标志物提供巨大的希望,从而快速发展精确的心脏肿瘤学。
1
简介
越来越多的肿瘤患者面临癌症治疗相关心功能障碍(CTRCD)的风险,导致了一个新兴的心脏肿瘤学领域(又称为肿瘤心脏病学领域,指研究肿瘤患者可能出现的心脏病和心血管问题,特别是肿瘤药物治疗过程中可能出现的心脏毒性问题和病人的心血管护理)。然而,关于如何预测哪些患者将经历不利的心脏结果,知识有限。
作者使用了一种临床可操作的基于网络的方法(称为基于患者-患者相似网络的CVD或psnCVD风险评估),对患有CTRCD的癌症患者进行无偏倚、基于系统的心脏风险分层,使用了大规模、纵向、异质性的患者数据,包括人口统计学、超声心动图、实验室检测,心脏因素。开发了一种纵向的患者-患者网络聚类方法,用于癌症患者在抗癌治疗期间的心脏风险分层。
其证明了患者-患者网络聚类方法在临床上是直观的,允许以更快速度识别有较大心功能障碍风险的癌症幸存者。可视化了癌症治疗前、中、后患者心脏风险分层的决策边界,为识别新的心脏风险亚群和临床可操作的生物标志物提供巨大的希望,从而快速发展精确的心脏肿瘤学。
2
开发纵向的患者-患者网络聚类方法的过程
研究人群和临床变量的选择
本研究的患者人群是从1997年3月到2019年1月,所有在克利夫兰诊所行肿瘤专家治疗的成年癌症患者,根据心脏危险因素概况或心脏共病进行心脏病评估/检测。其中详细的临床特征见图1。
图1. 详细的临床特征的整个队列使用
整体研究设计过程
作者首先对数据进行预处理,其中包括异常值去除、z-score法特征缩放和缺失数据归并(图2A)。利用预处理后的患者-临床变量矩阵,采用余弦测度作为相似度度量,生成患者-患者相似度网络。然后,作者进行K-means聚类,根据余弦测度(seemmethods)将患者布局到不同的亚组。将临床特征相似的患者归为同一组,并通过特定的亚组进行可视化,形成最终的PPN。在构建和可视化患者网络后,使用2个临床结果,死亡率和CTRCD来评估基于网络的聚类性能。最后,作者进行了临床变量网络分析,以加强CTRCD对每个风险亚组的临床解释。整体研究设计见图2。
图2:整体研究设计。整个研究设计包括4个步骤:(A)数据预处理;(B) PPN构建及可视化;(C)使用心脏预后和生存分析进行临床验证;(D)临床变量解释。
3
结果
基于网络发现新的心脏风险亚群
使用psnCVD的框架(图2),我们确定了4个亚组(图3),它们在整个队列中具有最明显的生存率。总共显示了3131名患者。共15,698条边与余弦>0.62显示。使用Cytoscape v 3.7.1对网络进行可视化。其中红色梯度用于突出不同患者亚组之间的癌症治疗相关心功能障碍(CTRCD)结果,密集的红色饱和度意味着更丰富的CTRCD结果。用HRs(和95% CI)估计4个有新生癌症治疗相关心功能障碍和全因死亡率风险的亚组的影响,并使用waldχ 2检验评估具有统计学显著系数的亚组。
图3:患者-患者相似网络的发现。(A)由4个群(子群)着色的患者-患者网络;(B)新发CTRCD的累积风险(患者在癌症治疗后至少有一种类型的心脏事件诊断);(C)KM曲线估计4个亚组的所有生存概率;(D)有新生CTRCD风险和全因死亡风险的4个亚组的影响用HRs(和95% CI)估计,以及the Waldχ2test用于评估具有统计学显著系数的亚组。其中橙色亚组:C1,中间生存期和最高的新生CTRCD风险;蓝色亚组:最佳生存期和最低的新生CTRCD风险;绿色亚组:中度生存和中度复发CTRCD风险;紫色亚组:最差生存期和中度复发CTRCD风险。
纵向的患者-患者网络分析
作者对患者的发病率和死亡率进行了纵向的患者-患者网络分析(图4)。其中从新生的CTRCD和死亡率的分布来看,患有新生的CTRCD的癌症患者在多个时间点上呈橙色和绿色的亚组(图4)。而紫色和橙色亚组患者在癌症治疗开始后10年内的死亡率更低(图4),这与合并患者队列的生存分析一致(图3C)。从复发CTRCD的时间分布来看,与长期暴露(6 - 20年)相比,橙色亚组患者在癌症治疗开始0 - 1年和2 - 5年期间的复发CTRCD的百分比更高,提示急性心脏毒性。此外,我们发现癌症治疗开始2 - 5年后死亡率最低(图4),表明早期心脏护理在改善癌症患者生存的重要作用。
基于网络的临床可操作变量发现
作者进一步进行了临床变量网络分析,以确定可用于表征新生CTRCD结果和死亡率的生物标志物(图5)。其中临床变量分为4类:心脏、超声心动图、实验室检查和一般人口统计资料。一个关键的发现是心脏变量(包括肌钙蛋白-T和N端脑钠肽前体(NT-proBNP))在最高新生CTRCD风险亚组(橙色)与最低风险亚组(蓝色)有更强的连通性(图5)。肌钙蛋白-T和NT-proBNP是公认的心脏病风险评估的心脏生物标志物。与其他3个临床变量网络相比,肌钙蛋白T和NT-proBNP在最高新生CTRCD风险亚组(橙色)中具有更强的中间性和中心性。肌酐是另一个临床变量,与其他3个亚组相比,橙色亚组中肌酐具有很强的连通性和中心性(图5)。同时,橘色、绿色和紫色亚组肌酐与肌钙蛋白T和NT-proBNP高度相关(图5)。相反,在蓝色亚组肌酐与肌钙蛋白T或NTproBNP缺少关联。这些观察提示肌酐在CTRCD风险评估中的临床作用。
图4:纵向的患者-患者网络分析
患者-患者网络用聚类编号着色,用红到蓝的渐变热图表示网络中的新生CTRCD(左)和死亡率(右)分布。蓝色渐变的红色是用来强调新生CTRCD和死亡率的结果在不同患者亚组(即密集红色饱和度意味着更多的丰富成果的病人在这个领域网络,和更多的蓝色饱和度低密度的结果)在4个不同时间点。右边的条形图显示了癌症治疗开始后连续4个时间段内,4个亚组的重新CTRCD结果和死亡率的百分比(图3)。4个患者亚组的颜色键与图3一致。
图5:4个患者集群的临床可变网络。(A) 4个患者亚组的临床变量网络:橙色亚组:C1,中间生存期和最高的新生CTRCD风险;蓝色亚组:最佳生存期和最低的新生CTRCD风险;绿色亚组:中度生存和中度复发CTRCD风险;紫色亚组:最差生存期和中度复发CTRCD风险。PCC值的前15%用于每个网络的最终截止。在这一临界值下,所有集群的相关性最高值为0.008。节点大小表示连接程度(连通性)。边缘的大小表示临床变量网络中的PCC值。(B)每一亚组的新生CTRCD和死亡风险。
4
总体结论
这项研究中,作者提出了一种临床可操作的基于网络的方法(称为基于患者-患者相似网络的CVD或psnCVD风险评估),对患有CTRCD的癌症患者进行无偏倚、基于系统的心脏风险分层。其可视化了癌症治疗前、中、后患者心脏风险分层的决策边界。通过纵向(长达20年的随访患者数据)患者-患者网络分析,作者发现癌症患者在开始癌症治疗后5年内有较高的发病率和死亡率,提示急性心脏毒性。并且发现N端脑钠肽前体(NT-proBNP)和肌钙蛋白-T水平升高的癌症患者生存期较差。这说明肌钙蛋白水平或其他血清标志物的评估可以作为一种筛查试验,以确定哪些患者需要转诊到心脏肿瘤科,并从心血管风险预防策略中获益。在作为生物标志物用于临床之前,需要进一步的独立验证和临床试验。
同时作者也指出本研究的局限性:研究中使用ICD 9/10编码来定义癌症治疗前后的5种心血管事件。ICD 9/10编码的准确性可能会影响心血管结果验证过程中可能出现的假阳性结果。由于患者转诊模式、临床量和EMR数据库中住院阈值的差异,风险估计可能受到个体内部偏差的影响。
参考资料
Hou Y, Zhou Y, Hussain M, Budd GT, Tang WHW, Abraham J, Xu B, Shah C, Moudgil R, Popovic Z, Watson C, Cho L, Chung M, Kanj M, Kapadia S, Griffin B, Svensson L, Collier P, Cheng F. Cardiac risk stratification in cancer patients: A longitudinal patient-patient network analysis. PLoS Med. 2021 Aug 2;18(8):e1003736. doi: 10.1371/journal.pmed.1003736. PMID: 34339408; PMCID: PMC8366997.