大家好,今天和大家分享的是2020年1月发表在“Frontiers in Genetics” (IF=3.258)上的一篇文章“An Integrated Model Based on a Six-Gene Signature Predicts Overall Survival in Patients With Hepatocellular Carcinoma”,作者借助GEO、ICGC等公共数据库,通过生物信息学的方法筛选出6个可用于预测肝细胞癌(HCC)患者OS的基因,并构建列线图对不同数据集的样本进行预测,验证筛选基因的预后价值。
An Integrated Model Based on a Six-Gene Signature Predicts Overall Survival in Patients With Hepatocellular Carcinoma
一种基于六个基因标志物的整合模型可预测肝细胞癌患者的总体生存率
肝细胞癌(HCC)是世界范围内最常见的恶性肿瘤,死亡率位居所有癌症中的第二名,肿瘤转移和术后复发导致了HCC患者的不良预后。如今,HCC患者的临床治疗效果已得到改善。然而,由于分子机制的复杂性,HCC患者的复发率和死亡率仍处于较高水平,因此迫切需要筛选生物标志物以显示其治疗效果,从而改善预后情况。 HCC患者的常规预后评估工具是临床病理分期。但是,HCC始终伴随着临床异质性,而临床异质性通常会影响常规预后评估的效果。为了为高危人群提供更多的临床治疗策略,迫切需要开发一种新的预后预测模型,作为对临床病理分期预测结果的补充。
图1A-C:依次为火山图、聚类树状图、相关系数
表1:每个module的基因数量
图1D:9个肝细胞癌相关模块中的模块成员
作者进行了差异基因表达分析(图2),并选择了61个关键基因用于进一步分析
图2:红点代表关键基因
图3展示了从TCGA的HCC数据集中的61个预后相关基因中提取稳定基因的整个过程。为了建立HCC的临床生存预后模型,作者使用TCGA作为训练数据集,并应用LASSO Cox回归分析从61个与生存相关的候选基因中识别出稳定的基因。表2显示了用于构建多元COX模型的参数,6个筛选得到的基因(SQSTM1,AHSA1,VNN2,SMG5,SRXN1和GLS)与高风险(HR> 1)有关。
图3:提取稳定基因的过程
表2:筛选得到的6个基因
图4:风险评分分布、生存情况和热图
应用Kaplan-Meier生存曲线对两组的OS进行比较,ROC曲线下面积(AUC)来评估基于6个基因的模型预测预后的能力,AUC越高意味着模型性能越好。作者发现TCGA数据集中的高风险和低风险组之间的OS有显着差异(P <0.0001)(图5A)。对应0.5、1、2、3 ,和5年生存率的AUC分别为0.759、0.761、0.708、0.681和0.692,这表明预测模型具有较高的敏感性和特异性(图5C)。相同方法的验证应用于ICGC数据集中(见图5B和图5D)
图5:KM曲线和ROC曲线分析
图6:单变量、多变量分析结果以及热图展示
作者探索了六种基因在不同TNM阶段、不同组织学等级、病毒性肝炎感染、不同BMI和年龄中的表达情况。事实证明,基于六种基因的风险评分是用于预测不同亚组的OS的潜在标志,具体预测情况如图7所示。
图7:不同亚组的OS预测情况
为了提出可预测HCC患者生存率的临床适用方法,作者开发了列线图来预测TCGA队列中1年,3年和5年OS的可能性。列线图的预测因素包括四个独立的预后因素(年龄,性别,病理分期和六种基因的特征)。随后,作者构建了将临床病理特征与六种基因相结合的列线图,以预测HCC患者的OS(图8A)通过校准曲线分析,作者发现由列线图预测的1年,3年和5年OS与实际的OS很接近,这证实了列线图的可靠性(图8B)
作者还通过ROC曲线评估整合列线图的预测精度,发现整合列线图的所有AUC均高于0.77,这表明与单一预后模型相比,综合因素构建的列线图是预测HCC患者短期和长期生存率的最佳方法。此外,作者还发现,整合模型对3年和5年的预测能力低于1年,这表明列线图的短期预测能力可能强于长期预测能力。
图8:预后列线图的构建和效果验证
小结
这篇文章中,作者通过单因素、多因素、LASSO Cox分析筛选出6种(SQSTM1, AHSA1, VNN2, SMG5, SRXN1, GLS)可作为预测HCC患者预后情况的基因,通过在不同的数据集中验证,证明基于六种基因的预后模型是预测HCC患者OS的可靠工具,而包含六种基因特征的列线图可以帮助在临床实践中开发个性化的HCC治疗方法。有待进一步研究的是如何在HCC的特定阶段合理应用各种基因标志物。
编辑:生滚粥
校审:糯米饭