导语
GUIDE ╲
免疫相关基因和lncRNA在神经母细胞瘤中的预后价值尚未阐明,特别是在有不同结果的亚组中。本研究旨在探讨免疫相关的预后特征。
背景介绍
用生物信息分析进行预后signature的筛选是大家常常看到的思路了,但结合免疫相关的基因和lncRNA,只用公共数据集也可以发到6分+!今天,小编就和大家一起来学习一篇神经母细胞瘤中预后signature筛选的研究,这篇文章于2021年发表在《Frontiers in Oncology》期刊上,影响因子6.244,题目为:Prognostic Signature of ImmuneGenes and Immune-RelatedLncRNAs in Neuroblastoma: A StudyBased on GEO and TARGET Datasets.
数据介绍
GEO:GSE49710(n=498),GSE16476,GSE85047
TARGET:TARGET- Asgharzadeh - 249
ImmPort:免疫相关基因列表
结果解析
01
基于随机森林的特征选择
对GSE49710数据集进行单因素Cox回归分析,鉴定出681个与OS时间相关的免疫相关预后基因,将其C-index的前20个预后免疫相关基因纳入后续的模型筛选。采用随机森林算法选择重要的免疫相关基因。以20个基因作为特征,得到平均下降精度(MDA)和平均下降Gini(MDG)。重复100次后,OOB值为16.99%。如图1A所示,对于纳入预后评分模型的5个基因,它们的importance值在前20个基因排名中排名前6名。
然后,通过多元Cox回归分析得到其系数,计算公式如下:
5个基因的单因素Cox回归分析结果如图1B、C所示,然后将免疫相关基因组合命名为预后模型RS5_G。
图1
02
RS5_G能够良好地预测神经母细胞瘤的结果
GSE49710数据集(训练队列)的患者根据RS5_G预后评分分为高风险或低风险评分组。如图2所示,高危组的OS时间和EFS时间明显低于低危组。
图2
此外,还通过ROC曲线分析来评估预后特征的分组能力。结果表明,年龄组、高风险、MYCN状态、vital状态、INSS_h1and进展的曲线下面积(AUC)值分别为0.794(0.752-0.836)、0.939(0.918-0.96)、0.929(0.907-0.952)、0.879(0.848-0.91)、0.829(0.792-0.865)和0.804(0.764-0.845)(图3A)。为了验证RS5_G(包括免疫基因)与临床特征之间的关系,作者计算了其相应的Spearman相关系数(SCC),如图3B所示。结果显示,RS5_G、CDK4、MAP2K2与不良预后因素呈正相关,而PIK3R1、THRA、ULBP2的表达结果相反。
图3
03
免疫相关预后lncRNA能良好预测神经母细胞瘤预后和预后分组
对RS_Lnc进行生存分析,结果显示,高评分患者的OS和EFS时间明显短于低评分患者。亚组分析结果显示,除MYCN扩增组外,所有亚组中高危患者的OS时间均显著缩短(图4)。
图4
使用ROC曲线分析来评估RS_Lnc鉴别不同预后组的表现。结果表明,年龄组、高风险组、MYCN状态、vital状态、INSS_h1和进展情况的AUC值分别为0.775(0.732-0.818)、0.907(0.879-0.934)、0.94(0.918-0.962)、0.874(0.84-0.909)、0.804(0.764-0.844)和0.766(0.722-0.811)(图5A)。为了确认RS_Lnc(包括免疫相关的lncRNA)与临床特征的相关性,作者计算了其相应的SCCs,如图5B所示。
图5
04
免疫相关的lncRNA主要富集于癌症和免疫相关的途径中
为了探讨免疫相关lncRNA在预后特征中的生物学功能,作者筛选了具有lncRNAs SCCs>0.5的基因,并利用STRING数据库获得蛋白质-蛋白质相互作用(PPI)网络。KEGG通路如图6所示。这些lncRNA主要富集于一些分子信号通路(如PI3K-AKT、Ras、MAPK和ErbB信号通路)和一些免疫相关通路(如T细胞受体信号通路和自然杀伤细胞介导的细胞毒性)。
图6
05
免疫浸润及与预后特征的相关性
作者分别分析了激活的树突状细胞(aDC)、T辅助细胞(Th2细胞)和CD8+T细胞,以及它们与预后特征RS5_G和RS_Lnc的相关性。选择这三种细胞类型是因为它们较高的xCell评分以及它们与肿瘤预后的关联。
如图7所示,aDC和CD8+T细胞与RS5_G和RS_Lnc呈负相关,而Th2细胞与上述两个预后特征呈正相关。这三种细胞类型在高风险评分组和低风险评分组之间存在显著差异。
图7
06
在独立数据集中的性能验证
对于 RS5_G 和 RS_Lnc 预后特征,高风险评分组的 OS 和无进展生存 (PFS) 时间显着短于 GSE16476 数据集的低风险组,如图 8 所示。
图8
亚组分析也得到了类似的结果(所有p值<为0.05)。这两种预后特征在区分不同的预后组方面具有令人满意的表现。通常情况下,年龄组、MYCN扩增、vital状态和INSS_h1的AUC值分别达到0.791(0.689-0.892)、0.844(0.756-0.932)、0.921(0.866-0.976)和0.852(0.771-0.932)。RS_Lnc的AUC值分别为0.789(0.686-0.892)、0.91(0.839-0.981)、0.918(0.861-0.975)和0.852(0.771-0.932)(图9A、B)。
图9
小编总结
该研究中构建的RS5_G和RS_Lnc signature在预测预后和将不同预后组分组方面表现良好。但也存在着一些问题,比如数据集来自不同的平台可能会导致结果有差异,其次一些lncRNA也不能在所有数据集中进行测试。对于构建预后signature,这篇文章提供了一个很清晰的思路,找到所需的基因集,确定模型进行筛选,值得大家学习借鉴!