前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >灵活选择基因集,你也能发6分+!

灵活选择基因集,你也能发6分+!

作者头像
作图丫
发布2022-03-29 09:45:14
4160
发布2022-03-29 09:45:14
举报
文章被收录于专栏:作图丫

导语

GUIDE ╲

范可尼贫血(FA)通路是一种典型的、多酶调节的DNA损伤修复剂,它影响着包括癌症在内的疾病的发生和发展。关于FA相关基因(FARGs)的作用及其在癌症中的预后价值的综合分析报道很少

背景介绍

相信大家已经了解很多基因集结合癌症免疫和预后的研究了,我们常见的也是这两年比较热门的m6A、铁死亡等等相关的基因集,但是我们可以研究的远不止这些,今天小编给大家介绍的文章题目为:Fanconi Anemia Pathway GenesAdvance Cervical Cancer via ImmuneRegulation and Cell Adhesion.作者从FA 相关基因出发,首先进行泛癌分析,发现在HPV相关的癌症中起到作用,于是构建预后风险模型,最后进行了免疫相关和预后相关的分析。

数据介绍

GSCA:癌症数据及其临床特征信息

TCGA:宫颈癌鳞状细胞癌(CESC)和其他癌症的详细数据

GEO:GSE3791和GSE63514,对CESC OS和RFS的预后生存分析

结果解析

01

FA相关基因表达的改变及泛癌分析

流程图见图1A,使用GSCALite平台进行可视化显示,基因表现出不同的表达模式(图1B)。根据分子差异表达频率(图1C),将基因分为三组:“极显著(esFARGs)”、“一般显著(gsFARGs)”和“不显著(nsFARGs))。对于esFARGs(图1F),生存分析显示,大多数高表达水平与ACC、LGG、KIRC、KICH、KIRP、MESO和SKCM的生存预后差相关,与THYM、READ和CESC的生存预后好相关(图1D)。CNV分析显示,BRCA2(29%)和BRCA1(17%)是突变最频繁的两个基因,错义突变的发生程度最高(图1E)。此外,person相关性表明,在癌症中,大多数FARG的表达水平经常与CNV显著相关,特别是在LUSC、CESC、UCS、BRCA和OV中(图1G)。

利用GSCALite平台对FARG的甲基化水平和其他表观遗传信息进行了分析和可视化,如图1H所示。甲基化水平和基因表达之间表现出普遍的负相关(图1I)。GSVA分析指出esFARGs可以激活细胞周期和细胞凋亡,抑制RAS/MAPK信号通路和激素ER(图1J)。

图1

02

基于宫颈癌中FARG表达的预测评分及预后模型的建立

作者研究了HPV+和HPV患者之间表达模式的显著差异,鉴定了超过7000个差异表达基因(DEGs);79个FARGs中有41个涉及(图2A,B)。GSVA结果表明,差异基因主要集中在各种“异常”过程,说明对维持正常的生理状态有不可或缺的作用(图2C)。接下来,进行LASSO Cox回归分析,选择8个os相关基因和5个RFS相关基因,建立一个名为FPS的风险评分(图2D、G)。

根据FPS中位数将患者分为高低FPS组时,CC OS(p<0.001)和RFS(p<0.001)生存图呈现不同的趋势,5年AUC接近0.8(图2E、F;图2H、I)。采用单因素和多因素Cox回归分析,评估上述因素是否为临床病理特征的独立预后因素。对于OS,单因素Cox回归分析的FPS为4.840(图2J),而多因素Cox回归分析的FPS为8.728(图2L)。RFS相关分析的结果也表明,FPS确实是唯一稳健的CC预测因子(图2K,M)。

图2

03

预后风险评分的亚组识别和宫颈癌相关免疫预后风险评分的发展

与低FPS组相比,RFS组共有404个上调基因和236个下调基因,RFS组分别有745个上调基因和583个下调基因(图3A)。功能富集分析结果表明,显著富集在免疫相关的生物过程(图3B、C)。当将这些DEGs与从Immport数据库中获得的免疫相关基因进行比较时,发现有258个RS和RFS模式的基因(图3D)。

采用Cibersort方法评估CC患者免疫浸润丰度的差异(图3E)。CC病例的比较显示,CD8 T细胞、静止CD4记忆T细胞、调节性T细胞、静止树突状细胞、静止树突状细胞和活化肥大细胞有显著差异(图3F)。Kaplan-Meier生存分析显示,Tregs浸润与更好的OS结果(图3G)关联。

为了进一步探讨FARGs与免疫过程之间的潜在关联,作者选择了与FARGs和CC预后相关的关键免疫相关基因进行评估(图3D)。基于单因素Cox分析,共鉴定出50个免疫相关基因进行OS模型拟合。接下来,lasso Cox回归分析确定了核心免疫元素作为免疫特征,用于计算风险评分。根据免疫特征,通过系数和基因表达量计算IPS,然后根据IPS中位数将CC样本分为两个不同的风险组。两组患者的OS有不同的变化趋势,2年和5年的AUC均大于0.8(图3H、I),图3J显示IPS与T细胞、B细胞、M2巨噬细胞、NK细胞的丰度呈显著负相关。

这些数据表明,FARGs与免疫基因相关,IPS可作为OS和RFS CC预后预测的可靠信号。

图3

04

宫颈癌FA相关基因一致性聚类

为了确定FARG的潜在功能,进行了一致性聚类分析,以区分FARG的表达模式,并将CC患者分为三个亚组。通过主成分分析(图4A)和t-SNE(图4B)分析进行聚类测试,患者分组良好。

基于亚组的 Kaplan-Meier 生存分析表明,cluster1 具有最短的 OS 趋势(图4C)。为了进一步评估三个cluster的功能,在cluster之间筛选了DEG,总共确定了 90 个共享的 DEG(图4D)。随后,基于这些共有的DEG进行功能富集分析,并富集到细胞粘附相关的生物过程和信号通路(图4E)。cluster之间存在显着差异:cluster1 的 Facscore 最高,cluster2 的得分最低(图4F)。根据Facscore的中位数,将CC患者分为Facscore高低两组,然后进行Kaplan-Meier生存分析。结果表明,Facscore 高的患者与 OS(图4G)和 RFS的不良预后相关。

为了区分更强大的预后预测因子,构建了lasso Cox回归模型,确定了17个OS预测的关键因素和6个RFS预测的关键因素(图4H)。在随后的分析中,发现基于上述变量计算的粘附相关预后风险评分(APS)也可以被认为是CC OS预测的基本特征(p<0.001),2-和5年AUC大于0.8(图4I,J)。这些结果表明,细胞粘附相关调控因子在CC中具有重要的预后价值。为了进一步探索FARGs与APS之间的相关性,作者开发了一个基于mRNA表达的网络(图4K)。

图4

05

建立基于FA相关基因调控因子、免疫特征和细胞粘附指标的宫颈癌综合预后模型

根据lasso Cox分析,通过35个候选基因中的21个计算出综合预测评分(CPS),可以将样本分为高、低风险,2年、3年、5年的AUC均大于0.8(图5A-C)。为了评估CC患者的生存概率,作者建立了一个基于年龄、吸烟状态、流产、妊娠、HPV状态、分级和分期等预后预测因素的列线图预后预测模型(图5D)。校准曲线显示了精度(图5E)。当比较FPS、IPS、APS和CPS时,可以明显看出CPSC指数(图5F)、决策曲线效益(图5G)、2、3、5年生存预测的AUC显著高于其他指标。结果表明,单因素Cox回归分析的CPS为2.753(图5G),而多因素Cox回归分析的CPS为2.370(图5H)。PTO是CC中OS的另一个重要因素。

图5

06

基于机器学习模型的预测宫颈癌预后的基因特征

为了验证预测模型,基于FARGs开发了机器学习模型。随机选取70%的样本作为训练集,其余样本为验证集,在模型训练过程中采用5倍交叉验证方法。

OS预测决策树(DT)结果显示,ZBTB32、SLX1A、CENPS、TOP3A和EME1是所有因素中排名前5位的变量(图6A)。ZBTB32、CENPX、CENPS、FAAP100、TELO2采用随机森林选择(图6B)进行选择。采用朴素bayes(NB)模型识别ZBTB32、CENPS、RAD50、RPA2和RFC4(图6C),采用OS预测的支持向量机模型(SVM)识别ZBTB32、CENPS、RAD50、PMS2和HUS1。ROC曲线显示,RF模型的精度最高(Figure6D)。对于RFS预测结果,RF模型的精度最高,为0.918,其次是SVM模型,为0.914(图6E)。

这些算法之间的overlap以及 LASSO Cox 回归模型、ZBTB32 和 CENPS 是指示重要预测值的相同元素(图6F)。PALB2 是 CC 中唯一与 RFS 相关的共享 FARG(图6G)。当生存分析使用两个选定的signature,发现CC患者高表达ZBTB32和CENPS有更明显的倾向于更长的OS时间(图6H)。RFS结果显示,PALB2和BRCA2高表达的患者更有可能有不良的结果,但两者都低表达的组并没有最好的结果(图6I)。

图6

06

宫颈癌关键特征的进一步分析

作者在RNA水平上检测了4个关键FARGs的表达,并在蛋白水平上评估了其相互作用。GSE6791的Boxplot显示,CC患者中PALB2、CENPS、BRCA2表达上调,而ZBTB32表达下调(图7A)。随后,对这四种调控因子进行蛋白相互作用(PPI)网络,观察到存在大量的FARGs和与每个节点的连接,但除BRCA2和PALB2外,四种调控因子之间没有直接连接(图7B)。作者研究了除FA相关网络外的其他大型免疫相关网络(图7C)。

ZBTB32可能主要通过影响免疫相关调节过程,而不是仅仅通过影响FA通路来保护CC患者免受不良结局。此外,ZBTB32在CC期间的表达有显著差异(图7D),提示早期临床筛选作为生物标志物的价值。不幸的是,其他三个都不合适。qPCR结果强调了CC中4个signature的差异(图7E)。

最后,进行了药物敏感性分析, 如图 7F 所示,CENPS的高表达与对白屈菜红碱 、异环磷酰胺和PX-316相关,而 ZBTB32 的高表达与 hydrastinine HCl 和高三尖杉酯碱抗性有关。

图7

小编总结

本文作者选择了合适的基因集进行分析,确定了FA相关基因在宫颈癌中的作用,方法上利用多种建模方式,反复对结果进行检验,值得大家参考哦!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-01-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作图丫 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档