前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >干湿结合7-mRNA预测模型轻松发5分+

干湿结合7-mRNA预测模型轻松发5分+

作者头像
百味科研芝士
发布2020-04-30 18:25:58
6000
发布2020-04-30 18:25:58
举报
文章被收录于专栏:百味科研芝士

大家好,这次给大家分享一篇2020年1月发表在Int. J. Biol. Sci.杂志上的文章,即时影响因子5.03。本文主要是研究与食管癌预后相关的7-mRNA,同样是一篇预测模型的文章,下面一起来看一下这篇文章!

标题:Prognostic values of a novel multi-mRNA signature for predicting relapse of cholangiocarcinoma

一种新的多mRNA标志物预测胆管癌复发的预后价值

术语

CCA:胆管癌 DEGs:差异表达基因 mRNA:由DNA的一条链作为模板转录而来的、携带遗传信息的能指导蛋白质合成的一类单链核糖核酸

摘要

背景:胆管癌(CCA)是一种上皮性肿瘤,具有较高的死亡率和复发率,目前的方法不能满足有效预测肿瘤复发的需要。因此,本文旨在进行一个多mRNA标记,以提高CCA复发的预测。

方法:利用GEO数据库(GSE76297、GSE32879、GSE26566、GSE31370和GSE45001)和癌症基因组图谱(TCGA)数据库分析CCA数据集中的mRNA表达谱。用LASSO回归模型建立了一个基于7-mRNA的信号,该信号与两个试验系列的无复发生存率(RFS)显著相关。根据7-mRNA特征, TCGA患者可分为高风险组和低风险组,RFS明显不同。同时,在仁济医院临床标本中证实了7-mRNA标记的预后价值。进一步分析包括多变量和亚组分析显示,7-mRNA信号对CCA患者的复发有独立的预后价值。

结论:综上所述,本文的研究结果为CCA患者的复发预测提供了一个有效的工具(7个mRNA),有助于CCA患者的个体化治疗。

结果

1. 从公开数据中鉴别胆管癌差异表达基因

5个CCA的GEO数据集如表1所示。使用GEO2R分析这些CCA数据集后,GSE76297-T/P、GSE26566-T/P、GSE45001-T/P、GSE32879-T/N、GSE26566-T/N、GSE31370-T/N中分别识别出4005、6554、990、3893、879和399 DEGs(图1A-F)。在每个Venn图中,2个或更多数据集中中共享的DEG被视为可信DEG,T/P组和T/N组分别识别2666和422个可信DEG(图1G-H)。在GEO和TCGA数据库之间进一步进行了重叠分析,确定了194个DEGs,这些DEGs被认为在CCA中普遍失调(图1I)。

对这些重叠的上调或下调基因进行GO和KEGG途径富集分析(图2A、B)。通过GO-BP和KEGG分析,上调基因在细胞器分裂和细胞周期通路中富集,下调基因在羟基化合物代谢过程和胆汁分泌通路中富集(图2C-D)。

图1

图2

2. TCGA样本构建7-mRNA的特征标记

对于194个候选DEGs根据ROC曲线确定最佳的截断点。根据每个mRNA截断值,将36例患者分为高表达状态和低表达状态。利用127个AUC≥0.55的mRNA构建LASSO-COX回归模型(图3A)。在平均交叉验证误差最小的λ值下,选择了7个非零系数的mRNA,包括CD36、GGCX、UBASH3B、DBN1、PTTG1、CCNA2和SPATS2(图3B)。根据这7个mRNA的表达情况,构建了RFS的风险评分公式:风险评分=(-0.96873×CD36表达状态)+-0.03944×GGCX表达状态)+(0.01064×UBASH3B表达状态)+(0.04955×DBN1表达状态)+(0.24927×PTTG1表达状态)+(0.31598×CCNA2表达状态)+(0.57201×SPATS2的表达式状态)。公式中,低表达状态等于0,高表达状态等于1。

相关链接:手把手带你画高大上的lasso回归模型图

图3

3. TCGA样本复发风险评分公式的评估

计算TCGA数据集中每个患者的复发风险得分。如图4A所示,当风险评分增加时,患者更容易复发。将患者分为高风险组(n=17)和低风险组(n=19),以最佳风险评分作为临界点。在整个研究期间,高风险组的复发率极大地增加,直到分析终点,高风险组中94.74%的患者出现CCA复发,而低风险组中只有0.58%的患者复发(图4B)。Kaplan-Meier分析显示,CCA患者的危险评分高,RFS明显低于危险评分低的患者(图4C)。此外,7-mRNA信号和RFS之间的ROC曲线显示,1年、3年、5年和>5年的AUC分别为0.973、0.976、0.982和0.983(图4D)。此外,与任何单一的mRNA或临床因素相比,7-mRNA-signature对复发有更好的预测价值(图4E-F)。

图4

4. Ren Ji数据集7-mRNA特征对无复发生存预测的验证

为了进一步验证这种7-mRNA分类器在不同CCA人群中是否具有相似的预测能力,这里将其应用于一个独立数据集。2012年1月至2017年12月,在仁济医院登记了44名临床病理资料和预后良好的CCA患者。通过qRT-PCR检测44例CCA肿瘤标本中7个mRNA的表达水平。然后,根据这7个mRNA的表达情况计算每个患者的风险评分。根据ROC曲线确定的最佳临界风险评分,将患者进一步分为高风险组(n=31)和低风险组(n=13)。如图5A-B所示,CCA切除术后风险评分较高的患者更容易复发。生存分析显示,高危组患者的RFS时间明显短于低危组(图5C)。7-mRNA与RFS的ROC曲线的AUC分别为1年1000、3年0.958、5年0.977和5年以上0.979(图5D)。此外,7-mRNA风险评分模型的AUC显著高于任何单个mRNA或临床因素(图5E-F)。

图5

5. TCGA和Ren Ji数据集中基于7-mRNA分类器的分层分析

在TCGA和Ren Ji数据集中具有不同临床变量的患者亚组中进一步进行了基于7-mRNA特征的生存分析(图6-7)。对于TCGA数据集,根据个体临床病理特征(包括性别、年龄、CA19-9水平、肿瘤大小、病理分期和AJCC分期)分层后,该特征仍然是预测CCA患者复发的临床和统计学意义显著的适用模型(图6)。同样,7-mRNA信号是一个实用的预测因子,它独立于Renji数据集中的一些临床病理特征,如年龄、肿瘤血栓和AJCC分期(图7)。

图6

图7

结语

本文研究重点是食管癌预后相关的mRNA,像很多文章一样,都是先从筛选差异表达基因入手的,紧接着就是一系列模型构建与验证的研究方法。我们也可以利用本文的套路去研究lncRNA、自噬相关基因、转移相关基因、DNA甲基化等等。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-04-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 百味科研芝士 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档