前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >免疫相关基因预后模型构建,这个套路不香吗?

免疫相关基因预后模型构建,这个套路不香吗?

作者头像
用户6317549
发布2020-07-22 10:54:53
3.4K0
发布2020-07-22 10:54:53
举报
文章被收录于专栏:科研猫科研猫

作者:科研猫 | 石榴籽

责编:科研猫 | 依米

大家好,今天向大家分享的是2020年4月发表在Frontiers in Genetics (IF=3.517) 杂志上的一篇文献《Novel Immune-Related Gene Signature for Risk Stratification and Prognosis of Survival in Lower-Grade Glioma》。文章基于TCGA数据库和CGGA数据库中的脑胶质瘤相关数据,利用单因素、多因素Cox回归分析及Lasso算法构建了六个免疫相关基因签名(gene signature,或者叫标记基因),并建立了预后诺模图,可有效地进行风险分层和预测原发性LGG的整体生存。

研究背景

免疫微环境已被确定在肿瘤生物学中起着至关重要的作用,近来,许多有希望的临床前和临床免疫治疗方法,包括免疫检查点抑制剂,主动或被动免疫治疗以及基因治疗,都得到了应用。因此,肿瘤微环境中免疫成分的分子谱在用作预后生物标志物方面具有巨大价值。低级神经胶质瘤(LGG)构成中枢神经系统的普遍原发性恶性肿瘤,从生物学行为上表现出极大的内在异质性。尽管人们为改善临床结果付出了巨大的努力,但随着时间的流逝,仍有超过一半的LGG病例演变为耐治疗的高度侵袭性胶质瘤。因此,必须确定LGG的新的预后因素。

数据下载

1) 从TCGA数据库获取低级神经胶质瘤患者的RNA-seq数据,临床信息数据

2) 从GTEx数据库收集低级神经胶质瘤患者正常组织中的RNA-seq数据

3) 从ImmPort数据库获取免疫相关基因(IRGs)的完整列表

4) 从CGGA数据库获取低级神经胶质瘤患者的RNA-seq数据,临床信息数据

结果概述

1

胶质瘤数据集的准备

本研究中总共916名符合纳入标准的患者,包括来自TCGA数据库的432例原发性LGG患者,来自CGGA数据库的353例原发性LGG患者和来自CGGA数据库的131例复发性LGG患者。来自这两个数据库的患者的临床病理特征如表1。

2

差异表达及免疫相关基因鉴定

与非肿瘤组织相比,共鉴定了5,490个DEGs,其中包括2,718个上调基因和2,772个下调基因。在这些DEGs中共提取了277个差异表达的IRGs(图1A)。热图证明了六个差异表达的免疫相关风险基因(图1B)。

3

免疫相关基因风险评分的开发

基于单变量Cox回归模型(P<0.05),共发现36个IRGs与OS显著相关。森林图表明,有29个IRGs是危险因素,而7个IRGs是保护因素(图2)。

在36个IRGs中利用Lasso回归算法筛选出了11个最重要的IRGs,之后通过多因素Cox回归分析确定了6个预后标记IRGs(CANX、HSPA1B、KLRC2、PSMC6、RFXAP、TAP1) ,以建立原发性LGG中IRGs衍生的风险特征。风险评分公式如下:

其中,k,βi,S i分别代表签名基因的数目,风险系数和基因表达水平。

根据评分结果可将患者分为低(风险评分<1.28)和高风险(风险评分≥1.28)组。

4

风险评分的评估

作者将TCGA数据库中的342例原发性LGG患者纳入生存分析。Kaplan-Meier生存分析表明低风险评分患者的生存时间显著长于高风险评分患者的生存时间(图3A)。ROC分析(AUC=0.914)表明风险评分在该诊断的功效中起着重要作用(图3B)。通过热图发现高风险患者倾向于高表达危险基因,低风险患者倾向于高表达保护基因(图3C)。风险图显示患者的死亡率随着风险评分的增加而增加(图3D)。

5

预后预测模型的建立

作者将TCGA数据集中的432名原发性LGG患者以7:3的比例随机分为训练和测试组。为了评估免疫相关基因的独立预后能力,作者应用了单变量和多变量Cox比例风险回归模型(图4A,B)。然后,在诺模图中可视化风险评分,年龄,性别,等级,放疗,化学疗法和IDH状态,预测3年和5年OS(图4C)。诺模图的ROC分析(AUC=0.88)表明其在患者预后方面具有出色的能力(图4D)。诺模图校准图显示出预测值和观察值之间的令人满意的一致性(图4E,F)。这些结果表明,诺模图在预测LGG患者的3年或5年生存率方面具有良好的准确性。

6

内部验证和外部验证

接下来,作者利用TCGA数据集中128例原发性LGG患者进行内部验证(图5),此外作者还利用CGGA数据集中353例原发性LGG患者进行外部验证(图6),内部、外部验证均表明先前建立的诺模图在预测LGG患者的3年或5年生存率方面具有良好的准确性。

7

预后模型在复发性LGG中的应用

为了研究该模型在复发LGG患者中的可行性,作者使用相同的公式计算131例复发性LGG患者的风险评分,结果发现在Kaplan-Meier生存曲线上得出的结果与原发LGG观察到的结果相似,但是ROC结果分析显示该模型在复发性LGG的预后能力较差。

8

风险评分与临床病理参数之间的关联

作者还分析了LGG中六基因标记与临床病理参数(年龄,性别,等级,放疗,化疗和IDH突变状态)之间的关系。结果发现在原发性LGG中,III级、IDH野生型和老年患者的风险评分高于II级、IDH突变和年轻患者,但是,在复发的LGG中,IDH野生和突变组之间没有发现显着差异。

9

风险评分与肿瘤浸润免疫细胞的相关性

作者基于CIBERSORTx算法分析了风险评分与浸润性免疫细胞的相关性,结果发现22种浸润免疫细胞的丰度明显不同(图7A,B),同时作者在TIMER数据库中验证了免疫细胞的丰度差异(图7C)。为了进一步研究浸润性免疫细胞的预后价值,作者应用了单变量Cox比例风险回归模型,发现Treg细胞,嗜中性粒细胞和M2型巨噬细胞与不良的生存结果显著相关,而巨噬细胞M1和激活的DC细胞是原发性LGG的保护因素(图7D)。

10

预后免疫相关基因的mRNA和蛋白质水平验证

最后,作者在CCLE数据库(https://portals.broadinstitute.org/ccle)中验证了预后模型中六个免疫相关基因的mRNA表达水平,同。时在人类蛋白质图谱数据库(http://www.proteinatlas.org/)中验证了这些基因的蛋白质表达水平。CANX,HSPA1B,PSMC6和TAP1在胶质瘤中高表达, KLRC2低表达(图8)

小编有话说

在这项研究中,作者证明了基于六种免疫相关基因的风险特征可能在风险分层中有效,并且可以作为原发性LGG患者总体生存的独立预后因素。本文聚焦于免疫相关基因与脑胶质瘤的相关研究,重点讨论特定生物学功能的基因在脑胶质瘤预后中的作用,研究内容非常丰富,基于TCGA及CCGA公共数据库,通过Cox回归分析及LASSO算法构建了脑胶质瘤预后预测模型,之后又利用内部和外部数据对模型进行了验证,说服性很强。相比于同类型的文章,本文的研究内容显然是非常丰富的,并且具有非常实用的临床意义。小编个人认为,本文分析方法选用合理,分析思路清晰,这篇文章的水平应该不只是局限在3分左右,如果你对这种分析思路有兴趣,完全可以考虑冲刺5+的文章。好了,最后再一起回顾一下本文的分析流程吧!希望对你有所帮助!

更多科研新鲜资讯、文献精读和生物信息技能

请关注科研猫公众号

科研猫原创出品,任何形式转载,均需获授权

若您是读者,欢迎分享,无需授权

易法通律师事务所提供版权法律支持

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-07-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 科研猫 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档