前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >11+文章-机器学习打造ProTICS框架-深度揭示了不同分子亚型中肿瘤浸润免疫细胞对预后的影响

11+文章-机器学习打造ProTICS框架-深度揭示了不同分子亚型中肿瘤浸润免疫细胞对预后的影响

作者头像
作图丫
发布2022-06-24 10:22:18
2950
发布2022-06-24 10:22:18
举报
文章被收录于专栏:作图丫作图丫

导语

同一癌症的不同亚型通常表现出不同的基因组特征,需要靶向治疗。不同癌症亚型中肿瘤微环境细胞和分子水平的差异对肿瘤发病机制和预后结果具有显著影响。

背景介绍

尽管目前已经对选定组织学亚型中肿瘤浸润淋巴细胞的预后关联进行了大量研究,但很少有研究系统地报告免疫细胞在分子亚型中的预后影响。今天小编为大家带来的这篇文章,通过机器学习方法,提出了一种计算框架 ProTICS来量化免疫细胞的预后影响。文章发表在《Briefings in Bioinformatics》上,影响因子为11.622,文章题目为:ProTICS reveals prognostic impact of tumor infiltrating immune cells in different molecular subtypes。

数据介绍

本研究所用数据来自TCGA,包括乳腺癌 (TCGA-BRCA)、子宫内膜癌 (TVGA-UCEC) 和卵巢癌 (TCGA-OV),从中下载了基因表达的 FPKM 、DNA 甲基化的 Beta 值和患者的临床信息。此外本研究还下载了下载了由基因表达和拷贝数变化组成的 METABRIC数据集,以进一步验证 ProTICS 的性能。

结果解析

01

ProTICS方法的框架

为了对肿瘤标本及其微环境的进行全面表征,本研究提出一种新的计算方法 ProTICS,如图所示,ProTICS 的框架由三部分组成,(A) 基于基因表达和甲基化谱的 NTD 方法发现分子亚型。(B) 通过使用 TIP 工具对特征基因集的表达值进行回归来估计免疫细胞的相对比例。(C) 每个分子亚型中免疫细胞类型的预后影响通过 Cox回归估计,然后预测每个亚型的预后基因。

图 1

02

从多组学数据建立的分子亚型分析

本研究通过 NTD 整合基因表达和甲基化谱来建立分子亚型,为了获得最佳亚型数量,本研究遍历了从 2 到 6 的亚型数量。对于每个数字,本研究分析了总生存期,通过对数秩检验 P 值估计亚型之间的统计差异。最终本研究在 TCGA-BRCA 上定义了五个亚型,在 TCGA-UCEC 上定义了两个亚型,在 TCGA-OV 上定义了六个亚型,生存结果如图2所示。

图 2

为了进一步评估 NTD 方法对癌症亚型分型的性能,本研究通过分析三个 TCGA 数据集上分子亚型的总体存活率,与其他方法进行了基准比较。对数秩检验P值如表1所示,发现NTD 始终优于其他方法。

表 1

03

推断肿瘤浸润免疫细胞的比例

在建立分子亚型后,本研究计算了跨亚型特征的差异表达 (DE) 水平。接下来,根据对数倍数变化的绝对值对重要的 DE 基因进行分类。最后,分别获得了 TCGA-BRCA、TCGA-UCEC 和 TCGA-OV 的 25、20 和 35 个 DE 免疫基因。三个 DE 免疫基因组的表达谱热图如图 3 所示。接下来,本研究应通过TIP 来估计每个肿瘤的免疫细胞比例。

图 3

04

评估不同亚型中免疫细胞类型的预后影响

为了研究不同癌症亚型中免疫细胞类型的预后,本研究首先将这 10 种免疫细胞的比例转换为 10 个分类变量,分别具有高或低(1 或 0)两个值。然后,使用单变量回归来检查单个免疫细胞类型对每个亚型的总体存活率的影响,由 HR(风险比)、95% CI(置信区间)和每种免疫细胞类型的 P 值组成的结果如图 4 所示。

图 4

为了估计这 10 种免疫细胞类型如何提供集体预后值,作者应用多元回归模型来回归 10 种免疫细胞类型与每个亚型的总体存活率的比例。回归结果如图5所示,结果发现具有较高总存活率的分子亚型也具有更多的预后免疫细胞类型。

图 5

05

识别不同亚型的预后免疫基因

接下来本研究探讨了标签基因的预后效用,根据基因表达水平是否高于或低于肿瘤中值将患者分为高表达组或低表达组,然后应用 单因素cox回归来估计不同亚型中每个基因的预后效果,并计算 HR、95% CI 和 P 值。结果如图6所示,几个基因在某些亚型中具有预后作用,但与其他亚型不相关,并且不同癌症亚型中的预后基因组是不同的。

图 6

06

在METABRIC数据集上评估ProTICS

最后,本研究在 METABRIC 数据集中验证 ProTICS 的性能。首先通过观察对基因表达谱的复制效应,分别比较了 ProTICS 定义的亚型与 PAM50 预测因子定义的 Claudin-low 亚型和 Intclust 发现的癌症亚型,通过 NTD 方法在 METABRIC 数据集上将患者分层为不同的分子亚型,并且可以观察到癌症亚型的最佳数量为 4。

为了可视化基因表达谱对分离分子亚型的贡献并比较三种不同亚型算法的功效,本研究使用UMAP将基因表达谱映射到二维空间显示了亚型分布。三种方法的不同亚型的散射分布如图 7 所示,结果显示本研究方法的基因表达可重复质量与 claudion 亚型相当。

图 7

小编总结

本研究首先通过应用非负张量分解技术,根据基因表达和甲基化谱将患者分为分子亚型。然后使用基于 mRNA 的反卷积方法量化每个样本中细胞类型的比例。对于每个亚型的肿瘤,本研究通过Cox 比例风险回归来估计免疫细胞类型的预后影响。在分子水平上,预测了每个亚型的特征基因的预后。方法都是一些比较基础的生信分析方法,值得大家日后应用在自己的研究中。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-06-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作图丫 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档