前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >11+的基于甲基化组和转录组综合分析识别葡萄膜黑色素瘤中新的预后 DNA 甲基化特征~

11+的基于甲基化组和转录组综合分析识别葡萄膜黑色素瘤中新的预后 DNA 甲基化特征~

作者头像
作图丫
发布2022-06-24 10:24:04
3100
发布2022-06-24 10:24:04
举报
文章被收录于专栏:作图丫作图丫

导语

葡萄膜黑色素瘤(UVM)是最常见的原发性眼内人类恶性肿瘤,死亡率很高。异常 DNA 甲基化已迅速成为许多癌症的诊断和预后特征。

背景介绍

基因甲基化在肿瘤发生发展中的起至关重要的作用,今天小编为大家带来的这篇文章,对甲基化组和转录组进行了全基因组整合分析,提出了一种基于机器学习的策略来识别由 10 个 甲基化驱动的预后基因(MDPG)组成的 DNA 甲基化驱动标志 (10MeSig) 。文章发表在《Briefings in Bioinformatics》上,影响因子为11.622,文章题目为:Machine learning-based integrative analysis of methylome and transcriptome identifies novel prognostic DNA methylation signature in uveal melanoma。

数据介绍

本研究所用数据:从UCSC Xena中下载了TCGA中的 80 个 UVM 病例的临床信息、甲基化和转录组数据;从GSE44295中获得了的其他独立 57 个 UVM 病例数据。

结果解析

01

MDPGs的鉴定

本研究的工作流程如图1所示。第 1 步:通过对顶部实线框内的甲基化组和转录组进行综合分析来鉴定 MDPG。第 2 步:使用机器学习方法建立甲基化驱动的预后特征。第 3 步:在独立队列中验证甲基化驱动的预后特征。

图 1

本研究首先对早期和晚期患者进行了差异甲基化分析,并确定了总共3982个与阶段相关的CpG位点。其中,发现 2187 个候选预后 CpG 与总生存期显著相关(图 2A)。曼哈顿图显示,这些相关位点在人类常染色体中分布不均匀(图 2B)。接下来本研究对 2187 个候选预后 CpG 位点的无监督层次聚类分析产生了两个不同的患者聚类,它们与临床分期显著相关(图 2C)。接着将2187 个候选预后 CpG 位点映射到基因组区室时,本研究发现其中大多数富含启动子和基因体区域,涉及 304 个高甲基化基因和 619 个低甲基化基因(图 2D 和 E),大多数属于基因组的海岸和公海区域(图 2F)。

为了识别进展相关基因,本研究还对早期和晚期患者以及转移性和非转移性患者之间的差异表达分析。结果共鉴定出219个阶段相关基因和1013个转移相关基因(图2G和H)。最后,本研究将 40 个与分期或转移显著相关的高甲基化和低甲基化基因定义为 MDPG(图 2I)。

图 2

02

MDPGs的功能表征

为了探索 40 个 MDPG 的功能作用,本研究对 MDPG 进行了 GO 和 KEGG 通路功能富集分析。GO分析结果如图3A所示,40个MDPGs富集在7个GO BP中,KEGG分析结果如图 3B所示,40个MDPG参与蛋白质消化吸收和轴突引导。

图 3

为了进一步研究 MDPGs 与 UVM 临床特征之间的关系,本研究基于 40 个基因的表达模式对 TCGA 数据集中的 80 名 UVM 患者进行了一致性聚类分析,根据 CDF 区域的变化得到了三个不同的患者聚类(图 3C 和 D),三个患者集群之间的总生存率存在显著差异(图 3E)。

03

MeSig的开发与验证

本研究使用增强机器学习算法从 40 个 MDPG 中选择签名并确定了一个 MeSig,包括 10 个 MDPG(10MeSig)。然后,将 10MeSig 通过 10MeSig 表达式的线性组合转化为风险评分模型,并通过多元 Cox 回归中的相对系数进行加权。10MeSig 的最佳风险临界值将 80 名患者分为具有不同总生存期的高风险组 (n = 30) 和低风险组 (n = 50)。如图 4A 所示,高风险组患者的总体生存率明显低于低风险组患者。时间依赖性 ROC 分析显示,10MeSig 预测 3 年和 5 年总生存期的 AUC 分别为 0.95 和 1.0(图 4B)。

图 4

为了进一步研究 DNA 甲基化对 UVM 基因调控的影响,首先研究了 10MeSig 在按 10MeSig 分层的高风险组和低风险组中的表达和 DNA 甲基化模式。如图 5A 所示,基于 DNA 甲基化和基因表达之间的交叉点,观察到 10MeSig 中涉及的四种表达和 DNA 甲基化模式。接下来本研究通过Spearman相关性分析进一步检验了DNA甲基化对基因表达的影响,发现7个CpG-基因对表现出显著的负相关,4个CpG-基因对表现出显著的正相关(图5B)。

图 5

04

10MeSig的独立验证

为了进一步验证 MDPGs 与 UVM 临床特征之间的关系,本研究在独立的GEO数据中绘制了 35 个 MDPGs 基因。然后,对GEO队列中的 57 名 UVM 患者进行了一致性聚类分析,从 35 个基因的表达模式中揭示了两个不同的患者集群(图 6A 和 6B)。如图 6C 所示,两个患者集群之间的总生存率存在显著差异;如图 6D 所示,高风险组患者的总生存时间明显短于低风险组患者。此外,9 个 MDPG 的表达模式与在发现队列中观察到的一致(图 6E)。

图 6

05

10MesSig与临床和病理特征无关

为了进一步检查 10MeSig 是否独立于其他临床和病理因素,本研究进行了多因素 Cox 回归分析。如图 7A 所示,在 TCGA-UVM 队列中,10MeSig , IV 期和年龄在多变量分析中与 OS 显著相关。在独立的 GEO的队列中,只有 10MeSig 与 OS 保持显著关联(图 7B)。这些结果表明,10MeSig 是 UVM 患者生存的独立预测因素。

图 7

小编总结

在这项研究中,作者对甲基化组和转录组进行了全基因组整合分析,确定了 40 个甲基化驱动基因,而为了进一步研究这 40 个甲基化驱动基因的临床应用,作者进行了基于机器学习的特征选择,确定了一个由 10 个 MDPG组成的 MeSig (10MeSig),它将 TCGA 队列的 UVM 患者分层为两个风险组,总生存期显著不同。 本文的研究方法值得我们在研究中学习借鉴。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-06-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作图丫 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档