前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >8分+个体化通路活性鉴定算法开发

8分+个体化通路活性鉴定算法开发

作者头像
百味科研芝士
发布2022-05-17 09:24:33
5860
发布2022-05-17 09:24:33
举报
文章被收录于专栏:百味科研芝士百味科研芝士

大家好!今天给大家介绍一篇2022年4月发表在eBioMedicine(IF:8.143)上的一篇文章。作者构建个体化通路活性鉴定方法(IPAM),可以准确进行癌症类型分类并预测癌症患者预后。

Individualized pathway activity algorithm identifies oncogenic pathways in pan-cancer analysis

个体化通路活性算法鉴定泛癌中的致癌通路

摘要

背景:越来越多的研究表明,生物学通路的异常调控是恶性肿瘤发生发展的重要因素。目前已经提出了一些通路活性的鉴定方法,但仅局限于组间比较。

方法:作者提出了一种基于单个样本的基因表达水平排序的个体化通路活性鉴定方法(IPAM)。作者使用IPAM计算TCGA数据库中33种肿瘤类型的10528例肿瘤样本和正常样本的318条通路活性,以鉴定不同肿瘤类型中的特异性失调通路。

结果:IPAM可以准确定量不同癌症类型中每条通路的活化水平,在癌症分类和预后预测方面性能较好。使用TEPs的癌症诊断模型的AUC为92.84%,表明IPAM在癌症早期诊断方面的潜力。作者在大部分癌症类型中鉴定到与患者生存相关和显著失调相关的通路,如酪氨酸代谢,脂肪酸代谢,细胞循环和DNA复制。此外,作者证明代谢通路在癌症通路失调中起主要作用并鉴定特定通路失调的驱动因子。作者的研究为了解癌症的病理机制提供新的线索,为癌症的个体化治疗提供有价值的信息。

流程图

结果

1. 数据集的获取和下载

从UCSC数据库获取33种癌症类型的转录组数据集和临床数据,共包括10528例样本。从GEO数据库获取验证集数据。此外,下载了283例血小板样本的转录组数据集,包括6例肿瘤患者的228份TEP样本和健康人群的55份血小板样本。

2. IPAM用于分类癌症的性能

IPAM算法的流程图如图1所示。作者使用IPAM计算33种癌症类型中318条KEGG通路的活性。为了评估IPAM的性能,作者基于11种癌症类型的通路活性数据构建癌症分类模型并与其他三个算法进行比较。结果表明,IPAM的分类性能最好(图2a)。使用GEO独立数据集验证IPAM的性能。结果表明,IPAM的分类性能最好(图2b)。为了鉴定IPAM在癌症早期诊断中的潜力,作者计算TEP数据的通路活性并构建癌症诊断模型。结果表明,IPAM的性能优于除Pathifier以外的其他方法(图2c)。然而,Pathifier仅使用正常样本计算样本的通路活性,在使用Pathifier时需要正常样本的数据,并不适用于癌症的个体化临床诊断。总的来说,IPAM可用于多种癌症类型分类和癌症的早期诊断。

图1 IPAM流程图

2. 鉴定泛癌中的失调通路

为鉴定不同癌症类型中的特异性失调通路,作者对20种癌症类型的318条KEGG通路进行差异分析。在这20种癌症类型中,LUSC,CHOL和KIRC的失调通路最多而PAAD,CESC和UCEC的失调通路最少(图2d)。在这318条通路中,酪氨酸代谢通路在大多数癌症类型中显著失调(图2e和2f),此外,脂肪酸降解,细胞循环,苯丙氨酸代谢和DNA复制等在大部分癌症类型中失调(图2f)。对这318条通路进行聚类分析,结果表明来源于相同组织的癌症类型表现出类似的通路失调模式(图2g)。

图2 IPAM分类癌症的性能和鉴定失调通路

3. 基于通路活性的生存分析

具有不同通路失调模式的癌症可能在生存结局上存在潜在差异。因此,作者对每个通路进行生存分析鉴定不同癌症类型中与生存相关的通路。在这33种癌症类型中,LGG,KIRC和UVM与患者生存相关的通路数量最多而READ,THCA和UCS与患者生存相关的通路最少(图3a)。多个通路与患者预后显著相关,例如DNA复制,细胞周期,钙信号通路,脂肪细胞中脂肪分解的调节,色氨酸代谢和肾素分泌(图3b)。其中,ECM-受体互作,病灶粘附和糖胺聚糖生物合适与患者生存期负相关而乙二酸盐和二羟酸盐代谢,过氧化物酶体和脂肪酸降解与患者生存期正相关(图3c)。聚类分析表明GBM和LAML,STAD和LUSC,KIRP和MESO的模型近似(图3d),表明这些癌症类型的患者生存期具有相似模式。随后,作者对25种癌症类型的进行单因素和多因素Cox回归分析。单因素Cox回归分析表明ACC的药物代谢细胞色素P450通路,KIRP的组氨酸代谢通路和MESO的酪氨酸代谢通路具有较好的预测预后能力(图3e)。使用正向逐步算法构建25种癌症类型的多因素Cox模型。如图3f所示,IPAM的平均值和C-index高于其他方。以上结果表明IPAM在分类癌症类型和预测癌症患者生存期方面效果较好。

图3 基于通路活性的泛癌生存分析

4. 不同KEGG类型的泛癌通路失调

根据KEGG分类,将这318条通路分为细胞过程,环境信息处理,遗传信息处理,人类疾病,代谢和有机体系统。在细胞过程亚类中,大多数癌症类型中只有细胞周期和p53信号通路显著上调(图4a)。在环境信息处理亚类中,大多数癌症类型中信号转导通路下调(图4a)。在遗传信息处理亚类中,大多数癌症类型中DNA复制,同源重复,错配修复和基底切除修复上调(图4a)。在参与代谢亚类中,大多数癌症类型中代谢通路下调(图4a)。在有机体系统亚类中,大多数癌症类型中脂肪分解调控,矿物质细胞,醛固酮合成和分泌下调(图4a)。代谢通路的聚类分析表明对于大部分癌症亚型来说,例如LUAD和LUSC,COAD和READ,CESC和UCEC分别聚到一起(图4b),说明这些癌症亚型可能具有相似的代谢失调模式。

图4 不同KEGG分类的泛癌通路失调分析

5. 代谢通路在癌症通路失调中起主要作用

接下来,作者总结每个癌症类型中6类KEGG分类下显著失调的通路数量,数量最多的代谢亚类,其次为有机体系统而细胞处理亚类的失调通路数量最少(图5a)。与其他亚类相比,代谢通路在大多数癌症中更易发生失调(图5b),在各种癌症类型中差异较大(图5c),说明代谢通路在癌症通路失调中发挥重要作用。为阐明代谢通路在通路失调中的重要性,作者使用85条代谢通路的活性数据构建癌症分类模型,结果表明基于代谢通路数据构建的模型效果较好(图5d),说明代谢通路在通路失调中起主要作用。基于KEGG分类方法,将这85条代谢通路分为氨基酸代谢,碳水化合物代谢,能量代谢,糖代谢,脂质代谢,辅因子和微生物代谢,核苷酸代谢和外源生物代谢等8个亚类。其中,氨基酸代谢,碳水化合物代谢和脂质代谢在大多数癌症类型中失调(图5e-5g)。

图5 代谢通路在癌症通路失调中起主要作用

6. 代谢通路与多种癌症类型患者的生存有关

氨基酸,碳水化合物和脂质代谢相关通路与多种癌症类型的患者生存期显著相关。在爱计算代谢亚类中,有几种通路与多于7种的癌症类型患者生存期显著相关,说明这些代谢通路在癌症发展中起到重要作用。在碳水化合物代谢亚类中,糖酵解/糖异生,乙醛酸盐和二羟酸盐代谢与大多数癌症类型的患者生存期显著相关。在脂质代谢亚类中,α-亚麻酸代谢,脂肪酸降解和类固醇生物合成与多于8种的癌症类型患者生存期显著相关。

7. 支链氨基酸代谢影响肾癌的发展和预后

为进一步研究通路失调的驱动因子并阐明癌症的致病机制,作者对特定癌症类型中的失调通路进行系统分析。氨基酸代谢亚类的聚类分析表明缬氨酸,亮氨酸和异亮氨酸的生物合成通路在肾癌(KICH,KIRC和KIRP)中显著上调(图5e),而缬氨酸,亮氨酸和异亮氨酸的降解通路在肾癌中下调(图5e)。缬氨酸,亮氨酸和异亮氨酸是支链氨基酸(BCAA),在能量平衡和营养代谢中起到重要作用。为研究BCAA水平在肾癌发展和预后中的作用,作者计算肾癌患者的BCAA水平,生存分析表明BCAA水平-高与KIRC和KIRP的预后较差显著相关(图6a)。为进一步研究调控BCAA水平的潜在因子,作者在基因组水平上检测BCAA代谢基因。大多数肾癌患者存在多个BCAA代谢基因的CNV缺失(图6b),会导致BCAA水平升高进而影响患者的生存期。随后,作者计算了BCAA水平与1627个转录因子表达水平的相关性,与BCAA水平相关性最显著的转录因子是PPARA(图6c)。此外,TF motif富集分析表明PPARA结合motifs富集于48个BCAA代谢基因的启动子区域(图6d)。以上结果表明,PPARA低表达可能会通过下调BCAA分解代谢基因导致BCAA水平增加进而导致肾癌预后较差。为验证作者的结果,作者对26只野生型小鼠和PPARA敲除小鼠进行差异分析,在PPARA敲除小鼠中,大部分BCAA代谢基因下调表达(图6e),说明PPARA可以调节BCAA代谢基因进而影响BCAA水平。差异表达基因的富集分析表明,这些基因富集与细胞循环通路(图6f)。总的来说,PPARA可能通过调控BCAA的降解影响肾癌发展和预后。

图6 支链氨基酸代谢影响肾癌的发展和预后

8. NR1I2和NR1I3通过共调节脂肪酸代谢影响肝癌预后

作者鉴定到脂肪酸代谢与LIHC患者的生存显著相关(图5g)。为进一步研究哪些TF可能会调控这些脂肪酸代谢,作者计算TF与脂肪酸代谢的相关性。NR1I2和NR1I3与脂肪酸代谢和LIHC患者生存期高度相关。转录因子富集分析表明NR1I2和NR1I3是细胞色素P450酶的激活因子。为验证作者的结果,作者对野生型HepaRG细胞系和PB处理的HepaRG细胞系进行差异分析。PB处理后,细胞色素P450的5个基因显著上调,其中CYP3A4, CYP2C9和CYP2C8与LIHC患者的生存期显著相关。总的来说,NR1I2和NR1I3通过调控脂肪酸代谢最终影响肝癌预后。

结论

总的来说,作者构建的IPAM可以量化泛癌种各个通路的活化水平,可以准确分类癌症类型并预测各类癌症预后并且在癌症早期诊断方面具有潜在价值。作者的研究为了解癌症的病理机制提供新的线索,为癌症的个体化治疗提供信息。本研究的局限性在于由于KEGG数据库可能没有覆盖全部基因,因此在计算通路活性时可能存在于一定局限性。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-05-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 百味科研芝士 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档