前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >肿瘤驱动基因(NCG)数据库更新--非癌症组织中,驱动癌症和体细胞进化的基因的比较评估!

肿瘤驱动基因(NCG)数据库更新--非癌症组织中,驱动癌症和体细胞进化的基因的比较评估!

作者头像
作图丫
发布2022-03-29 08:42:15
1.2K0
发布2022-03-29 08:42:15
举报
文章被收录于专栏:作图丫

导语

GUIDE ╲

体细胞的基因突变可以驱动非恶性克隆的形成,并促进癌症的发生。然而,这些过程之间的联系仍然不清楚,并阻碍了我们对组织稳态和癌症发展的理解。

背景介绍

NCG是常用一个肿瘤驱动基因数据库,在旧版本中共收录了2372个驱动基因,分成:Known cancer genes和Candidate cancer genes两种,随着组织深度测序技术的发展,研究人员发现一些体细胞中癌症驱动基因的突变即使频率很高也没有导致恶性转化发生,就引出了一个问题:正常体细胞进化的基因驱动因素与癌症进展因素相关或不同的原因是什么?为了解决这一问题,作者通过文献挖掘收集一个全面的基因库,这些基因的体细胞改变已被报道为驱动癌症或非癌症进化,并在TCGA的样本中绘制其变化,还确认了驱动基因的独特进化路径及其在细胞中的中心作用。文章发表在《genome biology》杂志上,题目为:Comparative assessment of genes drivingcancer and somatic evolution in noncancer tissues: an update of the Network ofCancer Genes (NCG) resource。

数据介绍

在PubMed、TCGA、ICGC进行文献检索,筛选2018年至2020年期间发表的癌症筛查结果,包括135个编码和154个非编码基因,去除缺乏驱动基因或驱动基因检测方法的结果,分别剩下80和37个。

TCGA:泛癌数据--质量控制突变(snv和indels)、拷贝数和基因表达数据

结果解析

01

3300多个基因是癌症和非癌症体细胞进化的典型或候选驱动因素

作者对2008年至2020年发表的331篇文章进行了全面的文献综述,这些文章描述了在癌症或非癌症体细胞进化中已证实或预测作用的驱动突变基因(图1a)。进一步计算了驱动因子的系统级特性,并注释了它们的功能、体细胞变异和药物相互作用(图1a)。在591个典型驱动因子中,只有11%对所有三个来源都是共同的(图1b),这表明即使在已知的癌症基因中,一致性也很差。进一步注释了>86%的典型驱动因子的遗传作用模式,发现了相当比例的致癌基因或肿瘤抑制因子(图1c)。其余的则有双重作用,或不能单独分类。

从 310 个测序筛选中提取了额外的癌症驱动因素,去除可能的假阳性后,最终包括 3177 个癌症驱动因素,其中 2756 个仅依赖于统计支持(候选癌症驱动因素),421 个是典型驱动因素(图1d)。鉴于癌症编码筛选的普遍性(图1a),大多数基因只有编码驱动因子的改变(图 1e),而其中 16%(531 个)在非编码筛选中被识别为唯一的驱动因素。其中绝大多数(467个基因,87%)只在一个screen上被预测为驱动因素。其余64个基因是典型驱动因素,已在多个screens中被预测为驱动,或对其驱动活性有额外的实验支持(图1f)。

作者分析了18个健康或患病(非癌症)组织的测序筛选,他们共同报告了95个基因,这些基因的体细胞突变可以驱动非恶性克隆的形成(健康的驱动因素)。有趣的是,其中只有8个不是癌症驱动因素(图1g),这表明癌症和非癌症进化的遗传驱动因素之间有很高的重叠。

图1

02

捕获癌症的能力而非健康驱动异质性的能力随样本量的增加而增加

为了比较组织间和组织内的癌症和健康驱动因素,将122种癌症类型和12种非癌症组织分别分为12个和7个器官系统。

作者检测到癌症驱动因素和供者之间的整体关系(图2a)和单个器官系统之间存在很强的正相关关系.这表明,目前识别新驱动因素的能力取决于分析中包含的样本数量。其次,在所有器官系统中,候选基因的数量都超过了典型驱动因素,除了那些样本量小或突变率低的器官系统,如儿童癌症,只能确定最多复发的典型驱动因素(图2b)。第三,大型供体队列比小队列能够检测到更广泛的典型驱动因素(图2c)。分析显示,非编码驱动因素突变的贡献在很大程度上仍未被重视,而非编码驱动因素尚未在一些肿瘤中被报道,包括所有儿童癌症(图2d)。

我们可以观察到一些与癌症驱动因素的相似之处和不同之处。与癌症驱动因子(图2e,f)一样,健康的驱动因子也大多是器官特异性的(图2g),而最常见的健康驱动因子也是同一器官系统中的癌症驱动因子(图2h)。与癌症驱动因素不同,drives和donors的数量之间不存在相关性(图2i)。

图2

03

突变模式影响了驱动的作用模式

为了进一步了解作用模式,作者绘制了TCGA中34种癌症类型中癌症和健康驱动因素获得的突变类型。在预测了7953个突变、拷贝数和基因表达数据匹配的TCGA样本的破坏性改变后,分别确定了这些样本中功能丧失(LoF)和功能获得(GoF)改变的驱动因素(图3a)。在测序筛选中检测到和未检测到的典型癌症驱动因子之间的比较(图1d)显示,由于LoF改变较少,后者被损坏的样本数量明显较少(图3b)。作者证实了驱动因素的突变模式反映了它们的作用模式,典型的肿瘤抑制因子和致癌基因分别显示了LoF和GoF的改变的普遍存在(图3c)。22个最频繁改变的肿瘤抑制因子中有16个普遍存在GoF改变(图3d)。预测编码驱动变化的候选基因显示出相似的LoF和GoF变化分布情况(图3e),而只有非编码驱动改变的候选基因LoF变化显著较低(图3f)。

受损的癌症驱动因素的数量在单个TCGA样本中证实,尽管付出了所有努力,目前的驱动程序曲目在很大程度上仍然不完整。大部分样本的damaged drivers少于5个,~15%的drivers没有损坏(图3g)。由于它们与癌症驱动因素的高度重叠,大多数健康的驱动因素在癌症样本中没有GoF或LoF改变的发生率(图3h)。所有健康的驱动因素,即使是8个没有癌症参与的驱动因素,在癌症样本中受到的损害也明显多于其他人类基因(图3i)。

图3

04

癌症和健康驱动因素的特性支持了它们在细胞中的中心作用

作者证实,与其他人类基因相比,癌症驱动因素,特别是典型驱动因素,在整个进化过程中更加保守,并且不太可能保留基因重复(图4a)。它们还表现出更广泛的组织表达,参与更多的蛋白质复合物,并在蛋白质-蛋白质和miRNA-基因网络中占据更多的中心和高度连接的位置(图4a)。作者报道了肿瘤抑制基因和癌基因之间的显著差异,前者富含旧基因和单拷贝基因,显示出更广泛的组织表达(图4b)。

与非编码驱动改变的基因比编码改变的基因具有系统级的特性(图4c),与肿瘤抑制子相比,>50%GoF改变的子集与致癌基因的特性相似(图4d)。总的来说,所有GoF流行的候选驱动因子都与致癌基因相似,与肿瘤抑制因子相比,显示出更高的重复基因比例,更窄的组织表达,对种系变异的耐受性更高(图4e)。相反,与致癌基因相比,LoF流行的候选驱动基因年龄更大,重复程度更少,对种系变异的耐受性也更低(图4f)。健康驱动程序的系统级属性因与癌症驱动程序的重叠而有所不同(图4g)。

图4

05

癌症基因网络:一个开放获取的注释驱动程序的数据库

作者在NCG数据库的第七版中收集了 3347 名癌症和 95 名健康驱动因素的全部内容、文献支持和属性(图5a)。除了已知或预测的作用模式和癌症和健康驱动因素的系统水平特性,NCG 7.0还注释了它们在TCGA的功能、癌细胞系的改变模式和基因表达谱,报道了与抗肿瘤药物的相互作用,以及作为治疗生物标志物的潜在作用(图5b)。

超过9%的典型癌症驱动因子是抗癌药物的靶点,而癌症驱动因子约占其靶点的40%(图5c)。此外,在细胞系(图5d)或临床试验(图5e)中,大多数被用作耐药性或治疗反应的生物标志物的基因都是癌症驱动因素,其中典型的癌症驱动因素非常普遍。

图5

小编总结

作者对癌症测序筛选的全面分析显示,目前的癌症驱动基因库仍然是不完整的,并倾向于频繁的突变,改变基因编码序列。这就需要额外的筛选和方法来识别单个患者的进一步编码和非编码癌症驱动因素。作者证实了癌症驱动因素在细胞内的核心作用,这反映在它们的进化路径上,并被大多数已知的健康驱动因素所共享。

END

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-02-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作图丫 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档