前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >最全癌症驱动基因汇总:2.8万个肿瘤样本66种癌型覆盖568个驱动突变基因

最全癌症驱动基因汇总:2.8万个肿瘤样本66种癌型覆盖568个驱动突变基因

作者头像
作图丫
发布2022-03-29 12:14:18
6420
发布2022-03-29 12:14:18
举报
文章被收录于专栏:作图丫

为了更好的分享,作图丫不定期推荐优秀的公众号给大家,敬请期待

致力于让更多没有编程能力的医学科研人员更便捷的运用网上数据库资源,敬请关注~

导语

GUIDE ╲

了解癌细胞转化的机制是开发癌症筛查方法和治疗方法的关键。而实现这一目标的关键是识别出能够驱动肿瘤的突变基因。

自20世纪70年代以来,癌症驱动基因的名单一直在增加。在这篇综述中,提出了一种获得突变癌症驱动基因的新方法:整合肿瘤基因组学IntegrativeOncoGenomics (IntOGen)。

背景介绍

今天小编给大家分享的是一篇由西班牙巴塞罗那科学技术研究所的研究团队在Nature Reviews Cancer 杂志发表的题为:A compendium of mutational cancer driver genes 的论文。

这项工作通过对来自66种癌症类型的2.8万份肿瘤样本的基因组进行分析,识别出了568个癌症驱动基因。

癌症其主要特征是由基因突变引起的非正常和不受控制的细胞生长。这些突变因其驱动肿瘤发生的能力而被称为驱动基因,其突变形式影响一系列关键细胞功能的稳态发展。

癌症研究的主要目标之一就是在不同类型的肿瘤中发现这些癌症驱动基因。关键癌基因的识别与癌症靶向治疗的发展密切相关,并且直接影响癌症预后和治疗。

文章主要分为两部分

第一部分:从肿瘤的全外显子组和全基因组测序出发,从历史发展的角度回顾性阐述了对癌症基因进化知识的总结,并对未来进行了展望。

第二部分:主要阐述开发的IntOGen方法,旨在系统的鉴定跨肿瘤类型的突变驱动基因。

数据介绍

为了全面系统的识别驱动基因,本工作收集了66种癌型的221套数据集,总计28,076个样本。

相同癌症类型的肿瘤样本,进行统一的测序和分析。肿瘤中编码突变的数量因癌症类型的不同而不同,在给定的肿瘤样本中也观察到一定程度的异质性。

结果解析

01 第一部分:癌症基因组学基础

早在20世纪初,佩顿·劳斯就能够利用从患病动物身上提取的无细胞提取物将肿瘤传播给健康的鸟类,从而表明比细胞小的单位是导致肿瘤发生的原因。

从1940年到1980年的几十年里,生物化学和分子遗传学的进步促进了实验室方法的发展,如位置克隆、逆转录和桑格测序。这些方法在癌症研究中的应用识别出了第一个癌症驱动基因,以其驱动肿瘤发生的突变形式命名。

尽管细胞中存在正常等位基因,但引入有缺陷的致癌基因拷贝就足以产生转化,因此可以得出结论,致癌基因的作用方式占主导地位。到20世纪80年代中期,人们承认存在第二种癌症基因,即肿瘤抑制基因。与癌基因不同的是,细胞转化是由肿瘤抑制子的失活引起的,这通常需要该基因的两个等位基因的活性丧失。

肿瘤发生的观点是,只有少数驱动基因的突变被认为是恶性肿瘤的起源。

因此,肿瘤突变基因中的绝大多数与肿瘤发生完全没有关系:也就是说,肿瘤中大多数突变(passengers)不是驱动突变(drivers)。

驱动突变背后的原理是肿瘤发生遵循以变异和选择为特征的达尔文进化论。

体细胞突变自发产生,在组织中引入体细胞之间的遗传差异。驱动突变具有比邻近细胞更多的选择优势,从而导致克隆突变体的扩增(癌症特征的不同导致各种选择性优势的不同,也就是说癌症是由不同驱动基因的突变导致的)。

不同类型的突变在不同癌型中出现的频率不同,而且人类基因组的突变率是高度异质性的,

所以驱动检测方法受到背景突变率的异质性的影响。

02

驱动基因的系统研究

IntOGen方法示意图:共分为三个层面

(1)预处理步骤:保证以正确的格式和操作参数接收输入(从同一肿瘤中提取的样本进行重复数据删除,或者删除非同义突变或超突变表型的异常比例的样本)。

(2)七种驱动基因识别方法(dNdScv,OncodriveFML,CBaSE,OncodriveCLUSTL,HotMAPS,smRegions, Mutpanning)每种方法通过加权投票相结合,组合产生每个队列的驱动基因列表,结果相对于单个方法灵敏度更高,特异性不变。

(3)假阳性驱动基因的自动过滤。

03

驱动突变基因癌型异质性

Cancer Gene Census(CGC)数据库作为本工作的“金标准”(‘ground truth’),识别出的568个突变驱动基因中有四分之三已经在CGC中做了注释。图a为每一种肿瘤类型的癌症驱动基因数量(与CGC交叠后结果)。

文章识别出了152个潜在的新驱动基因(CGC中未注释的基因)。

对于许多经典的驱动基因来说,本工作揭示了它们在更广泛的癌症类型中的作用。(例如: KMT2C的体细胞突变模式显示在31种肿瘤类型中驱动作用。但是,它在CGC中有注释的只有成神经管细胞瘤一种癌型。)

一些基因在许多种癌型中起驱动作用,而另一些则倾向于作用于具体的癌型。大多数基因充当驱动机制只在一个或两个肿瘤类型,只有一小群基因能够作为20多个恶性肿瘤的驱动突变基因。

04

驱动基因的突变特征

一些驱动基因突变影响的某个蛋白结构域,可以影响超过10个癌型的发生发展。p53的DNA结合结构域在42种不同癌症类型的组群中明显富集于体细胞突变,比其他任何蛋白结构域的数量都多,尽管这仅由TP53驱动。

05

癌症基因组学的过去、现在和未来

(1)在这篇综述中,作者有意关注影响蛋白编码基因的驱动突变。

(2)虽然驱动基因是通过积极选择的信号被独立地识别出来的,但肿瘤实际上是一系列驱动突变作用发生的。

(3)最后,理解除了体细胞突变外的其他特征是如何在肿瘤发生中协同作用的是一个挑战。虽然几乎所有的肿瘤都包含基因组驱动突变,但这些并不足以解释细胞转化的完整过程。

小编总结

(1)文章主要分为两个部分来系统阐释癌症驱动突变的识别。第一部分主要为癌症基因组学历史回顾。第二部分主要解释开发的IntOGen方法的工作原理和分析内容。最后通过驱动突变在癌症中的异质性以及与CGC数据库中的癌基因进行比较来对工作进行分析和评估。

(2)文章对癌症基因组学的发展历史和未来展望都有详细的阐述。对驱动突变对癌症影响的洞察将是癌症基因组学转化为精准癌症医学的基础。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-01-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作图丫 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档