前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Nature|239个灵长类动物基因组的比较揭示了CRE元件的进化

Nature|239个灵长类动物基因组的比较揭示了CRE元件的进化

作者头像
生信宝典
发布2024-04-10 11:17:33
1090
发布2024-04-10 11:17:33
举报
文章被收录于专栏:生信宝典生信宝典

对非编码区域序列的分析能够帮助我们进一步理解基因组中涉及到的基因调控以及复杂疾病的致病机理。对进化水平上sequence constraint的测定,在一定程度上可以对功能调控元件在进化水平是否具有很高的保守性进行评估。然而对于如何鉴定灵长类动物中特有的存在sequence constraint元件仍旧存在以下难点:

  1. 与蛋白质编码序列相比,非编码区域的进化速度更快,因此很难进行序列比对。
  2. 灵长类动物的不同物种之间进化的时间尺度相对较短
  3. 灵长类动物基因组序列还没有完全发布,采样不充分

在此研究人员构建了包含239个物种的全基因组比对,这些基因组占灵长类目中所有现存物种的将近一半。利用该资源,研究人员确立了在灵长类和其他哺乳动物中受到选择性约束的人类调控元件。例如人类中111318个DNase I酶切位点和267410个转录因子结合位点在灵长类受到选择性约束但是在其他哺乳动物中没有约束,并证明了这些元件对基因表达的cis作用。这些结果强调了作用在这些调控元件上进化力量的重要性。 原文链接:https://www.nature.com/articles/s41586-023-06798-8

通讯作者

  • Jeffrey Rogers, 人类基因组测序中心,其主要研究的是非人类灵长类动物的遗传学和基因组学。
  • Tomas Marques Bonet,西班牙巴塞罗那加泰罗尼亚古生物研究所,其主要研究类人猿背景下的人类遗传变异,以及人类基因调控如何进化。
  • Kyle Kai-How Farh,illumina副总裁,领导 Illumina 的人工智能实验室,负责在临床变异解释中采用深度学习算法用于人类遗传变异的临床解释。

背景

对灵长类目中特有的选择性约束功能基因组元件的鉴定,能够帮助我们理解是什么原因导致了人类物种中所具有的独特性进化。尽管在这方面我们已经做了很多研究了,例如揭示了基因组中广泛的受限的基因和调控元件。但是灵长类目(包含人类)的进化距离很短,这给鉴定灵长类中特有的限制性元件提出了挑战。例如灵长类目中大约由500个物种组成,这些物种的进化时间大约在6500万年前。在如此短的时间尺度上就不能够把限制性的位点区分为是由于功能限制还是由于没有足够的时间使得其发生随机突变。在此研究人员通过构建239个灵长类动物全基因组进行多重序列比对(MAS)来进一步表征人类基因组中非编码调控元件的序列约束性。通过与哺乳动物相比,该研究鉴定到了一系列只在灵长类动物中constraint的非编码调控元件;并进一步地整合功能基因组学和群体遗传学数据用于描述这些元件在人类健康中扮演的作用。

结果

239个基因组的reference-free 比对

这一步的目的是量化整个人类基因组区域序列的保守性,这些数据是迄今为止在全基因组水平-多序列比对的最深入的物种采样。

  • 每个碱基平均被174个物种所覆盖
  • 85%的常染色质区域被至少100个物种所覆盖

MSA of 239 species

受约束的编码序列

研究人员使用phyloP估计全基因组范围内每个碱基的约束情况,发现3.1%的碱基受到约束(phylop score >1.3 or P < 0.05)。为了确定该约束得分是否可以对功能性或者中性序列进行区分。研究人员将已经注释的一些功能元件与随机序列进行比较,发现蛋白质编码区域(外显子、起始密码子)在phastCons所约束的序列中高度富集。该约束指标能够很明显地区分外显子与周围的内含子序列

接下来研究人员尝试鉴定一些在灵长类动物中特有的蛋白编码基因和外显子。首先,研究人员估计了在灵长类和非灵长类动物基因组中与人类基因组中所注释的179,329个外显子序列对应序列的约束得分。正如预期的那样,99%的人类外显子序列同样在灵长类和哺乳动物中受到约束,并且鉴定到了2,178个只在灵长类中特异性约束的外显子。

受约束的CRE

通过哺乳动物和脊椎动物的比较基因组以及表观基因组,许多人类基因组CRE在其他物种中也被鉴定出来,并被证明具有共享的基因调控功能【ref】。但是目前对于大多数DHS元件以及转录因子结合位点TFBS,还没有序列约束性的比较结果。对这些人类CRE的约束性评估,能反映这些元件在不同基因组上是否存在真正的功能差异。

Ref:

  • Comparative epigenomic analysis of murine and human adipogenesis
  • Tissue-specific transcriptional regulation has diverged significantly between human and mouse

对人类中CRE(DHS位点)的序列约束性评估发现,42%的元件在1亿年前就已经发生了分化,同样有11%的元件在灵长类动物中受到显著约束,但是在哺乳动物和脊椎动物中没有受约束。研究人员比较了受约束的元件与不受约束元件之间的差异发现,受约束元件具有更高的染色质可及性以及在更多细胞类型中open(图d)

Primate-constrained CREs

在不同物种中得出的CRE进化约束与人类种群内的选择性约束存在一定相关。为此作者在141,456个大样本中,寻找进化上约束CRE在人群中发生变异并被选择的证据。可以观察到约束CRE的靶基因,其功能丧失突变就比预期低,灵长类特异约束的CRE在人群中更不容易发生突变。这些结果表明灵长类动物中特有的调控元件在人类种群中正在经历纯化选择,并且这些元件的突变可能具有重要的调控功能

参与复杂性状调控的约束CRE

全基因组关联分析已经鉴定出许多与复杂疾病和基因表达相关的遗传变异,其中大多数变异位于非编码区。研究人员对fine-mapping的变异位点进行了进化上约束性的评估,发现对受约束程度高的Gene有影响的变异也越倾向于富集在受约束程度更高的DHS和TFBS元件上。与非编码区域的变异相比,编码区域88%的fine-mapping变异在160-400个百万年前就已经出现了变异。这些分析能够进一步帮助我们理解复杂表型背后调控变异选择性约束的进化起源。

Complex trait variation in constrained CREs

总结

哺乳动物中受约束的非编码元件已经被广泛报道,但是灵长类动物中该方向还较少被关注。先前研究就表明编码非编码区域序列比蛋白质编码区序列进化更快,本研究就发现了许多人类CRE元件存在进化约束,并且仅限于灵长类动物。结合群体的结果,发现大多数复杂表型背后的功能基因组元件并没有显示出在灵长类动物和哺乳动物中受约束;这表明这些功能元件可能仅仅在类人猿等亚群中受到约束。未来对一些关键谱系进行更为广泛的采样,将有助于提供更详细的序列选择性约束情况;从功能机制上研究基因组的差异对表型的影响将揭示基因组在历史上发生的一些关键变化。

高颜值免费 SCI 在线绘图(点击图片直达)

最全植物基因组数据库IMP (点击图片直达)

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2024-04-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信宝典 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 通讯作者
  • 背景
  • 结果
    • 239个基因组的reference-free 比对
      • 受约束的编码序列
        • 受约束的CRE
          • 参与复杂性状调控的约束CRE
          • 总结
            • 高颜值免费 SCI 在线绘图(点击图片直达)
              • 最全植物基因组数据库IMP (点击图片直达)
              相关产品与服务
              数据库
              云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
              领券
              问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档