前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >引用2115次的ATAC经典论文解读

引用2115次的ATAC经典论文解读

作者头像
生信修炼手册
发布于 2020-05-07 08:09:31
发布于 2020-05-07 08:09:31
1.8K0
举报
文章被收录于专栏:生信修炼手册生信修炼手册

本文要解读的文献如下

于2013年发表在nature methods杂志上,引用多达2115次。作为ATAC的开篇之作,在文章中详细介绍了ATAC的原理及应用,分为了以下几个部分

1. ATAC的实验方法

ATAC通过tn5转座酶来富集开放染色质区域的DNA序列,经PCR扩增后进行NGS测序,实验流程如下图所示

相比DNase-seq, FAIRE-seq, 该技术要求的细胞起始量低,而且文库构建耗时短,统计结果如下图所示

上图中的左侧描述了不同实验方法所需的细胞起始量,可以看到ATAC所需细胞最少,右侧描述了文库构建时间的长短,可以看到ATAC在1天之内就可以完成文库构建。

通过比较不同实验方法捕获构建的文库的一致性,发现ATAC重复性好,而且与其他实验方法的一致性高,对应的信号图如下所示

信号分布的峰型基本一致,相关性结果如下所示

可以看到,相关系数都较高,两个ATAC文库的相关性则高达0.97。

2. ATAC的插入片段揭示了核小体的位置

通过对ATAC文库中插入片段的长度进行分析,观察到了一种很有意思的现象,示例如下

可以看到,200bp之后,插入片段的峰值有一个周期性的波动,取log之后,这个趋势更加明显。单个核小体是由146bp的DNA缠绕在组蛋白上构成的,这里的周期性表示的是不同核小体的个数,说明ATAC可以定位核小体边界。

进一步对ATAC文库的插入片段进行探究,观察不同长度的序列对应的染色质状态,结果如下

可以看到,当插入片段的长度非常短时,在CTCF结合区域富集。对于转录起始TSS区域而言,对应的插入片段长度在1到3个核小体周期的长度。而promote对应的插入片段长度则非常长。

ATAC文库中,位于两个相邻核小体之间的序列,称之为nucleosome-free fragments, 简称NRF。这部分序列的peak可以用来表征TSS的位置,如下图所示

对于THAP8和WDR62两个基因而言,ENCODE CAGE测到的序列表征了这两个基因的TSS区域。可以观察到,ATAC文库中NRF序列的peak也很好的表征出了这两个TSS区域,虽然峰的中心有一定距离的偏差。

对于TSS两侧reads的分布进行统计,结果如下

这种图主要看分布的趋势,NRF序列在TSS附近是富集的,如上图红色的峰所示。核小体边界的序列在TSS附近出也呈现了富集,但是峰值和NRF的不同。

3. ATAC揭示了转录因子结合位置与核小体的距离

利用转录因子的chip_seq数据,分析了ATAC数据中各个转录因子与核小体不同距离内序列的分布情况,结果如下

热图的每一行代表一个转录因子,通过聚类分为了4大类别,第一类距离核小体最远,为strongly nucleosome avoidting;第二类和CTCF类似,在核小体的边界附近,第四类在核小体邻近处,nucleosome adjacent/associated。

4. ATAC揭示了转录因子结合位置

chip_seq富集的是蛋白结合区域的序列,而转座酶富集的序列是蛋白两侧的序列。利用序列的分布趋势,通过ATAC也可以检测到蛋白结合区域,结果如下

对于CTCF而言,chip_seq的峰为其结合区域,最中心的位置为对应的motif。同样的位置,在ATAC和DNase文库中,motif处没有reads,而两侧呈现富集,通过这样的趋势,也可以定位motif位置。对于某种转录因子,通过分析其motif两侧序列的分布,可以分析出文库中是否检测到了该转录因子的结合,从而识别细胞中正在发挥调控作用的转录因子。

ATAC一次获取全基因组范围内的开放染色质序列,包含的转录因子数量是非常多的。文章中通过这种方法识别到了89个转录因子,部分结果如下

5. ATAC可以用于分析临床样本

ATAC建库周期非常短,可以实时反映样本的表观遗传信息,所以可以用于临床检测。在文章中对某个志愿者的血液样本进行了ATAC分析,首先是建库周期,统计如下

4个小时之内完成建库,然后上机测序,在上机测序的周期内,得到的表观遗传图谱是恒定的,如下所示

最终通过ATAC_seq, 发现了3个理论药物靶点中,只有1个靶点在患者细胞内是激活的,示意如下

ATAC在全基因组范围内捕获开放染色质区域的序列,可以识别细胞内正发挥调控功能的转录因子。由于其周期短,重复性高的特点,既可以用于基础研究,而可以处理临床样本。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-12-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
第1篇:ATAC-seq的背景介绍以及与ChIP-Seq的异同
ATAC-seq(Assay for Transposase-Accessible Chromatin with high throughput sequencing) 是2013年由斯坦福大学William J. Greenleaf和Howard Y. Chang实验室开发的用于研究染色质可及性(通常也理解为染色质的开放性)的方法, 原理是通过转座酶Tn5容易结合在开放染色质的特性,然后对Tn5酶捕获到的DNA序列进行测序。 真核生物的核DNA并不是裸露的,而是与组蛋白结合形成染色体的基本结构单位核小体,核小体再经逐步的压缩折叠最终形成染色体高级结构(如人的DNA链完整展开约2m长,经过这样的折叠就变成了纳米级至微米级的染色质结构而可以储存在小小的细胞核)。而DNA的复制转录是需要将DNA的紧密结构打开,从而允许一些调控因子结合(转录因子或其他调控因子)。这部分打开的染色质,就叫开放染色质,打开的染色质允许其他调控因子结合的特性称为染色质的可及性(chromatin accessibility)。因此,认为染色质的可及性与转录调控密切相关。 开放染色质的研究方法有ATAC-seq以及传统的DNase-Seq及FAIRE-seq等,ATAC-Seq由于所需细胞量少,实验简单,可以在全基因组范围内检测染色质的开放状态,目前已经成为研究染色质开放性的首选技术方法。
生信技能树
2018/09/21
3.2K0
第1篇:ATAC-seq的背景介绍以及与ChIP-Seq的异同
一文读懂染色质可及性与ATAC-seq
人的DNA链全部展开大约有2m,需要折叠为染色质结构才可以存储到放到细胞核中。染色质的基本结构单位是核小体(由组蛋白组成),核小体再折叠最终形成高度压缩的染色质结构。一般真核生物是这种方式来存储遗传信息。
生信菜鸟团
2020/08/28
4.4K0
一文读懂染色质可及性与ATAC-seq
Omni-ATAC:更新和优化的ATAC-seq协议(NatProtoc)
标题:Chromatin accessibility profiling by ATAC-seq
生信技能树
2025/02/05
1140
Omni-ATAC:更新和优化的ATAC-seq协议(NatProtoc)
表观程序 | Nature | 多尺度足迹揭示了顺式调控元件的组织结构
◉ a, 多尺度足迹工作流程概述。◉ b, 比较不同Tn5偏差校正模型性能的条形图。◉ c, 在包含0 nM(顶部)或100 nM(底部)MYC/MAX的BAC DNA上,在示例区域chr. 2:238237173–238237972处预测的Tn5偏差、观察到的Tn5插入和多尺度足迹。◉ d, 在包含0 nM或100 nM MYC/MAX的BAC DNA上,在MYC/MAX基序位点上的聚合多尺度足迹。◉ e, f, 在包含0 nM或100 nM MYC/MAX的MYC/MAX基序位点上的足迹评分箱线图,显示PRINT(e,位置数= 275)和TOBIAS18(f,位置数= 158)的结果。◉ 盒子显示第一、第二和第三四分位数,须显示最远点落在第一四分位数减去1.5倍四分位距(IQR)或第三四分位数加上1.5倍IQR范围内。◉ g, 在包含0 nM(顶部),50 nM(中间)和100 nM(底部)MYC/MAX的两个相邻MYC/MAX基序位点上的多尺度足迹。◉ h, 在HepG2细胞中的cCRE区域chr. 6:154732971–154733770内的多尺度足迹。下层轨道是叠加的ENCODE组蛋白ChIP信号。◉ i, 包括AR、CREB1、TFE3和NFIA在内的示例转录因子的聚合多尺度足迹。CNN,卷积神经网络。
生信菜鸟团
2025/02/27
1580
表观程序 | Nature | 多尺度足迹揭示了顺式调控元件的组织结构
3D基因组—实验技术
基因组的三维立体结构的主要组成是DNA和蛋白质。研究基因组的三维立体结构就是研究DNA与蛋白之间的互作。ChIP一直是研究蛋白与DNA互作的重要方法。他可以显示众多调节蛋白在基因组上的分布。下表是生物体内常见的几种DNA调节蛋白。
生信技能树
2019/05/08
1.3K0
3D基因组—实验技术
分享 | ATAC-Seq 分析流程
ATAC-Seq 是“Assay for Transposase-Accessible Chromatin with high-throughput Sequencing”的缩写。 ATAC-Seq 方法依赖于使用高活性转座酶 Tn5 的下一代测序(NGS)文库的构建。将 NGS 接头连接到转座酶上,该转座酶可以使染色质断裂并同时将这些接头整合到开放的染色质区域中。构建的文库可通过 NGS 测序,并使用生物信息学分析具有可及或可访问染色质的基因组区域。
用户7010445
2024/06/18
9830
分享 | ATAC-Seq 分析流程
最近大火的ATAC, 究竟是干什么的
名字很长,翻译为转座酶可及的染色质区域的高通量测序。在这个冗长的名字中,高通量测序我们一点都不陌生,NGS二代测序已经发展了这么多年,各种组学技术,比如WES, WGS, RNA_seq等等,应用非常广泛。那么”转座酶可及的染色质区域”又是什么呢?这个词应该这样来理解,通过转录酶获取到的染色质可及区域。
生信修炼手册
2020/05/07
1.6K0
在R语言中的 ATACseq 数据分析全流程实战(五):peaks质控 & peaks 注释
本帖子学习资源:https://rockefelleruniversity.github.io/RU_ATACseq/
生信技能树
2025/03/31
890
在R语言中的 ATACseq 数据分析全流程实战(五):peaks质控 & peaks 注释
在R语言中的 ATACseq 数据分析全流程实战(四):Peak calling
ATAC-seq(转座酶可及染色质测序)利用转座酶,提供了一种从单个样本中同时提取转录因子结合位点和核小体位置信号的方法。
生信技能树
2025/03/24
1980
在R语言中的 ATACseq 数据分析全流程实战(四):Peak calling
Day5 | 表观遗传组学研究:染色质5'转座酶可及性测序(ATAC-seq)
通观2021年国自然基金项目指南,其中研究主题涉及基因表达调控的热点就有8个,其中表观遗传学、转录因子、以及组蛋白修饰等受到越来越多人的关注。
用户6317549
2022/04/09
1.2K0
Day5 | 表观遗传组学研究:染色质5'转座酶可及性测序(ATAC-seq)
综述:ATAC-Seq 数据分析工具大全
今年会在以往的基础上进行迭代与更新,并进行扩展,添加新的内容如scATAC-Seq,欢迎关注新专辑《ATAC-Seq 数据分析2025》~
生信技能树
2025/01/23
2030
综述:ATAC-Seq 数据分析工具大全
单细胞ATAC-seq技术介绍
单细胞ATAC-seq技术,顾名思义就是在单细胞水平上的ATAC-seq技术,它兼具单细胞技术的高分辨率及ATAC-seq的优势,是目前研究基因表观组学的热门技术。ATAC-seq的全称是Assay for transposase-accessible chromatin with high-throughput sequencing,是基于高通量测序对开放性染色质(open chromatin)进行研究的技术。
生信交流平台
2020/08/06
2.9K0
单细胞ATAC-seq技术介绍
快来学学这个单基因新套路发11分顶刊
Cancer-specific mutation of GATA3 disrupts the transcriptional regulatory network governed by Estrogen Receptor alpha, FOXA1 and GATA3GATA3肿瘤特异性突变扰乱雌激素受体α,FOXA1和GATA3调控的转录调节网络
科研菌
2020/06/28
4740
Cell重磅综述:关于人类转录因子,你想知道的都在这
转录因子(Transcription Factors, TFs)指能够以序列特异性方式结合DNA并且调节转录的蛋白质。转录因子通过识别特定的DNA序列来控制染色质和转录,以形成指导基因组表达的复杂系统。尽管众多科学家对理解转录因子如何控制基因表达有着浓厚的兴趣,精准定位转录因子在基因组上的特异性结合位点,以及转录因子结合后最终如何参与转录调节仍然具有挑战性。
生信宝典
2018/12/24
12.3K0
跟着ENCODE学习ATAC文库的质控标准
ENCODE称之为基因组百科全书,该数据库包含了基因组学,转录组学,表观遗传学等许多组学的数据。在提供公共数据的同时,还开源了许多组学数据分析的pipeline,当然也包含了ATAC数据分析的pipeline, 对应的网址如下
生信修炼手册
2020/05/07
1.7K0
TCGA数据库:ATAC-Seq数据的下载整理及其可视化
每一条染色单体由单个线性DNA分子组成。细胞核中的DNA是经过高度有序的包装,否则就是一团乱麻,不利于DNA复制和表达调控。这种有序的状态才能保证基因组的复制和表达调控能准确和高效进行。
DoubleHelix
2020/05/16
5.6K0
单细胞分析(Signac): PBMC scATAC-seq 质控
在本教学指南中,我们将探讨由10x Genomics公司提供的人类外周血单核细胞(PBMCs)的单细胞ATAC-seq数据集。本节中所涉及的所有文件均可在10x Genomics的官方网站上找到:
数据科学工厂
2024/05/27
4150
单细胞分析(Signac): PBMC scATAC-seq 质控
ATAC-seq分析:TSS 信号(7)
ATACseq - 使用转座酶并提供一种同时从单个样本的转录因子结合位点和核小体位置提取信号的方法。
数据科学工厂
2023/01/27
1.2K0
ATAC-seq分析:TSS 信号(7)
ATACseq - 使用转座酶并提供一种同时从单个样本的转录因子结合位点和核小体位置提取信号的方法。
数据科学工厂
2023/02/27
6030
ATAC-seq分析:TSS 信号(7)
10X Cell Ranger ATAC 算法概述
执行此步骤是为了修复条形码(barcode,细胞的标识)中偶尔出现的测序错误,从而使片段与原始条形码相关联,从而提高数据质量。16bp条形码序列是从“I2”索引读取得到的。每个条形码序列都根据正确的条形码序列的“白名单”进行检查,并计算每个白名单条形码的频率。我们试图纠正不在白名单上的条形码,方法是找出所有白名单上的条形码,它们与观察到的序列之间的2个差异(汉明距离(Hamming distance)<= 2),并根据reads数据中条形码的丰度和不正确碱基的质量值对它们进行评分。如果在此模型中,未出现在白名单中的观察到的条形码有90%的概率是真实的条形码,则将其更正为白名单条形码。
生信技能树jimmy
2020/06/04
2.1K0
10X Cell Ranger ATAC 算法概述
相关推荐
第1篇:ATAC-seq的背景介绍以及与ChIP-Seq的异同
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档