什么是染色质可及性?
1
染色质关闭:压缩DNA
人的DNA链全部展开大约有2m,需要折叠为染色质结构才可以存储到放到细胞核中。染色质的基本结构单位是核小体(由组蛋白组成),核小体再折叠最终形成高度压缩的染色质结构。一般真核生物是这种方式来存储遗传信息。
这个过程像我们将文件压缩为zip或者rar的压缩包,减少它的占用空间。
2
染色质开放:解压DNA
高度折叠的染色质结构在复制和转录时需要暴露出DNA序列,这段暴露的区域就是染色质开放区域,这个区域可以供转录因子和其他调控元件结合,所以它与转录调控是密切相关的。这种致密的核小体结构被破坏后,启动子、增强子、绝缘子、沉默子等顺式调控元件和反式作用因子可以接近的特性,叫染色质的可及性,也叫染色质开放性(chromatin accessibility ),这段区域叫开放染色质(open chromatin) 。
这个过程类似于我们要查看刚刚压缩包里的文件,我们需要解压后才能查看到文件里的内容。
检测染色质可及性
为了研究染色质的这种特性,大家都先后尝试了好多测序来检测染色质可及性。但是目前最常用的是2013年由斯坦福大学William J. Greenleaf和Howard Y. Chang实验室开发的ATAC-seq(Assay for Transposase-Accessible Chromatin with high throughput sequencing),一种捕获染色质可及性(染色质开放性)的测序方法。
1
原理
利用转座酶Tn5可结合开放染色质的性质,使用Tn5酶捕获DNA序列,进而上机测序。
转座酶会携带特定的已知序列,然后将这些序列插入到开放的染色质区域中,最后将带有转座酶标记过的序列上机测序,通过软件计算,就能获得基因组哪些地方是开放的。
开放染色质的研究方法除了ATAC-seq,还有DNase-Seq,FAIRE-seq,MNase-seq 等。ATAC-Seq由于其所需样本少,建库快,重复性更高,是目前研究开发染色质的主流技术方法。
2
应用
3
技术限制
相似测序方法的异同
1
ATAC-Seq、Dnase-Seq、MNase-Seq、FAIRE-Seq
这些测序方法整体的分析思路一致,找到富集区域,对富集区域进行功能分析。
ChIP-Seq是揭示特定转录因子或蛋白复合物的结合区域,实际是研究DNA和蛋白质的相互作用,利用抗体将蛋白质和DNA一起富集,并对富集到的DNA进行测序。
DNase-Seq、ATAC-Seq、FAIRE-Seq都是用来研究开放染色质区域:
DNase-Seq是用的DNase I内切酶识别开放染色质区域,
ATAC-seq是用的Tn5转座酶,随后进行富集和扩增;
FAIRE-Seq是先进行超声裂解,然后用酚-氯仿富集;
MNase-Seq是用来鉴定核小体区域。
下图是不同测序方法获取的峰形:
检测染色质可及性的方法中,ATAC-seq尤其受欢迎。经过整理的ATAC-seq数据集和出版物呈指数增长。
ATAC-seq的优点:Tn5转座酶的高活性使ATAC-seq成为一种简单,省时的方法,而且只需要500-50,000个细胞。灵敏度和特异性与DNase-seq相当,优于FAIRE-seq。
2
ChIP-seq 与 ATAC-seq 的比较
峰形状的区别
Chip-seq与ATAC-seq 的 peaks 有着明显的区别,前者peaks是代表抗体结合转录因子的位点,后者peaks是代表Tn5转座酶切开染色质开放区的两端,因此在一个位置,前者peaks有一个,后者有两个。
在应用上的区别
ATAC-Seq是可以检测到全基因组的DNA结合蛋白,转录结合位点 ,一般用于不知道特定的转录因子,用此方法与其他方法结合筛查感兴趣的特定调控因子;
ChIP-Seq是已知转录因子是什么,根据感兴趣的转录因子设计抗体去做ChIP实验富集它结合的DNA片段。在测定转录因子的 ChIP-seq 中独有的峰可能是先驱转录因子,其先结合到封闭染色质,然后招募染色质重塑因子或其他转录因子来起始转录。这些转录因子 ATAC-seq是检测不到的。
整合分析
由于开放染色质是大多数TF结合的先决条件,因此ATAC-seq峰通常与TF ChIP-seq峰重叠,但通常更宽。因此,TF ChIP-seq和ATAC-seq可以在同一实验系统中相互验证彼此的质量和可靠性。
ATAC-seq与 histone marker ChIP-seq集成,发现与活跃染色质标 H3K4me3,H3K4me1,H3K27ac等正相关,与不活跃的染色质标记 H3K27me3 负相关。