ENCODE称之为基因组百科全书,该数据库包含了基因组学,转录组学,表观遗传学等许多组学的数据。在提供公共数据的同时,还开源了许多组学数据分析的pipeline,当然也包含了ATAC数据分析的pipeline, 对应的网址如下
https://www.encodeproject.org/atac-seq/
目前最新版的pipeline网址如下
https://github.com/ENCODE-DCC/atac-seq-pipeline
ENCODE不仅给出了pipeline, 同时还根据处理ATAC数据的经验,给出了质控的标准,非常值得参考。质控标准有以下几点
关于文库复杂度的解释可以参考这篇文章 chip_seq质量评估之文库复杂度
高质量的文库是确保分析结果准确的前提和保障,参考以上几个指标,有助于我们判断ATAC文库的质量。