前面我们把 ATAC-seq 和 scATAC-seq 数据分析的标准流程都学完了。现在来看一下实际的数据处理,今天的文献来自2021年4月15号发表在 Nature Communications 杂志上,标题为《Single cell regulatory landscape of the mouse kidney highlights cellular differentiation programs and disease targets》。
本研究通过单细胞分辨率描绘了发育期和成年小鼠肾脏的开放染色质与基因表达图谱。我们发现基因表达高度依赖于远端调控元件(增强子),揭示了肾脏细胞中关键细胞类型特异性转录因子及主要基因调控网络。
文章技术路线如下:

样本情况」:对出生第0天(P0)、3周龄(P21)和8周龄(P56)的小鼠肾脏进行了单核ATAC测序(图1a)。小鼠出生时仍存在肾单位祖细胞,且肾单位形成过程持续至约第21天=。同时,在匹配的发育阶段进行了bulk(全肾脏)ATAC-seq分析。
scATAC-seq聚类结果」:基于开放染色质信息进行了细胞类型注释,共28,316个细胞进行分析(图1b)。采用 SnapATAC 方法对细胞进行聚类分析,获得13个细胞簇。
注释」:根据标记基因的可及性特征,成功鉴定了代表以下细胞类型的聚类(图1d):
采用 MACS2 对每种细胞类型分别进行peaks 识别,通过合并这些峰区域构建了完整的开放染色质图谱。
下面其他图:
图e」:snATAC-seq数据与 bulk ATAC-seq数据峰值检测结果对比。双数据集共同识别的峰值显示为蓝色,数据集特异性峰值显示为灰色。
图f」 :展示scRNA-seq数据中细胞类型特异性基因表达的小提琴图。
图g」:显示P0数据中snATAC-seq基因活性评分与基因表达值皮尔逊相关系数的热图。每行代表scRNA-seq数据中的细胞类型,每列代表snATAC-seq数据中的细胞类型。

在13种细胞类型中鉴定出60,684个差异可及性开放染色质峰(DAPs)(图2a),这些峰大部分呈现单一细胞类型高特异性:
图a」 左图:展示所有细胞类型特异性差异可及性峰(DAPs)的热图(黄色代表开放染色质,蓝色代表关闭染色质)(峰值位点信息见补充数据5)。中图:基于Homer软件进行的细胞类型特异性 motif 富集分析示例(完整结果见补充数据6)。右图:与各细胞类型 motif 富集结果对应的转录因子表达z值热图。
图b:」通过SCENIC算法推断的细胞类型特异性调控子热图。调控子活性被二值化为"开启"(黑色)或"关闭"(白色)。
图c」:通过SCENIC算法推断的调控子密度tSNE分布图,用以表征调控子状态的稳定性。
图d」:代表性调控子的tSNE可视化:近端小管(Hnf1a)、肾单位祖细胞(Uncx)、髓袢(Ppargc1a)、增殖细胞(Hmgb3)和足细胞(Mafb)的调控子活性(蓝色开启,灰色关闭)及转录因子基因表达(红色渐变)。Uncx调控子的靶基因表达示例如下(Eye1、Hoxc8、Pax2、Spock2和Wnt4,紫色渐变)。

所有样本合并后的snATAC-seq数据集显示出预期的插入片段周期性(「附图1a」),且在转录起始位点(TSS)呈现显著信号富集(「附图1b」),表明数据质量优良。snATAC-seq数据与批量ATAC数据高度一致(相同时期样本间的斯皮尔曼相关系数>0.84,「附图1c」)

(a) 点图展示5个样本中 UMI(x轴)与启动子比例(y轴)的分布情况
(b) 批次校正前后 snATAC-seq 数据集的 UMAP 可视化
(c) 小提琴图显示 snATAC-seq 数据集中各聚类簇的可及峰数量分布,表明其具有相似分布特征
(d) 堆叠条形图展示不同 snATAC-seq 批次中已识别细胞类型的绝对数量与百分比分布

作者不仅公开了原始数据,还通过可检索网站提供了经处理的数据集:
snATAC-seq数据见:https://susztaklab.com/developing_adult_kidney/snATAC/
scRNA-seq数据见:https://susztaklab.com/developing_adult_kidney/scRNA/
峰值轨迹IGV视图见:https://susztaklab.com/developing_adult_kidney/igv/
原始数据和bigwig文件在GEO中:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE157079
# snATAC-seq
GSM4752160 P0 mouse kidney snATAC-seq sample 1
GSM4752161 P0 mouse kidney snATAC-seq sample 2
GSM4752162 3-week mouse kidney snATAC-seq sample 1
GSM4752163 8-week mouse kidney snATAC-seq sample 1
GSM4752164 8-week mouse kidney snATAC-seq sample 2
# scRNA-seq
GSM4752165 P0 mouse kidney scRNA-seq sample 1
GSM4752166 adult mouse kidney scRNA-seq sample 1
# bulk ATAC-seq
GSM4752167 P0 mouse kidney bulk ATAC-seq sample 1
GSM4752168 P0 mouse kidney bulk ATAC-seq sample 2
GSM4752169 3-week mouse kidney bulk ATAC-seq sample 1
GSM4752170 3-week mouse kidney bulk ATAC-seq sample 2
GSM4752171 8-week mouse kidney bulk ATAC-seq sample 1
GSM4752172 8-week mouse kidney bulk ATAC-seq sample 2
其实作者还放了代码:https://github.com/Zhen-Miao/dev-kidney-snATAC
是不是很棒,下载下来做做看~
如果上面的内容对你有用,欢迎一键三连!