文章标题:《Single cell transcriptional and chromatin accessibility profiling redefine cellular heterogeneity in the adult human kidney》
发表日期和杂志:2021年发表在Nature Communications上
在线阅读链接:https://doi.org/10.1038/s41467-021-22368-w
进行了单核ATAC(SnATAC-seq)和RNA(snRNA-seq)测序,以生成成对的、特定细胞类型的染色质可及性和成人肾脏的转录图谱。对5例健康成人肾脏标本进行了SNRNA-SEQ和SnATAC-SEQ检查.

数据链接是:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE151302 Sequencing data are deposited in GEO under accession number GSE151302. Previously published snRNA-seq data for three adult kidneys are available in GEO (GSE131882).
可以看到单细胞RNA测序数据一共是5个数据集
GSM4572192 Healthy1_snRNAseq
GSM4572193 Healthy2_snRNAseq
GSM4572194 Healthy3_snRNAseq
GSM4572195 Healthy4_snRNAseq
GSM4572196 Healthy5_snRNAseq
提供了filtered_feature_bc_matrix.h5格式的单细胞数据h5格式文件,直接下载之后使用Read10X_h5函数读取

数据下载导入,并创建Seurat对象:
###### step1:导入数据 ######
library(data.table)
dir='GSE151302_RAW/'
samples=list.files( dir )
samples
library(data.table)
sceList = lapply(samples,function(pro){
# pro=samples[1]
print(pro)
sce=CreateSeuratObject( Read10X_h5(file.path(dir,pro)),
project = strsplit(pro,'_')[[1]][2],
min.cells = 5,
min.features = 300 )
return(sce)
})
names(sceList)
samples
library(stringr)
sce.all=merge(x=sceList[[1]],
y=sceList[ -1 ],
add.cell.ids = str_split(samples,'_',simplify = T)[,2])
as.data.frame(sce.all@assays$RNA@counts[1:10, 1:2])
head(sce.all@meta.data, 10)
table(sce.all$orig.ident)
循环读取小Tips:在循环读取之前,可以先使用pro=samples[1]读取进一个数据集测试一下代码,可以的话就进行后续的循环读取。
后面就是标准分析啦,对读取进来的数据进行质控、harmony整合以及细分亚群定义等。
文章中综合数据snRNA-seq基于谱系特异性标记的表达鉴定了肾皮质内的所有主要细胞类型:

通过BioinfoArk提供的中国区chatGPT查询到各个细分亚群的解释:
其它加分项
使用97%的置信度阈值对snATAC-seq数据集进行筛选,用于细胞类型分配以去除异型双元。
通过标记转移获得的SNATAC-SEQ细胞类型预测与非监督聚类的精选注释的比较


文章同时进行了SnRNA-seq和SnATAC-seq测序,以描述成人肾脏的转录和染色质可及性情况。
分析表明,SNRNA-SEQ和SnATAC-SEQ是确定细胞特性的可比方法,而特定细胞类型的染色质可及性提供了进一步阐明细胞异质性的额外信息。多模式单细胞图谱(“多组学”)极大地提高了检测独特细胞类型和状态的能力。