文章标题:《Mapping systemic lupus erythematosus heterogeneity at the single-cell level》
发表日期和杂志:2020年发表在Nature Immunology上
在线阅读链接:https://doi.org/10.1038/s41590-020-0743-0
对33名儿童SLE患者(cSLE)和11名对照组进行了约276,000个外周血单个核细胞(PBMCs)的单细胞RNA测序,对系统性红斑狼疮(SLE)患者的血液转录组进行了分析,并揭示了其细胞来源的复杂性
数据链接是:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE135779
可以看到一共是56个样品,文章选择了33名儿童SLE患者(cSLE)和11名对照组组织样品进行分析:
GSM4029896 cSLE1 [JB17001]
GSM4029897 cSLE2 [JB17002]
GSM4029898 cSLE3 [JB17003]
GSM4029899 cSLE4 [JB17004]
GSM4029900 cSLE5 [JB17005]
GSM4029901 cSLE6 [JB17006]
GSM4029902 cSLE7 [JB17007]
GSM4029903 cSLE8 [JB17008]
GSM4029904 cSLE10 [JB17015]
GSM4029905 cSLE11 [JB17016]
GSM4029906 cSLE9 [JB17014]
GSM4029907 cHD1 [JB17010]
GSM4029908 cSLE12 [JB17019]
GSM4029909 cSLE13 [JB17020]
GSM4029910 cSLE14 [JB17021]
GSM4029911 cSLE15 [JB17022]
GSM4029912 cSLE16 [JB17023]
GSM4029913 cSLE17 [JB17024]
GSM4029914 cHD2 [JB17017]
GSM4029915 cHD3 [JB17018]
GSM4029916 cSLE18 [JB18063]
GSM4029917 cSLE19 [JB18064]
GSM4029918 cSLE20 [JB18065]
GSM4029919 cSLE21 [JB18066]
GSM4029920 cSLE22 [JB18067]
GSM4029921 cSLE23 [JB18068]
GSM4029922 cHD4 [JB18069]
GSM4029923 cHD5 [JB18070]
GSM4029924 cSLE24 [JB18071]
GSM4029925 cSLE25 [JB18072]
GSM4029926 cSLE26 [JB18073]
GSM4029927 cSLE27 [JB18074]
GSM4029928 cSLE28 [JB18075]
GSM4029929 cSLE29 [JB18076]
GSM4029930 cHD6 [JB18077]
GSM4029931 cHD7 [JB18078]
GSM4029932 cSLE30 [JB18079]
GSM4029933 cSLE31 [JB18080]
GSM4029934 cSLE32 [JB18081]
GSM4029935 cSLE33 [JB18082]
GSM4029936 cHD10 [JB18085]
GSM4029937 cHD11 [JB18086]
GSM4029938 cHD8 [JB18083]
GSM4029939 cHD9 [JB18084]
作者给出来的数据是标准的10X单细胞的数据格式,直接下载需要的数据使用,比较有意思的是,genes文件单独放在了一处:
###### step1:导入数据 ######
library(data.table)
dir='../GSE135779_RAW/children/'
samples=list.files( dir )
samples
library(data.table)
sceList = lapply(samples,function(pro){
# pro=samples[1]
print(pro)
sce=CreateSeuratObject( Read10X(file.path(dir,pro)),
project = pro,
min.cells = 5,
min.features = 300 )
return(sce)
})
names(sceList)
samples
sce.all=merge(x=sceList[[1]],
y=sceList[ -1 ],
add.cell.ids = samples)
as.data.frame(sce.all@assays$RNA@counts[1:10, 1:2])
head(sce.all@meta.data, 10)
table(sce.all$orig.ident)
后面就是标准分析啦,对读取进来的数据进行质控、harmony整合以及细分亚群等。
文章中展示了258,868个pbmc的20个集群的UMAP降维聚类分析图
文章中给出来的分群主要是:
通过BioinfoArk提供的中国区chatGPT查询到各个细分亚群的解释:
通过分析发现许多聚类在cHD组和cSLE组的个体中表现不同
基于ISG和IRG表达的无偏聚类9组(G1 ~ G9)的生成
并且基于sc的儿童和成人队列临床分层
研究表明与健康对照组相比,cSLE患者的细胞中表达增加的干扰素刺激基因(ISGs)能够区分两组。高ISG表达特征(ISGhi)来自于主要细胞类型中少数经转录学定义的亚群,包括单核细胞、CD4+和CD8+ T细胞、自然杀伤细胞、传统树突状细胞(cDCs)、浆细胞样树突状细胞(pDCs)、B细胞,尤其是浆细胞。富含ISGs和/或单基因红斑狼疮相关基因的独特亚群的扩增与疾病活动度最高的患者相关。
对来自成年SLE患者的约82,000个外周血单个核细胞(PBMCs)的分析证实了在疾病活动度最高的患者中存在类似的亚群扩增。