文章标题:《Single-cell RNA transcriptome analysis of CNS immune cells reveals CXCL16/CXCR6 as maintenance factors for tissue-resident T cells that drive synapse elimination》
发表日期和杂志:2022年发表在Genome Medicine上
在线阅读链接:https://doi.org/10.1186%2Fs13073-022-01111-0
研究背景
针对中枢神经系统(CNS)的新兴RNA病毒会导致幸存者的认知后遗症。
西尼罗河病毒(WNV)是一种与学习和记忆障碍有关的重新出现的RNA病毒。
对感染西尼罗河病毒的人类和小鼠的研究显示,小胶质细胞介导的突触消除在海马体内。此外,中枢神经系统驻留记忆T(TRM)细胞激活小胶质细胞,限制突触恢复,并导致WNV恢复小鼠的空间学习障碍。
单细胞实验设计
使用单细胞RNA测序检测了西尼罗河病毒恢复的小鼠前脑内的免疫细胞,以确定参与T细胞和小胶质细胞之间细胞间通讯的可能的配体-受体对。
对感染后25天(DPI)的C57BL/6模拟和WNV感染的小鼠的前脑组织(皮质和海马区)进行了scRNA-seq分析
数据链接是:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE212199
文章数据是包含了scRNA-seq以及bulk RNA-seq数据,我们只选择下载scRNA-seq进行分析
#samples
GSM6513450 Female Mock F1
GSM6513451 Male Mock M1
GSM6513452 Female WNV F2
GSM6513453 Male WNV M2
#数据详情
GSM6513450_F1_barcodes.tsv.gz 5.0 Kb
GSM6513450_F1_features.tsv.gz 272.8 Kb
GSM6513450_F1_matrix.mtx.gz 5.2 Mb
GSM6513451_M1_barcodes.tsv.gz 7.5 Kb
GSM6513451_M1_features.tsv.gz 272.8 Kb
GSM6513451_M1_matrix.mtx.gz 8.2 Mb
GSM6513452_F2_barcodes.tsv.gz 6.9 Kb
GSM6513452_F2_features.tsv.gz 272.8 Kb
GSM6513452_F2_matrix.mtx.gz 7.1 Mb
GSM6513453_M2_barcodes.tsv.gz 7.6 Kb
GSM6513453_M2_features.tsv.gz 272.8 Kb
GSM6513453_M2_matrix.mtx.gz 8.2 Mb
提供的是10X格式的标准三个文件,选择下载数据之后需要对数据进行整理,将三个文件分别整理到对应的文件夹中。
#整理文件
fs=list.files('./','features')
fs
samples1= gsub('.tsv.gz','',gsub('features.','',fs))
samples1
samples2 = samples1
lapply(1:length(samples2), function(i){
x=samples2[i]
y=fs[i]
dir.create(x,recursive = T)
file.copy(from= y ,
to=file.path(x, 'features.tsv.gz' ))
file.copy(from= gsub('features','matrix',gsub('tsv','mtx',y)),
to= file.path(x, 'matrix.mtx.gz' ) )
file.copy(from= gsub('features','barcodes',y),
to= file.path(x, 'barcodes.tsv.gz' ))
})
然后使用Read10X函数将数据读取进来即可进行后续的标准分析
#指定数据存放位置
samples=list.files("./GSE212199_RAW/outputs/")
samples
dir <- file.path('./GSE212199_RAW/outputs/',samples)
names(dir) <- samples
#读取数据创建Seurat对象
counts <- Read10X(data.dir = dir)
sce.all = CreateSeuratObject(counts,
min.cells = 5,
min.features = 300 )
dim(sce.all) #查看基因数和细胞总数
as.data.frame(sce.all@assays$RNA$counts[1:10, 1:2])
table(sce.all@meta.data$orig.ident) #查看每个样本的细胞数
head(sce.all@meta.data)
对读取进来的数据进行质控、harmony整合以及单细胞细分亚群定义等。
分析确定了西尼罗河病毒恢复的中枢神经系统中存在的九种主要细胞亚型
经过严格的质量控制,获得了4132个细胞。对数据归一化后,使用Seurat将细胞聚为9个不同的簇,并使用t-SNE进行可视化。
注释的九个簇包括四个小胶质细胞簇,两个T细胞簇,一个巨噬细胞簇,一个星形细胞簇,以及各种其他非神经元簇。
通过BioinfoArk提供的中国区chatGPT查询到各个细分亚群的解释:
通过差异基因表达(DEG)分析确定每个细胞簇的富集基因,并用于鉴定细胞簇,在两个实验组中并不是所有的簇都大量存在
鉴定了两个独特的激活小胶质细胞簇,其持续存在于wnv恢复小鼠的前脑中
通过差异表达测试来比较小胶质细胞簇1与0和1与3的区别——发现在集群1和集群3中,前25个显著上调的基因中发现了对MHC和抗原呈递重要的基因,如Cd74、H2-Ab1和H2-Eb1;并且与簇0相比,簇1和簇3中的P2ry12、CX3CR1、Tem119、Fcrls、Siglech、Gpr34和Hexb都显著减少
Cxcl16和Cxcr6在西尼罗河病毒恢复动物的前脑小胶质细胞和T细胞中表达上调