文章标题:《Single-Cell Genomics Reveals a Novel Cell State During Smooth Muscle Cell Phenotypic Switching and Potential Therapeutic Targets for Atherosclerosis in Mouse and Human》
发表日期和杂志:2021年发表在Circulation上
在线阅读链接:https://doi.org/10.1161/circulationaha.120.048378
为了揭示动脉粥样硬化过程中平滑肌细胞(SMC)的转分化轨迹,并确定疾病治疗的分子靶点,文章结合了SMC命运映射和小鼠与人类动脉粥样硬化斑块中的单细胞RNA测序。还对分离的SMC来源细胞进行了细胞生物学实验,进行了综合性的人类基因组学研究,并在体内外进行了针对SMC来源细胞的药理学研究。
数据链接是:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE155513
可以看到一共是14个样品进行分析:
GSM4705592 ZsGreen1+ Ldlr KO 0 week WD
GSM4705593 ZsGreen1- Ldlr KO 0 week WD
GSM4705594 ZsGreen1+ Ldlr KO 8 weeks WD
GSM4705595 ZsGreen1- Ldlr KO 8 weeks WD
GSM4705596 ZsGreen1+ Ldlr KO 16 weeks WD
GSM4705597 ZsGreen1- Ldlr KO 16 weeks WD
GSM4705598 ZsGreen1+ Ldlr KO 26 weeks WD
GSM4705599 ZsGreen1- Ldlr KO 26 weeks WD
GSM4705600 ZsGreen1+ ApoE KO 8 weeks WD
GSM4705601 ZsGreen1- ApoE KO 8 weeks WD
GSM4705602 ZsGreen1+ ApoE KO16 weeks WD
GSM4705603 ZsGreen1- ApoE KO 16 weeks WD
GSM4705604 ZsGreen1+ ApoE KO 22 weeks WD
GSM4705605 ZsGreen1- ApoE KO 22 weeks WD
作者给出来的数据是matrix.txt.gz的数据格式,下载需要的数据,然后按照txt.gz格式数据读取方式,将数据导入进行分析即可:
GSM4705592_RPS003_matrix.txt.gz 6.9 Mb
GSM4705593_RPS004_matrix.txt.gz 6.0 Mb
GSM4705594_RPS011_matrix.txt.gz 5.1 Mb
GSM4705595_RPS012_matrix.txt.gz 2.7 Mb
GSM4705596_RPS007_matrix.txt.gz 9.8 Mb
GSM4705597_RPS008_matrix.txt.gz 5.0 Mb
GSM4705598_RPS001_matrix.txt.gz 11.4 Mb
GSM4705599_RPS002_matrix.txt.gz 5.0 Mb
GSM4705600_RPS017_matrix.txt.gz 6.9 Mb
GSM4705601_RPS018_matrix.txt.gz 4.0 Mb
GSM4705602_RPS013_matrix.txt.gz 7.6 Mb
GSM4705603_RPS014_matrix.txt.gz 3.3 Mb
GSM4705604_RPS015_matrix.txt.gz 8.2 Mb
GSM4705605_RPS016_matrix.txt.gz 4.4 Mb
单细胞数据分析流程:
###### step1:导入数据 ######
library(data.table)
dir='GSE155513_RAW/'
samples=list.files( dir )
samples
sceList = lapply(samples,function(pro){
# pro=samples[1]
print(pro)
ct=fread(file.path( dir ,pro),data.table = F)
ct[1:4,1:4]
rownames(ct)=ct[,1]
ct=ct[,-1]
sce=CreateSeuratObject(counts = ct ,
project = gsub('.txt.gz','',strsplit(pro,'_')[[1]][2]),
min.cells = 5,
min.features = 300,)
return(sce)
})
names(sceList)
samples = gsub('_matrix.txt.gz','',samples)
samples
samples = gsub('^[1-9]-','',samples)
samples
names(sceList) = samples
names(sceList)
sce.all <- merge(sceList[[1]], y= sceList[ -1 ] ,
add.cell.ids = samples)
as.data.frame(sce.all@assays$RNA@counts[1:10, 1:2])
head(sce.all@meta.data, 10)
table(sce.all@meta.data$orig.ident)
后面就是标准分析啦,对读取进来的数据进行质控、harmony整合以及细分亚群等。
文章中综合数据的UMAP聚类分析,展示了所有scRNA-seq数据的聚类分群情况。
通过BioinfoArk提供的中国区chatGPT查询到各个细分亚群的解释:
通过SMC标记Myh11和fc相关基因Fn1的基因表达趋势
文章对在人颈动脉粥样硬化中发现了与小鼠中间SEM细胞状态相对应的细胞状态
ARACNe网络显示出通过metaVIPER从Ldlr-/-小鼠16周高脂饮食的ZsGreen1+ scRNA-seq数据中识别出的前50个激活的(红色大圆点)和被抑制的(蓝色大圆点)MR(转录调节因子),以及它们的预测目标基因(浅蓝色小圆点)。
突显了MR涉及的一些经典细胞信号通路。Vcam1和Ly6c1以深红色文字显示,作为视黄酸(RA)信号传导的转导体CRABP2的预测靶基因。
该文章研究发现在动脉粥样硬化中,平滑肌细胞转变为中间细胞状态,这种转变也在颈动脉和冠状动脉的人类动脉粥样硬化斑块中发现。衍生自平滑肌细胞的中间细胞被称为“SEM”细胞,具有多能性,可以分化为类似巨噬细胞和纤维软骨细胞的细胞,并恢复到平滑肌细胞的表型。
视黄酸(RA)信号传导被发现是平滑肌向SEM细胞转变的调控因子,且在人类动脉粥样硬化的症状中RA信号传导失调。人类基因组学研究发现冠状动脉疾病(CAD)的全基因组关联研究(GWAS)信号在RA信号传导靶基因位点上富集,并且CAD风险等位基因与这些基因的抑制性表达之间存在相关性。