文章标题:《Single-Cell RNA Sequencing Analysis Reveals a Crucial Role for CTHRC1 (Collagen Triple Helix Repeat Containing 1) Cardiac Fibroblasts After Myocardial Infarction》
发表日期和杂志:2020年发表在HHS Public Access上
在线阅读链接:https://doi.org/10.1161/circulationaha.119.044557
心肌梗死(MI)后,用单细胞和bulk RNA-seq、ATAc-seq和功能测定对胶原-1GFP+CF进行鉴定。
从健康心肌以及梗死后7天、14天和30天(DPI)分离了假定的CF(GFP+/CD31−/CD45−)、内皮细胞(GFP−/CD31+/CD45−)和骨髓来源细胞(GFP−/CD31−/CD45+)
数据链接是:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE132146
提供了h5格式文件,不过我们直接下载后使用Read10X_h5()函数读取即可。
###### step1:导入数据 ######
dir='GSE132144_RAW'
samples=list.files( dir )
samples
sceList = lapply(samples,function(pro){
# pro=samples[1]
print(pro)
sce =CreateSeuratObject(counts = Read10X_h5(file.path(dir,pro)) ,
project = gsub('_FilteredGeneBCMatrices.h5','',gsub('^GSM[0-9]*_','',pro) ) ,
min.cells = 5,
min.features = 300 )
print(sce)
return(sce)
})
names(sceList)
# gsub('^GSM[0-9]*','',samples)
sce.all=merge(x=sceList[[1]],
y=sceList[ -1 ],
add.cell.ids = gsub('_FilteredGeneBCMatrices.h5','',gsub('^GSM[0-9]*_','',samples) ) )
as.data.frame(sce.all@assays$RNA@counts[1:10, 1:2])
head(sce.all@meta.data, 10)
table(sce.all$orig.ident)
在批量读取数据之前,一般要先读取一个数据用来进行测试,确认无误后,再使用循环批量读取全部的数据用于后续的分析。
后面就是标准分析啦,对读取进来的数据进行质控、harmony整合以及细分亚群定义等。
分析了GFP+ CF的单细胞转录组,每个时间点的转录组(7079个健康细胞;10448个细胞,7dpi;14dpi下8337个细胞;和6,805个细胞在30dpi下)进行质量控制过滤,并使用典型相关方法合并为29,176个单个细胞的单一数据集。
对全局数据集的无监督聚类显示了11个GFP+细胞簇。其中10个簇(a - j)代表不同的成纤维细胞亚群,以高水平的成纤维细胞相关分子为特征,而簇K包含经典周细胞标志物高表达的群体。
为了探索不同簇在心肌梗死期间的潜在作用,分析了每个簇中细胞百分比的变化。发现簇F和H-K在不同的时间点保持不变,而簇B在MI后表现出显著的变化。
通过GO富集分析发现,与其他集群相比,B集群的转录特征在与细胞外基质组织、细胞增殖和细胞-底物黏附相关的途径上显著丰富。
进一步探究发现,B簇代表梗死心肌中活化的Periostin+成纤维细胞亚群,在修复性心脏纤维化过程中发挥主要作用。因此,将这些细胞命名为修复性心脏成纤维细胞(RCF)。
RCF反应的分子调控特征
利用公开可用的ChIP-seq数据集来鉴定其结合模式在RCF基因附近富集的TF,确定了几个TF,如SOX9和SMAD3。
RCF的一些顶端标记基因也显示出SOX9的结合基序。
分析发现Sox9在培养的CF中过表达诱导23%的RCF特征(28个基因,FC>1.5 p值<0.05),与CF激活的经典调节因子TGF-β(33个基因,FC>1.5 p值<0.05)孵养CF后观察到的反应相似
对7dpi的Ctrc1-KO心脏(4,189个细胞)的scRNA-seq分析显示,与WT小鼠相比,RCF样细胞的百分比增加