文章标题:《Single-cell RNA sequencing demonstrates the molecular and cellular reprogramming of metastatic lung adenocarcinoma》
发表日期和杂志:2020年发表在Nature Communications上
在线阅读链接:https://doi.org/10.1038/s41467-020-16164-1
对来自44例患者58个肺腺癌的208,506个细胞进行了单细胞RNA测序(scRNA-seq),其中包括原发肿瘤、淋巴结和脑转移、胸腔积液以及正常肺组织和淋巴结。
非小细胞肺癌(NSCLC)在组织学上分为腺癌、鳞癌和大细胞癌。肺腺癌(LUAD)是最常见的类型,约占所有肺癌的40%。LUAD通常在转移期被发现,流行于大脑、骨骼和呼吸系统。
数据链接是:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE131907
提供了标准化且取过log2之后的文件,不过我们直接下载UMI_matrix.txt.gz即可,下载好之后使用fread()函数读取即可。
###### step1:导入数据 ######
a=fread('inputs/GSE131907_Lung_Cancer_raw_UMI_matrix.txt.gz',
data.table = F)
a[1:4,1:4]
rownames(a)=a[,1]
a=a[,-1]
kp1 = grepl('LN',colnames(a))
table(kp1)
kp2 = grepl('T',colnames(a))
table(kp2 )
a[1:4,1:4]
dim(a)
sampl = paste0(phe[,2],phe[,3])
sceList = lapply(unique(sampl) ,function(pro){
# pro=unique(sampl)[1]
print(pro)
sce =CreateSeuratObject(counts = a[,sampl %in% pro],
project = gsub( '_matrix','',pro) ,
min.cells = 5,
min.features = 500 )
return(sce)
})
names(sceList)
sce.all=merge(x=sceList[[1]],
y=sceList[ -1 ] )
as.data.frame(sce.all@assays$RNA@counts[1:10, 1:2])
head(sce.all@meta.data, 10)
table(sce.all@meta.data$orig.ident)
library(stringr)
phe=str_split( colnames(sce.all),'_',simplify = T)
head(phe)
table(phe[,2])
table(phe[,3])
gplots::balloonplot(table(phe[,2],phe[,3]))
sce.all@meta.data$patient=paste0('p',phe[,3])
sce.all@meta.data$group=phe[,2]
head(sce.all@meta.data)
table(sce.all@meta.data[,4:5])
在批量读取数据之前,一般要先读取一个数据用来进行测试,确认无误后,再使用循环批量读取全部的数据用于后续的分析。
后面就是标准分析啦,对读取进来的数据进行质控、harmony整合以及细分亚群定义等。
将208,506细胞分类为九个不同的细胞谱系,以规范的标记基因表达,从而确定上皮细胞(肺泡细胞和癌细胞)、间质细胞(成纤维细胞和内皮细胞)和免疫细胞(T、NK、B、髓系和肥大细胞)是常见的细胞类型,只有在脑转移瘤中才有少突胶质细胞(MBrain)。
发现与正常肺组织(非肺)相比,早期和晚期肺癌(分别为t肺和TL/B)中T和B淋巴细胞的增加以及自然杀伤细胞(NK)和髓系细胞的减少,表明适应性免疫反应的激活。
与正常淋巴结(NLN)不同,转移性淋巴结(MLN)含有大量的髓样细胞,这表明髓样细胞浸润与转移有关。MBrain样本中含有可检测到的免疫细胞(T、B和NK细胞)以及常驻的少突胶质细胞和髓样细胞(小胶质细胞)。
对正常上皮细胞和手术切除的肿瘤细胞的比较分析,探索腺癌细胞的内在特征。使用明确的肿瘤和正常的上皮细胞,构建了一个转录轨迹来调整患者间的基因组异质性,并找到控制肿瘤进展的关键基因表达程序。
轨迹中的转录状态显示了肿瘤的正常分化路径以及与进展相关的变化。发现纤毛上皮细胞和肺泡细胞位于不同的轨迹分支,标志着它们不同的分化状态。其次,杆状细胞位于纤毛分支和肺泡分支之间,表明其处于中间分化状态。最后,肿瘤细胞形成了一个分支结构,沿着正常的上皮细胞有两种转录状态(Ts1和Ts3);但观察到一种(Ts2)明显位于Ts1和Ts3分支的两端。
分析发现大多数S1和S3相关基因在肿瘤细胞和正常细胞之间共享但存在差异调节,并与维持表面活性物质动态平衡、肺泡发育和纤毛运动的正常上皮功能相关,S2相关基因表现出明确的肿瘤导向特征,如积极的细胞运动和异常增殖或凋亡。
因此,Ts1和Ts3状态代表了正常分化程序的去调节,而TS2肿瘤细胞状态完全偏离了正常的转录程序。
LUAD患者在不同的部位同时含有Ts1和Ts2肿瘤亚群,其中Ts3的数量较少。
从晚期活检或转移(TL/B、MLN和mBrain)分离的肿瘤细胞的TS2特异性基因表达增加,表明与肿瘤进展和转移有关
Ts2标志性基因高表达患者的总体生存率(双侧对数列检验 )比低表达患者差。相比之下,肺鳞状细胞癌(LUSC)的生存率没有差异,这表明TS2信号明显参与了LUAD的进展。
文章分析的非常细致且逻辑严密,这里不一一展示了,感兴趣的可以阅读了解一下!
往期回顾
单细胞测序最好的教程(十):万能的Transformer与细胞注释