今天学习一篇单细胞+空间转录组分析比较经典的文献,这篇文章大家应该都很熟悉了:
文献标题:Integrating microarray-based spatial transcriptomics and single-cell RNA-seq reveals tissue architecture in pancreatic ductal adenocarcinomas
2020年三月份发表在 Nat Biotechnol(IF46.9/Q1)上,因为经典,所以值得再回顾一次文章思路~
本文结合了同一样本的单细胞与空间转录组数据分析,介绍了一种多模态交叉分析的方法MIA,对空间转录组数据进行了单细胞亚群注释。将多模态交叉分析应用于原发性胰腺肿瘤,作者发现导管细胞、巨噬细胞、树突状细胞和癌细胞的亚群具有空间受限的富集,并与其他类型的细胞有不同的共富集。此外,作者鉴定了炎症成纤维细胞和表达应激反应基因模块的癌细胞的共定位。
作者对两个病人的新鲜组织同时进行了配对的单细胞与空间转录组数据分析(图a):PDAC-A and PDAC-B。单细胞测序分别在PDAC-A 和 PDAC-B两个样本中鉴定到15个和11个不同的亚群(图b)。相同细胞类型的基因表达谱显示患者样本之间有很强的相关性,验证了样本间聚类的注释(图1c)。
InferCNV鉴定恶性细胞:在PDAC-A中检测到两个cluster、PDAC-B中一个cluster显示异常的CNV谱(图1d,e)。此外,两个样本中沿6号染色体的缺失和PDAC- B谱中沿7号染色体的扩增与细胞遗传学数据中PDAC中最常见的染色体异常一致。PDAC-A 样本中的 cancer cluster 1 和 2 分别高表达 TM4SF1 与 S100A4 基因,而 PDAC-B 样本中 cancer cluster 也 高表达TM4SF1(补充图2b),表明PDAC-A cancer cluster 1 和 PDAC-B cancer cluster 之间存在相似性。
实验验证癌细胞亚群:对来自同一病人的FFPE样本进行 TM4SF1 和 S100A4 的双免疫荧光染色,结果显示:
以上结果证实了在PDAC-A样本中存在基因和转录上不同的癌细胞群。
冰冻切片采用H&E染色成像,并对切片进行了不同的组织学特征注释(图2a,b)。
PDAC-A肿瘤切片定义了四个主要区域:癌细胞和结缔组织增生(cancer cells and desmoplasia)、非恶性导管上皮(nonmalignant duct epithelium)、间质(stroma)和正常的富含腺泡的胰腺组织(normal acini-rich pancreatic tissue)(图2a和补充图3a-d);
PDAC-B组织切片(图2b):不包含正常的胰腺组织,但癌症附近存在间质间隙。
空间测序结果显示:每个ST Spot捕获了大约20-70个细胞,不同组织区域的spot中捕获的细胞数变化大。如与胰腺腺泡等细胞密度高的区域相比,结缔组织密集(细胞含量较低)区的每个spot细胞数量较低。每个spot检测到大约2400个UMIs和1000个基因。图2c,d显示特征基因的空间表达与注释的组织学区域相匹配。空间数据的聚类分析结果显示与病理学注释高度一致(图2e、f)。
为了整合单细胞与空间数据,作者开发了MIA方法,此方法原理:超几何分布检验:单细胞数据的亚群特征marker基因与空间转录组区域marker基因之间是否显著的重合(图2g)。
MIA结果显示:与stromal region相比,cancer region显著富集fibroblasts(图2h),导管上皮区域(duct epithelium region)主要富集导管细胞,而胰腺组织(pancreatic tissue)主要富集腺泡细胞和内分泌细胞(P<10−10)。
单细胞数据结果显示胰腺外分泌系统的两种主要组成细胞类型之一为表达KRT19的导管细胞,作者对这类细胞进行了细分。
ductal cells亚群细分(图3a-d):
其中,导管群与抗原呈递导管细胞是新发现的细胞亚群。
双免疫荧光检测:对存档的FFPE患者组织进行双免疫荧光检测时,发现亚群标记物与导管标记物KRT19共定位,证实了这些导管细胞亚群的存在(图3e-h)。
四个导管细胞亚群在空间上的分布:
使用MIA分析,发现PDAC-A中的所有导管亚群都富集于组织的导管区域。相比之下,只有缺氧导管细胞群和末端导管细胞群在癌症区域显著富集(P<10−4;图3i),这些导管细胞所表现出的转录表型可能反映了来自周围组织的环境信号,癌症区域的导管细胞可能由于低氧含量而表达缺氧反应基因。PDAC-B中的导管亚群均只富集于组织的导管中(P<10−4;图3j)。
此外,作者还分析了其他亚群在空间上的一个分布定位情况,可以详细查看文章细节。
Note:重温到这里,我觉得这个方法有一个不足的地方,就是他没有办法展示这个细胞亚群在实际的组织切片中的一个空间分布情况,而是只有上面这样的一张交汇热图。
PDAC-A样本中的两个癌细胞亚群具有不同的转录组特征(图1b-e),这两种癌症群体都在相应的ST癌症区域高度富集(图2h)。问:它们是否与该区域内不同的细胞类型共定位?
为了解决这个问题,作者处理了来自同一PDAC-A肿瘤不同区域的另外两个组织切片以进行ST分析。方案确保了scRNA-seq数据代表所有ST切片:首先将肿瘤分为三个部分,然后每个部分分为ST和scRNA-seq。
在PDAC-A-1样本的癌症亚区2中,发现只有癌症cluster1亚群与成纤维细胞一起富集。在三个PDAC-A组织切片中,我们观察到成纤维细胞在癌簇1高富集而癌簇2弱富集或不富集的组织区域富集(图4d)。这一模式提示癌簇1细胞可能在组织中引起一种特殊的基质反应,或者癌簇2细胞与组织中的成纤维细胞相互排斥。
由于ST提供了空间信息,那么是否可以使用MIA方法将癌细胞状态映射到不同的空间组织区域,并描述它们与其他细胞类型的相互作用呢?这个分析新增了一个了病人样本C的单细胞测序,然后将A,B,C合并进行分析,在PDAC癌细胞中定义三个基因表达模块(图5A):hypoxia-response,oxidative phosphorylation,stress-response。作者对其中的stress-response模块比较感兴趣,该模块中的几个基因参与了细胞生长的调控和侵袭性。
基于stress-response模块基因表达的高低,将空间spot分成了两类(图5b),接着使用MIA分析定义的low-spots与high-spots区域与细胞亚群的重叠。PDAC-A-1 高表达spot区域显著富集炎性成纤维细胞(图5c),其他空间组织切片结果一致。
假设:如果应激反应癌细胞和炎性成纤维细胞的共定位反映了这些细胞之间的功能关系,那么在整个肿瘤的水平上也可以检测到相关性。
公共数据验证TCGA PDAC:在这些数据集中,应激反应基因模块与炎性成纤维细胞特征显著相关(图5d)
免疫荧光实验验证:癌细胞进行KRT19免疫荧光染色,发现了IL-6和恶性细胞之间存在共定位的证据(图5e)
H&E染色:免疫荧光切片附近的组织切片进行H&E染色,证实了整个组织切片上的上皮细胞确实与恶性细胞相对应(图5e)
转移性黑色素瘤(Tirosh et al.):单细胞数据分析鉴定了三个T细胞亚群,空间数据聚类分析结果与组织病理学注释高度一致,MIA分析发现基质组织室主要由成纤维细胞和内皮细胞组成,这一结果在PDAC MIA图中也可以看到成纤维细胞和内皮细胞的共定位(图4c,d)。
总的来说,作者在单细胞与空间组学数据的联合分析上创新性的提出了MIA方法,并应用MIA方法做了一系列探索以及扩展了MIA在其他癌症和数据集上的应用。
文献信息如下:
下次见~