作者 | 崔雅轩 编辑 | 陈兴民
今天给大家带来一篇发表在nature biotechnology上研究空间转录组的文章。最近的空间基因表达技术能够在保留空间背景的同时全面测量转录组谱。然而,现有的分析方法并没有解决技术的分辨率或有效地利用空间信息。在这里,作者介绍了贝叶斯空间,一种完全贝叶斯统计方法,它利用来自空间邻域的信息来提高空间转录组数据的分辨率和聚类分析。作者将BayesSpace与目前的空间和非空间聚类方法进行了基准测试,并表明它改进了对来自大脑、黑色素瘤、浸润性导管癌和卵巢腺癌样本中不同的组织内转录谱的识别。利用免疫组化和由scRNA-seq数据构建的硅质数据集,作者发现贝叶斯空间解决了在原始分辨率下无法检测到的组织结构,并识别了组织学分析无法获得的转录异质性。
一、研究背景
近几年兴起的空间转录组技术提高了传统空间检测方法(如 FISH、ZipSeq 等)的通量,但依然存在分辨率的局限性,并且现有的空间基因表达数据分析方法不能解决技术分辨率问题,而导致组织空间信息不能得到有效的利用。在空间转录组的分析中除了分辨率问题,另一个难点是如何获得更接近组织学特征的聚类结果,目前的分析多是基于 scRNA-seq 的聚类算法,忽略了空间相邻点之间的相似性,而作者希望聚类结果在空间坐标中更接近组织学特征的同时,也能找到空间特异的基因表达模式。
二、模型与方法
文章介绍,BayesSpace通过对低维的基因表达矩阵进行建模,并通过空间先验知识诱导真实的邻近点聚集,以此进行推广,从而实现空间聚类。这种方法来自于此前开发的用于图像分析和微阵列数据的空间统计方法。与已有的方法相比,BayesSpace允许对聚类结构和错误项进行更灵活的调整和规范。
图 1:BayesSpace 工作流程
为了检测BayesSpace的性能,研究人员使用Maynard等人公开发表的12个背外侧前额叶皮层 (DLPFC) 样本的Visium空间表达谱数据,以及每个样本的6个皮质层和白质的手工注释,这些是作为R包spatialLIBD的一部分。借助该数据集,研究人员评估了BayesSpace识别不同皮层特定表达轮廓的能力,并将其性能与其他空间和非空间聚类方法进行比较。
图 2:BayesSpace 提高了 DLPFC 中各层的计算分辨率
接着作者分析了浸润性导管癌(IDC)和卵巢内膜腺癌(OC)肿瘤区域的免疫细胞,发现免疫荧光信号(CD3,CD45)与增强的相关基因相关性好。然而在 spot 水平和增强聚类相关的感兴趣区域,发现增强基因表达提高了组织异质性的分辨,并且许多 subspot 从免疫丰富变成了免疫贫乏,也有相反的情况。
为了进一步量化增强分辨率的改善程度,比较了增强后改变和未改变分类的 subspot 之间的免疫荧光强度分布,发现增强后分类改变的 subspot 的密度显著高于未改变的 subspot,说明 BayesSpace 分辨率增强提高了基于基因表达的聚类与免疫组化信号匹配的准确性。
图3:免疫组化验证了BayesSpace在一个IDC样本和一个OC样本中的增强
BayesSpace 在模拟数据中的表现优于空间和非空间聚类方法,多次模拟结果显示 BayesSpace 空间聚类和分辨率增强能够识别在 spot 水平上不明显的淋巴样结构,接近单细胞水平,优于现有的聚类分析方法。
图 4:BayesSpace 使用模拟数据优于空间和非空间聚类方法
三、总结
作者在多种组织中对 BayesSpace、非空间聚类算法和空间聚类算法进行测试,确定了BayesSpace 在空间聚类精确度和分辨率上的优越性能,并通过多个数据集验证了BayesSpace 能够增强基因表达,有效提高空间转录组分辨率,识别组织的异质性,基因表达模式的识别接近单细胞水平,并且经免疫组化和组织特异性 marker 基因表达验证,确定其与组织学特征的一致性,优于现有的空间聚类算法。
参考文献
https://www.nature.com/articles/s41587-021-00935-2