分享是一种态度
从2020年Nature Methods把空间转录组技术评为“年度技术”算起,到现在已经3年了,空间转录组的文章已经越来越多,PubMed上随便一搜就是几千篇。
虽然空间转录组最开始在发育生物学等基础研究上用得最多,但现在在临床疾病的研究里也很经常用到了。尤其是它可以把疾病组织病理的特征和转录组的空间异质性结合起来,这一点就特别适合临床科研。
尤其现在生信端也有了很多新的算法,比如Nature Methods去年发表的 Sprod算法,结合空间位置和病理切片信息来降噪[1]。Nature Computational Science前些天刚发表了新算法 STAligner,可以整合多张切片的空间转录组信息[2]。相比以前,空间转录组的分析肯定也是越来越方便了。所以正好趁这个机会来捋一捋这块的应用。
早期阶段
小样本量,免疫微环境分析
临床疾病方面,空间转录组用得最多的肯定还是肿瘤这块,毕竟相对来说还是比较热的方向。而且肿瘤诊疗本身对空间异质性就比较关注。像NCCN结直肠癌指南里面就提到一个叫Immunoscore的检测,测的就是免疫细胞浸润的分布情况。所以空间转录组在肿瘤方向的应用,也是比较顺理成章的。
空间转录组的商业化平台最早是2016年出来的,2018年就已经有一些文章发出来了,但最开始例数都不多,都只有个位数。比如Cancer Research上的一篇黑色素瘤淋巴结转移活检的空间转录组文章[3],只用了4个样本,发现靠近肿瘤区域的淋巴结区域转录特征和肿瘤微环境很类似(图1),这种对肿瘤微环境的挖掘很难用其它工具代替,即使单细胞转录组也没法准确反映空间信息。所以后面空间转录组的文章也越来越多。
图1. 黑色素瘤转移淋巴结的空间转录组分析
除了肿瘤之外,另外一个很适合用空间转录组研究的方向就是和免疫细胞相关的疾病,比如炎症类疾病。2018年就有一个挺有意思的研究,做的是牙周炎的活检样本,也是例数很少,一共就6例[4],放今天简直不可想象。这个研究发现,用空间转录组可以区分炎症区域和非炎症区域,通过差异基因的分析可以在炎症区域的结缔组织中发现里找到与慢性炎症相关的特异性上调基因表达(图2)。其实这个分析现在回头看并不复杂,但在当时确实其它技术没法做到的,能够在很小的一片病理区域里分析得到异质性的信息,还能找到关键的基因。
图2. 牙周炎组织中炎症结缔组织部分特异性高表达基因(红色区域)
发展阶段
FFPE样本,列数变多,结合临床
从2019年开始,每篇文章用的样本例数就慢慢多起来了。除了科研越来越卷以外,更主要的是有了可以在FFPE(石蜡包埋)样本上用的商业化空间转录组平台。毕竟临床能拿到的样本里,FFPE样本肯定是大多数。而且如果要做回顾性研究的话,FFPE样本也是最方便也最好拿到的。
所以,到2020年,肿瘤方面的空间转录组文章,比如Emory大学发在JCI Insight上的一篇关于的胰腺导管腺癌的文章,就壕气地纳入了24例接受不同新辅助治疗方式的样本,都是FFPE样本,做了一个高分辨率的肿瘤免疫微环境图谱,来理解不同治疗方式对肿瘤微环境的影响[6]。
2022年巴黎大学在Immunity上发了一篇关于肾细胞癌的空间转录组文章,研究了肾细胞癌的三级淋巴结构[7](话说这篇被好多公众号解读过),也是24例样本,有一半是FFPE样本。这种结合特殊病理结构的分析,属于特别适合空间转录组的应用方向。
其它疾病方向也有不少,尤其是免疫相关的疾病,比如心脏结节病[8]、银屑病[9-10]等,都有人做空间转录组。今年发在Science Immunology上这篇银屑病的很有意思[9],针对不同严重程度的银屑病做了分析,发现了一些可区分轻度和中重度银屑病的细胞类型分布特征及基因表达特征(图3),对临床诊疗应该是能提供一些新方向的。
图3. 空间转录组揭示不同严重程度的银屑病空间基因表达特征,并通过免疫荧光得到验证
未来在哪?
空间非编码RNA
空间转录组做得多了,有个问题不知道大家有没有发现:现在的方法基本上都是做mRNA,要想做非编码RNA的话难度很大。
但现在非编码RNA确实是越来越热的,尤其是在临床疾病研究里面,从大概02、03年开始文章逐渐增多,一点都不比空间转录组势头差。而且非编码RNA确实和很多疾病的发病机制都有关系。比如在急性髓系白血病里,长链非编码RNA(lncRNA)HOTTIP是和发病有关的癌基因之一 [11]。在炎症里,lncRNA和小RNA(miRNA)可以通过3'-UTR或SIRT1和NF-κB通路对促炎和抑炎因子进行调控,从而影响炎症疾病、自身免疫病、癌症等的发生和进展[12]。
而且非编码RNA其实很多,占到基因序列的98%。以前大家都一股脑地去做mRNA的表达,非编码RNA火起来之后才发现,还有非常多有待挖掘的东西。
另外,和mRNA相比,非编码RNA还有个优点,就是有一些非编码RNA(比如lncRNA)的表达,组织特异性和细胞类型特异性比mRNA更好(图4),有些还能调控mRNA的时空表达[13-14]。所以这些非编码RNA非常适合用来做空间转录组研究,它们的空间异质性可能可以提示很多和疾病机制有关的东西。
图4. 人体各组织lncRNA tSNE分析,显示明显的组织特异性表达
那为什么现有的商业化空间转录组平台都不做非编码RNA呢?这其实是个技术路线问题。现在最主流的几个商业化平台,要么是用polyd(T)探针结合mRNA的polyA尾,要么用靶向探针结合编码区的特定序列,很难获得非编码RNA的信息。这也可以理解,毕竟以前大家都专注于mRNA的分析。但现在毕竟大家关注点慢慢越来越广了,能够分析非编码RNA的空间转录组技术肯定是未来的大势所趋。
最近看到的,就是M20 Genomics发布了一个叫M20 Spatial的新空间转录组技术。这个技术是基于随机引物技术路线,和之前其它平台的路线不太一样。从技术上来讲,随机引物确实是可以不局限在编码区的,那就可以拿到非编码区的序列。从原理上讲,随机引物还有个优点,就是理论上可以无偏地拿到全长的序列,毕竟不会像polyd(T)探针或者靶向探针那样只拿到一部分编码区的序列。那就可以做一些融合基因、可变剪接或者突变方面的分析,这对很多疾病尤其是肿瘤的研究还是蛮有意义的[15]。
图5. 肿瘤切片中细胞克隆型等的空间分布能给临床病理提供重要的补充信息
从M20 Genomics官方给的数据来看,确实是能拿到lncRNA的空间数据的,整个gene body的无偏覆盖也还不错。另外一个优点是能在各种样本类型里面用,包括FFPE样本。那对临床疾病的研究来说就很方便了,直接能够在保存的FFPE样本里分析mRNA和非编码RNA,以及可变剪接、突变等等。
考虑到lncRNA的组织和细胞特异性很好,在对于空间异质性的分析上大概率能得到更精细的信息。而且有些非编码RNA参与mRNA的表达调控,放一起分析的话有可能能在机制上做得更深。
期待一下这个技术的相关产品,好像叫NATA系列?也希望有更多新技术帮大家开拓新的研究方向,这样大家也可以少点互相卷,多点有意思的新发现。
参考引文: