前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【Science】万字综述:空间组学将去何方

【Science】万字综述:空间组学将去何方

作者头像
Chris生命科学小站
发布2023-08-29 19:52:35
6710
发布2023-08-29 19:52:35
举报

编辑观点

所有的生物学都发生在空间中。在生物体中,细胞必须在三维组织中进行交互和组装。每个细胞的位置对于决定组织如何运作或在疾病中出现故障,与其内在性质一样重要。最近,许多技术已经被发明出来,可以在不将细胞从其自然环境中移除的情况下对其进行分析,测量基因表达和细胞基因组的调控景观,以及其在组织中的空间位置。在一篇综述中,Bressan等人描述了这些方法的特点,这些方法统称为空间组学,并讨论了它们需要解锁其全部潜力的缺失部分。 —Stella M. Hurtley和Gemma Alderton

摘要

空间组学被广泛宣称为生命科学的新前沿。这个术语涵盖了一系列技术,承诺将改变生物学的许多领域,并通过同时测量物理组织结构和分子特性,有望彻底革新病理学。尽管这个领域在过去5年已经成熟,但它仍然面临一些成长中的困扰:进入的门槛、稳定性、实验设计和分析的最佳实践不明确,以及缺乏标准化。在这篇综述中,我们系统地列举了空间组学技术的各种类型;强调了它们的原理、优势和局限性;并对这个极具潜力但仍难以驾驭的领域未来面临的最大挑战提出了一些观点和建议。

背景

就像单细胞测序已经革新了许多生物学领域一样,空间“组学”,即在完整的组织样本上就位测量分子参数,正准备赋予新一代科学发现新的力量。现在有大量的新技术能够实现基因和蛋白质表达、遗传突变、表观遗传标记、染色质结构和基因组组织的空间分析。这些方法大多源于传统技术,如免疫组化和原位杂交,或者通过将空间坐标转换为序列条形码来利用下一代测序的吞吐量。空间组学技术在分辨率、灵敏度和吞吐量等各个层面上有着巨大的差异。在采用的便捷性、与不同样本类型的兼容性、商业可用性、前期投资和每个样本的成本等方面也存在着相当大的差异。在这样一个丰富且不断发展的领域中,选择最佳的技术来解决特定的生物学挑战——仔细权衡每一种的优点和缺点——至关重要。

进展

过去几年,空间分子分析领域已经成熟。当前的RNA分析技术允许对厘米级样本的基因表达进行空间测量,许多情况下,可以达到单细胞分辨率。针对性的方法可以定量数千种转录本,包括那些非常低丰度的转录本,而非针对性的协议提供转录组全谱分析,甚至可以检测基因异构体和突变,其覆盖率接近于单细胞方法的分离。基于质谱或荧光成像的多重免疫组化协议同样可以用于在各种样本上分析数十到数百种蛋白质标记。最近的研究报告了其他类型的分子信息的获取方法,包括对数千个位点的基因组组织的空间分析,开放染色质和表观遗传标记,以及非针对性的原位DNA测序。同时捕获多种信息源的多组学技术也正在变得可用。随着这些方法变得更加可靠并被广泛采用,越来越明显的是,空间组学将大大促进许多生物学问题的阐明,其中在肿瘤学(如研究肿瘤异质性和微环境)、神经科学和生物发育等领域有着突出的例子。

展望

空间组学领域的未来发展趋势主要需要在三个方面进行:(i) 多组学,即同时测量不同的参数(例如,DNA,RNA和蛋白质);(ii) 提高广泛应用的可及性,使技术变得更加容易获取,更可靠,更强大;以及(iii) 改进的分析框架。随着技术的不断发展,我们需要更多地关注数据分析和实验设计。空间组学技术已经可以在单次实验中生成许多太字节的数据,这在数据处理、分析和可视化方面带来了巨大的挑战。样本复制、研究设计和批次校正的统计方法和指南也在落后,尽管它们正在快速发展。最后,随着未来越来越近,我们预见空间组学可能会发展为三维空间组学(在整个器官甚至生物体上操作)和空间-时间组学(在体内多次进行测量),为生物学的工具箱增添更强大和令人兴奋的工具。

正文

生物学中几乎所有看似无穷复杂的事物都发生在三维空间中。尽管我们都熟悉研究蛋白质和大分子机器的空间结构,但研究即使是简单生物或单个组织的结构,不仅需要解读数千到数百万个细胞的分子特征,还需要理解它们的空间环境是如何影响它们的行为的。最近在进行多重空间分子测量方面的创新激增,为生物研究开启了新的篇章,并使我们重新拥抱生命系统的复杂性。

这个旅程的第一步是单细胞“组学”技术的出现,这些技术作用于分离的组织。这些方法使我们能够发现新的细胞类型,为生物发育提供了新的视角,并启动了创建人类和小鼠组织全面目录的过程。然而,生物过程发生在空间环境中,组织中细胞的三维排列对它们的功能有深远的影响。例如,位置通过调节接触或短距离旁分泌信号,限制了细胞-细胞的交互,这创造了专门的生态位,如支持许多类型的组织干细胞的生态位。物理和化学性质的空间梯度也对每个尺度的生物过程的差异调控做出了贡献,但在多细胞生物的发育过程中尤其突出。尽管对分离的细胞或细胞核进行的测量具有无可争议的力量,但它们缺乏这一层信息。对这种知识的需求推动了“空间组学”的发展:这些方法能够在其原生三维环境中测量细胞的分子特性。

空间组学技术主要测量蛋白质及其修饰,或mRNAs,尽管现在开始出现空间基因组和表观基因组分析。与非空间对应物相比,这些方法提供了“浅层”的分析,通常空间分辨率与实验时间投入之间存在反比关系。尽管存在这些限制,这个新兴领域已经为包括动物发育和大脑结构以及与患者预后相关的肿瘤微环境特征等几个领域提供了大量且多样的见解。尽管我们正处于空间组学革命的起始阶段,但进展正在以极快的速度发生,很明显,这些方法将推动我们对生物学在上下文中的深入理解。

当前一代的空间分子分析工具

在组织切片上进行空间分子测量的想法并不新鲜。免疫组化(IHC)和原位杂交(ISH)已经使用了50多年。ISH和IHC都可以在一定程度上进行多重化,对应于在观察过程中可以区分的染料数量。然而,通过简单增加染料数量向“组学”级别测量的转变是不可能的。因此,空间组学技术依赖于其他方法。它们可能使用非显微方法,如质谱(MS)来检测分析物,进行染色和染料去除的周期以达到所需的复杂性,或利用高通量DNA测序和条形码的力量。

多重抗体分析

在过去的20年中,质谱已经成功地适应了原位测量。更近一代的质谱,通常被称为“质量细胞测定”(MC),基于检测与同位素纯净的镧系金属结合的抗体。每个抗体通过螯合聚合物与不同的金属结合。在成像过程中,激光逐像素蒸发组织。因为镧系元素在生物材料中基本不存在,而且它们的质量可以被非常精确地区分,所以这种方法允许对40多种不同的物种进行常规定量,且信噪比非常高。这种方法是两种被称为成像质量细胞测定(IMC)和多重离子束成像(MIBI)的空间成像技术的基础。尽管最初是为了通过抗体结合来检测蛋白质和蛋白质修饰而开发的,但这些方法已经通过产生金属结合的杂交探针进行了RNA成像的改造。然而,这些方法受到可区分质量的数量和更重要的,足够纯净金属的可用性的限制,考虑到一些矿石的稀缺性,这是一个非琐碎的问题。总的来说,这些因素限制了可达到的复杂性大约为50种物种。

尽管存在这种限制,空间质量细胞测定方法已经取得了极大的成功,部分原因是仪器和试剂的早期商业可用性。已经发表了数百篇使用这项技术的研究,涵盖了各种各样的主题。免疫学和癌症生物学特别受益于对肿瘤微环境进行详细特征描述的能力。一个例子是最近对大约500个人类乳腺癌样本的调查,该调查检测到特定的肿瘤微环境模式,并指出空间特征与患者预后强烈相关。

一种用于多重抗体成像的替代方法是基于在重复成像周期中检测传统标记的荧光抗体。在其中一些方法中,所有抗体一次性结合到样本上,然后通过二次探针进行周期性的检测,这些探针通常是与抗体上的“根”结合或连接的荧光寡核苷酸。在其他方法中,抗体本身在周期中结合,并在每轮检测后剥离或通过光漂白或化学切割使其无法检测。这些策略在循环速度和抗体优化方面都有各自的优点和缺点,但总的来说,它们相对于质谱有更大的数据生成能力。实际上,对于涉及大型样本收集的项目,循环成像方法可能是最可行的替代方案。

空间转录组学和基因组学

一系列被称为“空间转录组学”的技术的最终目标是在三维的整个组织样本中,以亚细胞分辨率测量每个基因和基因异构体的丰度。目前,没有任何技术能够达到这个目标。相反,每种协议在灵敏度、吞吐量、分辨率或易用性方面都有所妥协。目前,所有技术都在各种厚度的组织学切片上工作,并且可以大致被认为是“2D”方法,除了一些例外。

空间基因组分析基于四种主要策略:(i)显微切割方法,其中组织的特定区域被物理隔离或以其他方式标记,以便可以提取和处理它们的DNA或RNA;(ii)组合荧光原位杂交(FISH)后进行单分子成像,这允许计算在组织的给定区域中存在的mRNA分子的数量;(iii) mRNA分子的原位测序;或(iv)空间条形码方法,其中给定区域的DNA和mRNA与特定的预定DNA“条形码”链接,这允许它们在批量测序后通过计算映射回空间位置。这些方法将在下面详细描述。

显微切割和光隔离

显微切割可能是向分子分析添加空间信息的最明显方式,通过物理分离从特定区域纯化生物分子。激光捕获显微切割(LCM)常用于隔离小区域(数十到数百个细胞)进行RNA测序(RNA-seq),并可以达到单细胞分辨率。

最近的研究已经使用光,而不是物理切割,来空间选择要分析的区域。光可以用来触发反转录(RT)[体内转录组分析(TIVA)标签或光隔离化学(PIC)],切割报告者[Nanostring GeoMx],附加纯化标签(Syncell MicroScoop),或者去除阻止测序接头连接的阻断基团[光选择性测序(PSS)]。光也可以触发DNA条形码,或条形码组合,通过驱动它们的交联或与组织的杂交,附加到特定区域。然后使用条形码将读取重新分配到这些区域。

所有显微切割技术都有一些关键的优点和缺点:它们提供非常深入的分析,几乎达到批量测序的水平,并允许从单个细胞到整个区域定制感兴趣的区域。然而,它们的吞吐量相对较低(通常低于数百个位置),因为每个选定的区域都必须单独收集和处理。条形码方法部分地绕过了这个限制,但仍然大体上限制在最多数百个区域。

多重ISH

基于循环杂交的方法是单分子FISH(smFISH)的后代,smFISH是一套在组织中将单个mRNA分子解析为亚衍射荧光斑点的技术。为了使检测成为可能,这些协议需要多个探针绑定到同一个mRNA分子,要么是因为需要多个荧光团绑定到一个小区域以产生信号,要么是因为两个探针在几个核苷酸的距离内的并发结合触发了信号放大过程。smFISH通常被认为是RNA定量方法的“金标准”,因为它可以检测到非常低丰度的转录本,甚至可以检测到每个细胞的单个副本,因此,从它衍生出来的空间分析技术往往具有优秀的灵敏度。

所有循环FISH方法都有一些共同的元素:(i) 通过短DNA探针的杂交将组合条形码与转录本关联的方法;(ii) 通过荧光成像的循环读取条形码,逐元素地读取;(iii) 通过纯探针数量或信号放大产生足够的信号以实现检测的策略;以及(iv) 在每个周期后重置信号的方法。在顺序FISH(seqFISH)中,荧光染料标记的FISH探针直接与细胞mRNA杂交,并在每个周期通过脱氧核糖核酸酶(DNase)消化后去除,留下mRNA原位。在多重错误鲁棒FISH(MERFISH)中,探针包括一个mRNA结合区域和一系列与条形码元素对应的“报告者”区域,这些区域在二次杂交回合中被检测。这使得检测实际上独立于原始的RNA分子,并使该协议更能抵抗核糖核酸酶(RNase)污染,同时减少成像时间并使成千上万的目标成像成为可能。seqFISH的另一个版本,seqFISH+,遵循相同的方法。MERFISH和seqFISH+引入的另一个元素是通过使用来自信息理论的编码策略使组合条形码“错误鲁棒”,从而减轻杂交失败或非特异性结合的影响,这些影响由于成像的循环性质可能相当大。

在过去的几年里,MERFISH和seqFISH+都已经扩展到全转录组水平,适应于通过寡核苷酸结合的抗体同时检测mRNA和蛋白质,并通过添加信号放大策略以及组织嵌入和清除进行增强。MERFISH还已经适应于扩展显微镜,这是一种用于物理扩展样品以增加生物结构大小的技术。将MERFISH与扩展显微镜结合,允许识别那些否则彼此太接近而无法被识别为单个分子的转录本。MERFISH和seqFISH+在灵敏度、吞吐量以及优点和缺点方面实际上非常相似,只是在协议和条形码方案的细节上有一些技术差异。两者都已成功用于研究不同器官和组织中的空间基因表达,尽管它们的技术复杂性有繁琐的实施,这限制了它们的广泛采用,尽管最近MERFISH已经商业化并更易于使用。

尽管MERFISH和seqFISH是目前可用的两种主要基于杂交的原位转录组学方法,但还有一些其他技术与它们的一些关键元素相似。Ouroboros smFISH(osmFISH)是一种循环smFISH方法,它缺乏条形码方案,通过一个更简单的协议交换多路复用能力(每个周期只检测到几个转录本),该协议不受转录本丰度或密度的影响。Saber-FISH和Clamp-FISH基于不同的信号放大方法,并与“第一代”协议相比提供了显著改进的SNR,但它们还没有显示出能够检测到超过100个转录本。SCRINSHOT是一种类似的方法,专门设计用于在具有挑战性的甲醛固定石蜡包埋(FFPE)组织上检测大约30个转录本。一个更近期的协议,称为增强电FISH(EEL-FISH),使用电泳将细胞mRNA驱动到导电玻璃滑片的表面。然后去除组织,用多重FISH检测mRNA。组织去除导致SNR显著增加和速度大大提高。最后,这些技术的几种商业选项正在变得可用。这些解决方案中的许多都提供了对数千个基因的分析,并且可以选择对数十种蛋白质同时进行分析。

原位测序

与循环FISH协议密切相关的是原位测序技术。这一系列方法的前提是在组织切片内原位生成簇并执行高通量测序化学。最常用的测序技术是通过连接测序(而不是通过合成测序,这在传统的下一代测序中占主导地位)。所有这些协议的一个共同步骤是通过滚动圈放大(RCA)从检测到的转录本产生一个DNA“纳米球”(rolony)。为每个mRNA分子产生一个独立的rolony,允许转录本定量。最大读取长度为约30个核苷酸,因为由于许多变量在起作用,长读取在原位执行比在流动细胞上更为困难。

其中一个首次示例的方法,ISS,基于与mRNA杂交的padlock DNA探针。padlock探针要么产生探针末端的精确并列,这些末端通过连接连接在一起,要么留下一个由聚合酶填充然后连接的间隙。在前一种变体中,测序是在探针的非互补区域内的报告者条形码序列上执行的,而在后者中,读取间隙中存在的任何序列。这允许基因表达分析(其中计算对预设基因列表的杂交事件)或未靶向的单核苷酸多态性或突变的de novo测序(仍限于特定的基因列表)。随着时间的推移,该方法演变并通过替换连接测序与新形式的杂交测序(实际上是在带有条形码的rolonies上执行的专门的seqFISH-MERFISH)来改进,从而导致SNR增加。

与此同时的技术称为原位测序(FISSEQ)通过使用oligo(dT)引物的mRNAs的RT生成cDNA分子的循环化来生成RCA扩增子。该技术允许在空间中进行真正的“未靶向”测序,尽管只针对非常短的3'末端读取,并且以非常低的灵敏度(远低于总细胞转录本的1%)为代价,这是由于原位RT和cDNA循环化的低效率。

ISS和FISSEQ迅速产生了具有更高效率和改进特性的衍生方法。在STARmap中,使用两个探针而不是单个padlock探针,一个在结合时与另一个靠近起作用。这增加了灵敏度,尽管仍然不在基于杂交的方法的范围内。与传统的连接测序相比,测序化学也发生了变化并得到了改进。BaristaSeq通过优化填充间隙的padlock探针方法并使用Illumina合成测序进行检测来增加效率。最近,基于padlock的ISS方法和未靶向的FISSEQ方法都与扩展显微镜化学结合在一起,由于rolony信号的解集和样品清除,效率和SNR都得到了显著改善。ExSeq的一个关键创新是将未靶向的短读取ISS与在提取组织中包含的cDNA后在同一样品上执行的常规“批量”测序结合起来。短序列用作独特的“标签”,以将每个“批量”读取匹配到特定位置,有效地导致足够的长度,长读取ISS,足以在复杂组织中以亚细胞分辨率映射拼接异构体,例如小鼠大脑。

基于FISH和原位测序的方法共享一个公共元素:通过对组织进行高分辨率的显微镜成像来执行检测,通过有效地计数mRNA的单个分子来测量基因表达。尽管成像是获得空间信息的最直接方法,但单分子显微镜非常具有挑战性,需要极其精确的仪器和程序。这一技术障碍由于需要多个成像周期,结合通过液体交换、酶反应或其他程序进行的广泛样品操作而加剧。毫不奇怪,图像共注册和特征提取是所有基于成像的空间组学数据集分析中的最大挑战之一。由于需要高放大倍数和分辨率,单分子显微镜也可能很慢,从而产生一个非常小的视场,需要广泛的平铺和图像拼接(本身不是一个微不足道的程序)来获得任何有用的样品大小。细胞内的分子拥挤也对可以解析的分子数量设定了上限,给予衍射极限。因此,检测灵敏度受到细胞大小的偏见,较大的细胞允许更深入的分析。

空间条形码的批量测序读取

有人可能会争辩说,已经有了最好的工具,以非常高的速度和吞吐量产生高质量的转录组定量数据,只是如果空间位置可以在序列空间中编码。这正是ST背后的关键洞察(图4)。在ST中,使用微阵列打印技术在玻璃滑块上沉积有序的寡核苷酸阵列。每个寡核苷酸都包括一个与下游测序反应相容的把手,一个特定于每个空间位置的条形码,一个用于纠正聚合酶链反应(PCR)扩增偏见的随机UMI(唯一分子标识符),以及一个polythymidine [poly(T)]序列,用于捕获polyadenylated [poly(A+)]信使。每个阵列斑点都有一个不同的空间条形码。然后将一个薄的组织切片放在阵列上,使其透孔以允许细胞RNA扩散到带条形码的寡核苷酸,并在原位进行反转录以产生空间索引的cDNAs。然后放大后者,与适配器连接以产生一个文库,并使用标准的下一代测序进行测序。一些关键的优点是能够产生长的测序读取(尽管仍然偏向转录的3'端),不依赖于复杂的成像仪器,高速度(处理所需的时间实际上与样本大小无关)和并行化的潜力。这些特点极大地促进了该技术的商业采纳。然而,也有一些值得注意的缺点,包括低分辨率(目前为50至100μm)、每个样本的高成本和RNA捕获的低效率(表1)。

ST的分辨率在几年后得到了很大的提高,通过两种方法,Slide-seq 和高密度ST (HDST),它们将带有条形码的poly(T)引物连接到纳米珠上(其直径可以更小),而不是直接连接到玻璃表面。然后,珠子被打包在一个粘性滑块上(Slide-seq)或在一个微孔图案的滑块上(HDST),达到更高的空间密度(Slide-seq为10μm,HDST为2μm)。因为打包是随机的,所以首先通过一轮ISS对条形码进行空间解码,然后使用标准的ST协议对滑块进行后续处理。与原始的ST相比,Slide-seq和HDST能够以与单个细胞大小相当的分辨率进行分析,但这是以更复杂的协议和试剂设置以及RNA捕获效率较低为代价的。Slide-seq的第二个版本将捕获效率提高到与分散的单细胞RNA测序(scRNA-seq)相近的水平。同一作者的更近期的方法,Slide-tags,使用相同的方法为然后使用常规的分散流水线处理的单个细胞添加空间地址,从而使用已建立的技术进行多组学空间分析。

另一种方法,“Seq-Scope”,通过“双重利用”其中一个最广泛使用的下一代测序平台,为该领域提供了一个重大的进步。在这种方法中,使用一个修改过的测序流动池通过桥接PCR扩增产生随机分布的DNA条形码。然后通过合成测序映射簇,酶处理,并延长以去除远端测序把手并安装UMI和poly(T)序列。这实际上产生了一个非常密集的带有条形码的滑块,每个滑块的空间条形码每~500 nm都不同,每个斑点的空间坐标已经知道。然后使用稍微修改过的ST协议对滑块进行处理,使用第二轮测序确定RNA丰度。两种其他方法,Stereo-seq(空间增强分辨率组学测序)和PIXEL-seq(多聚体索引库测序)使用在滑块上生长的DNA“纳米球”地毯来实现类似的亚微米分辨率。这两种方法的捕获效率都相对较高,与scRNA-seq相当或略高。

一种更粗糙的方法产生空间条形码,但同样非常有效,使用一系列微流控通道压在组织样本上来创建一个物理屏障。在DBIT-seq(组织中的确定性条形码为空间组学测序)中,流经每个通道的带有条形码的寡核苷酸与目标生物分子连接,然后微流控芯片旋转90°,并进行第二次条形码。这个程序产生了一个网格,在其中每个交点都有一个不同的索引。这种方法已经用于分析RNA、蛋白质和染色质特征,单独或组合。分辨率根据芯片大小在10和50μm之间变化,更高的分辨率在技术上更具挑战性。捕获效率相当高,可能是因为不需要从组织中扩散RNA到带有条形码的支持上。

空间条形码技术结合批量测序已经取得了很大的成功。商业选项的可用性、不依赖高精度仪器以及与现有工作流程的兼容性,降低了许多团队的入门门槛。数据分析也相对简单,因为所有的处理都发生在序列数据的层面,这是一个在生物实验室中比图像分析更为普及的专业领域。然而,空间条形码的低分辨率和随机定位,相对于样本,意味着信息有时可以平均几个不同类型的细胞,混淆结果。尽管如此,ST及其衍生技术已经成功地应用于许多研究中,特别是在神经科学和癌症生物学领域,并且改进的方法预计将进一步推动空间分析技术的采纳。

在理想的世界中,空间分析方法——无论是针对RNA、蛋白质还是DNA——都会提供一个几乎完整且无偏见的细胞整体分子内容的图像,在亚细胞分辨率下,并在短时间内可靠且便宜地完成,足以应用于许多样本,包括档案样本。然而,所有当前的技术都涉及到某些妥协,因此选择方法取决于每个特定研究的具体需求。分辨率、吞吐量、实施的便捷性、稳健性和成本是空间分析平衡的关键变量。

对于蛋白质分析,主要的决策是是否投资于IMC-MIBI生态系统或选择循环免疫荧光协议。IMC和MIBI都是商业上可用的、稳健的,并且(对于IMC)被广泛使用。尽管抗体偶联和验证可能需要很长时间,但现有越来越多的预偶联试剂,并且有许多使用这项技术的成功研究的例子,包括一些大规模的研究。然而,检测的上限少于50种不同的标记,灵敏度有限,还没有可用的放大方法。此外,成像时间和成本都很大,需要在仪器和试剂上进行大量投资。最后,IMC的分辨率相对较粗,通常不足以检测除细胞核和膜之外的任何亚细胞结构。MIBI提供了更高的分辨率,但处理速度更慢。

循环免疫荧光的入门门槛更低,因为其成本更低,且提供更高的吞吐量。只要有足够的时间和抗体供应,它可以检测到超过100个特征。此外,该技术的某些版本与天然抗体兼容,减少了优化的需要。最后,分辨率要高得多,无论是在xy还是z维度(有共聚焦成像选项可用)。另一方面,与MS相比,荧光成像的信噪比较低,这使得某些标记难以检测。循环成像还需要非常重要的数据处理,因为需要对齐多个图像,而且在多个周期后,组织损伤可能会变得很大。

在空间转录组学领域,考虑因素要复杂得多。如果需要非常高的分辨率——例如,为了解析不同亚细胞区室中的转录本——基于成像的方法(无论是杂交还是测序为基础)都是明确的赢家。然而,高分辨率使它们变慢;成像时间随着样本面积和目标特征数量的增加而增加(因为需要更多的周期),并且非常小的视场需要大量的平铺、图像后处理和注册。

在这两个子类中,杂交方法具有更好的灵敏度,但往往产生较弱的荧光信号(尽管有放大策略可用),并且由于不同的光学性质,可能需要为不同的组织重新优化。它们在相对薄的切片(10到20微米)上表现最好。另一方面,原位测序协议无一例外地使用信号放大并产生更强的信号,需要对不同的组织类型进行较少的优化,并且可以对更厚的样本进行成像(最多100微米左右)。然而,原位测序展现了这里考虑的所有方法中最低的灵敏度,当使用信号放大来提高杂交方法的信噪比时,灵敏度也倾向于降低。这可能不是一个决定性的问题,因为只要保持相对的表达差异,对转录组的稀疏采样仍然可以提供信息。然而,一些最有用的遗传标记(如转录因子)的表达水平非常低,使用灵敏度低的方法可能很难检测到。

不需要预先设计的探针面板的非靶向分析是原位测序方法的另一个优势(尤其是ExSeq,它提供全长读取),允许准确地定量剪接异构体和突变。这些方法还提供了全转录组分析。然而,由于原位RT的低效率,非靶向方法的灵敏度往往低于靶向方法。此外,最近的基于杂交的方法有效地分析了数千个基因,足以识别细胞类型、状态和途径活性,并推断出大部分剩余转录组的表达。

分辨率和吞吐量也是考虑某些基于条形码的方法的关键参数。大部分情况下,这些方法不能将空间条形码与特定的细胞关联起来(因为条形码相对于细胞位置在幻灯片上随机分布,并且经常重叠细胞-细胞边界)。目前最广泛使用的技术,ST,具有低分辨率,限制在每个条形码20到100个细胞,这使得详细分析空间邻域变得更加困难。其他协议达到的分辨率范围从每个条形码10微米(Slide-seq)到每个条形码约500纳米(PIXEL-seq、Seq-Scope和Stereo-seq),基于微流控的条形码(DBIT-seq)也达到10微米。然而,这些解决方案都不是“细胞感知”的。此外,灵敏度相对较低(主要是由于需要原位RT),每个样本的成本通常高于其他方法。然而,条形码方法在吞吐量方面提供了相当大的优势,因为采集时间不随样本大小或检测到的特征数量而变化,多个样本可以并行处理并一起进行批量测序。

最后,当需要对少数几个空间位置进行深入分析时,应考虑激光捕获切割或TIVA或PIC等空间标记方法。这些方法通常更容易实施,并允许直接纯化选定的材料进行各种批量分析方法的分析。

大数据到有用的数据——分析的挑战

数据获取通常被认为是空间组学方法中最困难的步骤。然而,数据操作、分析和可视化同样重要,如果没有适当的分析工具,可能更为重要。空间分析方法产生如此大的数据集,受到如此多的因素的影响和偏见,一个花费数千美元的实验可能会因为没有适当的分析工具而完全变得无用。原始数据有时如此之大,以至于没有专门的硬件和软件无法适当地进行可视化。

每种技术的分析流程的一些关键步骤在图5中进行了说明。基于成像的方法面临的立即挑战是重新对齐不同的图像周期中的图像,并将多个视场拼接成一个连贯的马赛克。图像注册是一个非常微妙的问题,已经在其他地方进行了广泛的审查,而在空间分析中由于数据量非常大而变得更加复杂。大多数方法都采用容易识别的“基准地标”(荧光珠)作为特征来计算注册矩阵,这使得注册变得更加容易,但需要额外的实验处理。此外,大多数转录组学方法都需要一个解码步骤,其中荧光信号的序列与面板中的一个基因匹配,或被解析为一个新的序列,并应用错误校正和检测。这些处理流程需要根据每种技术或显微镜的特定扭曲和异常进行定制,因此很难标准化和优化。最近,SpaceTx联盟做出了巨大的努力,发布了Starfish,一套可以成功应用于大多数方法的python模块,尽管通常低于每种方法的专用流水线。

尽管大多数基于图像的协议具有亚细胞分辨率,但几乎所有的下游分析都在单细胞水平上进行。一旦在空间中检测到一个分子,就需要将其分配给一个细胞,并且需要将在细胞区域上取得的所有测量集成到每个基因或蛋白质的单一丰度分数中,最终创建一个细胞与特征矩阵。为此,原始图像被分割以识别属于单个细胞的区域。

图像分割是生物成像和计算机视觉中的一个核心问题,近年来已经从人工智能(AI)和深度学习的快速进展中受益。尽管核分割受益于规则的核形状和通用染料的可用性(DNA插入剂),但定义细胞质膜边界是一个更复杂的任务。膜标记物通常产生低信号,对细胞质膜的特异性差,或者不适用于所有细胞类型,因此即使使用AI模型也不能产生有效的分割。尽管结合多个标签已经显示出一些良好的结果,但为分割开发一个真正的通用膜标记物将是空间组学领域的变革性进展。

空间条形码方法绕过了大多数图像分析要求,因为数据与传统的测序方法相同,并且已经自然地与特定位置匹配。处理与基因组学流水线非常相似,更加标准化和便携,这是这种方法的主要优势。然而,条形码读数映射的“位置”不一定对应于特定的单个细胞,因此结果不是一个细胞与特征矩阵,而是对应于各种大小的“箱”。在Seq-Scope或PIXEL-seq等高分辨率方法中,多个箱可以求和以产生一个细胞级数据库,当然这又带回了图像分析的要求。

一旦完成了初始处理,数据集的形式与离散的单细胞分析方法相似,每个细胞都有空间坐标,并且通常具有显著更高的细胞计数。为离散数据设计的工具可以提供良好的结果,但需要谨慎使用,因为数据生成的细微差别可能导致偏见。一些工具已经升级以处理空间数据,引入能够保存坐标的数据结构,并能够产生空间图和图。也开始出现了专用的包,通常将原始数据的直接可视化与细胞与特征矩阵的分析相结合。商业选项也是可用的。

尽管标准的降维、聚类和差异表达工具可以有效地操作空间数据,但它们未能有效地利用空间分析方法的最重要特征:空间。空间组学方法的快速发展,分辨率、吞吐量和功率不断增加,已经超前于统计框架和分析工具的发展,这些工具能够利用数据产生新的见解。这个空白现在开始填补,几乎每周都有新的算法可用。尽管这个领域的回顾超出了可用空间,并且在其他地方已经更详细地进行了,但有三个主要的进展领域:(i)通过高斯过程回归、空间自相关和对抗神经网络等方法识别空间变量标记和特定的表达模式;(ii)识别由一组共表达标记物表征的空间生态位,在多细胞区域的水平上,或作为细胞分割的替代或细化,基于细胞可以被定义为与其他细胞相比具有相对均匀的基因表达的区域;(iii)识别不同细胞类型之间的空间相互作用,检测两种细胞类型是否可能在某些区域或条件下共存,以及这是否与组织功能或疾病相关。这可以通过配体-受体分析来补充,这是一个已经在离散的scRNA-seq中引入的细胞-细胞功能相互作用的测量,当与细胞-细胞接近信息结合时,它才能发挥巨大作用。

实验设计的挑战

俗话说:“当你有一把锤子时,一切都看起来像钉子。”空间分析技术是出色的新工具,人们很容易因为可以而将其应用于每一个问题。然而,为了前进,用户需要仔细提出真正可以从空间组学中受益的问题,并用坚实的统计基础来解决它们。

其中一个应用是在生理和病理条件下识别组织中的新细胞类型和状态。这是人类细胞图谱项目的宣称目标,该项目最初专注于离散方法,但现在正在转向空间组学技术。这些方法可以揭示传统细胞类型定义未解释的基因或蛋白质表达的残余异质性,并将其与空间位置相关联。这些方法的另一个适当的问题是,不同细胞类型的共定位是否影响它们的表达谱,或者与组织功能或疾病结果相关。这是最近几个大型项目的重点,例如,研究肿瘤如何发展和对治疗的反应。同时分析许多基因和蛋白质的能力也有助于发现特定空间生态位的新标记。因为这些技术可以在其原始状态下对组织进行详细的分子分析,没有离散、裂解和不同细胞的平均的人为影响,所以它们使得现场对以前只能在简化模型中或以纯描述方式进行的现象进行机械性调查成为可能。

通过使用离散方法的相同工具,通常可以在空间数据中识别由一致标记谱描述的细胞类型或状态。在考虑位置之前,这些工具可能足以定义以前未知的种群。如果样本显示空间一致性,可以根据组织解剖的先验知识手动汇集同一类型的细胞,例如,比较不同皮质区域中特定神经元的丰度和表达谱。如果组织的空间组织不一致,一个可能的解决方案是使用空间信息提取邻域得分或定义“邻域簇”。得分反映了不同细胞类型之间的接触频率,而簇则基于与其他细胞接触的细胞类型或其存在于给定范围内的细胞进行分配。这些参数通常可以直接在样本之间进行比较,即使空间结构本身是不同的。例如,这种方法已经显示,乳腺癌中不同类型的细胞的共定位具有预后价值。

使用空间组学方法来描述细胞类型的一个挑战是在每个位置测量的特征数量有限。克服这一限制的一种策略是将空间测量与离散的单细胞方法结合起来,后者通常提供更深入的分析。这种“数据集成”的背后假设是,有限数量的标记足以将空间方法中检测到的每个细胞或位置映射到离散数据中的细胞类或状态,然后可以在空间中重新投影后者中进行的额外测量。这种方法已经用于蛋白质测量,匹配IMC和CyTOF数据,以及RNA测量。后者尤其有趣,因为作者能够插入空间数据中缺失的值,产生一个包括每个细胞的10,000多个基因测量的数据集。选择两种技术之间的重叠标记是这种集成的关键。目前,这些通常是通过手动策划选择的,或者通过从离散数据中识别最相关的簇特异性特征选择的。然而,最近已经提出了无簇的先验方法来识别最佳标记。值得注意的是,只有对于可以用于离散和空间方法的相同(或非常相似)的样本的样本,数据集成才是可能的,并且在这两种方法中都可能捕获样本中存在的细胞类型和状态的整个异质性。

重复是整个领域的一个核心问题,但只有在样本的空间结构具有一定程度的一致性时才可能。当研究具有典型组织结构的组织,如发育中的胚胎或大脑皮层时,获取多个重复并平均结果相对简单。对于具有高度异质性且不一致的空间结构的病理组织(如肿瘤)来说,这是一个挑战。更进一步复杂化的是,随着数据分辨率的提高,即使在看似可重复的结构的组织中,也会揭示出样本与样本之间的异质性,达到每个样本都不同的极端水平,使得重复成为不可能。这个问题已经为离散的单细胞测序领域所知,该领域正在努力确定一个细胞类型或状态与另一个之间的界限。

在大多数情况下,关于理想的重复次数尚没有强烈的建议。尽管已发表的研究通常使用三次或更多次重复的“黄金法则”,但对于大型研究来说,更好的选择是首先定义要比较的实验参数,然后从一小组的试点实验开始,以估计它们在样本之间的变异,最后,求助于受过训练的统计学家来计算一个足够产生有意义结果的样本大小。人们还必须考虑大样本大小的经济可行性。由于许多技术所需的成本和时间投资,空间组学在大型项目中的应用仍受到阻碍。这无疑将通过进一步的发展和技术的更广泛的商业传播得到缓解。

研究稀有或鲜为人知的现象(如远处器官中的微转移,或发育中的稀有或短暂的细胞类型)提出了一个不同的挑战:获取足够数量的样本。因为重复是必要的,所以在这些情况下,有必要预先筛选组织,使用有限数量的相关标记,最好使用快速的、低复杂度的技术,如全幻灯片扫描或3D全器官显微镜。这样,可以识别和优先考虑感兴趣的区域,以进行后续的详细分子分析。这已经使用串行双光子断层扫描进行了。因此,空间组学研究的最佳实验设计通常包括不同但互补的技术。

未来的方向

我们仍处于空间组学时代的黎明,未来无疑将带来与过去几年一样多的革命和进步。

随着时间的推移,空间分析方法将变得更快、更可靠、更强大。这可能伴随着更广泛的商业仪器和试剂供应。已经有少数几家公司提供“一站式”解决方案,更多的公司即将推出。商业化的采纳将促进这些技术的更广泛应用,并有助于空间组学的民主化。

分析深度可能会继续增加。基于成像的RNA测量方法已经达到了细胞培养中的全转录组水平,这一趋势可能会扩展到组织。对于蛋白质,目前无法进行全蛋白质组测量,但可测量的标记物数量可能会从不到50个扩展到数百个,尽管这可能需要超越基于MS的方法,并生产大量高度特异性的抗体。尽管可以进行超深度测量,但它们可能仍然局限于特殊用途,因为收集额外数据必须与增加的实验复杂性相平衡。无靶标的原位测序和空间条形码方法,无疑会在特异性和分辨率上得到改进,将继续代表一个非常有价值的替代方案,后者可能会成为大规模研究的主导解决方案。

我们还预期现有技术的应用范围将进一步扩大。大多数现有方法要么分析mRNA的丰度,要么分析蛋白质的表达。最近,使用荧光或金属结合探针的多重免疫染色方法已经实现了RNA的定量,反之,寡核苷酸结合的抗体已经在循环杂交和空间条形码方法中使用。

基因组和表观基因组测量也越来越多地在空间上进行。3D染色质组织已经在全基因组范围内进行了分析,与基因表达一起,使用seqFISH+和MERFISH,后者还与Cut&Tag协议结合进行表观遗传标记的空间分析。空间条形码方法,如微流控条形码和Slide-seq,已经与Cut&Tag和ATAC-seq结合,进行开放染色质和组蛋白修饰的空间分析。最后,使用DNA的ISS可以检测点突变。

尽管这些不同的分析模式目前仍然大多是一次进行一次或两次,但未来无疑会看到空间多组学技术的崛起,模仿离散的单细胞技术的演变。最终,结合基因组、转录组和蛋白质组-小分子测量的技术是可取的。

最后,该领域将更接近真正的3D分析。目前,大多数空间组学在薄组织切片上进行,这基本上是2D的。在基于成像的分析中,挑战是将探针和抗体扩散到厚样本中,并在荧光成像期间获得足够的信噪比。对于条形码方法,寡核苷酸放置在2D层中,厚样本会导致每个位置捕获多个细胞。尽管2D分析非常有用,但它对于切片平面之外的内容是盲目的,不能为某些组织小室产生准确的图像。只有一些多重IHC和ISS技术接近3D分析,因为存在强大的放大产生足够的信号进行共聚焦显微镜检查。

为了更普遍地实现3D分析,一种解决方案是从3D样本中制备连续的薄切片,通过其中一个2D技术处理每一个,然后使用计算方法重新对齐数据并生成一个3D立方体。这种方法在处理时间上非常昂贵,但它可以使用当前的技术实现,并且已经为IMC单独、IMC结合连续两光子断层扫描和空间转录组学进行了演示。未来几年无疑会开发出其他的3D分析方法。

就在几年前,能够绘制组织中每个细胞的分子组成,并在同一实验中调查数百个标记和数百万个细胞,这本来被认为是科学小说而不是科学。现在,单细胞和空间组学技术正在飞速发展,赋予科学家新的能力来研究复杂的生物过程。随着这种力量,我们有责任评估这种新型方法的局限性,它们的理想应用领域,以及如何将良好的实验实践和严格的分析应用于所产生的数据。随着越来越多的实验室获得这些新一代技术,毫无疑问,令人难以置信的生物学洞察力就在眼前。

文章来源:www.science.org/doi/10.1126/science.abq4964

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2023-08-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Chris生命科学小站 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据集成
数据集成(DataInLong)源于腾讯开源并孵化成功的 ASF 顶级项目 Apache InLong(应龙),依托 InLong 百万亿级别的数据接入和处理能力支持数据采集、汇聚、存储、分拣数据处理全流程,在跨云跨网环境下提供可靠、安全、敏捷的全场景异构数据源集成能力。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档