前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >空间多组 | NG | 使用多组学和生态空间分析对组织状态进行量化表征

空间多组 | NG | 使用多组学和生态空间分析对组织状态进行量化表征

作者头像
生信菜鸟团
发布2025-05-09 10:23:45
发布2025-05-09 10:23:45
920
举报
文章被收录于专栏:生信菜鸟团生信菜鸟团

Basic Information

  • 英文标题:Quantitative characterization of tissue states using multiomics and ecological spatial analysis
  • 中文标题:使用多组学和生态空间分析对组织状态进行量化表征
  • 发表日期:01 April 2025
  • 文章类型:Article
  • 所属期刊:Nature Genetics
  • 文章作者:Daisy Yi Ding | Garry P. Nolan
  • 文章链接:https://www.nature.com/articles/s41588-025-02119-z

Abstract

Para_01
  1. 细胞在组织中的空间排列决定了生物功能,而空间组学技术的最新进展增强了我们分析这些排列的能力,从而研究生物过程和疾病进展。
  2. 我们提出了MESA(多组学和生态空间分析),这是一种借鉴生态学概念的框架,用于描绘组织状态下的功能和空间变化。
  3. MESA引入了度量标准,系统地量化空间多样性并识别热点,将空间模式与表型结果联系起来,包括疾病进展。
  4. 此外,MESA整合了空间和单细胞多组学数据,促进了对细胞邻域及其在组织微环境中的空间相互作用的深入了解。
  5. 将MESA应用于各种数据集展示了它相对于先前方法带来的额外见解,包括新识别的空间结构和与疾病状态相关的关键细胞群。
  6. 作为Python软件包提供的MESA,为定量解码健康和疾病状态下空间组学中的组织架构提供了多功能框架。

Main

Para_01
  1. 细胞在组织中的空间组织对从胚胎发育到疾病进展的生物过程起着关键作用。
  2. 因为细胞不是孤立运作的,它们的功能和行为与其局部微环境密切相关。
  3. 空间分析技术的进步1,2,3,4,5,6增强了我们分析细胞在原生组织环境中的特征并获得机制性见解的能力7,8,9,10。
  4. 为了探索细胞间的相互作用及其空间依赖性,已经开发了计算算法来研究细胞邻域和组织生态位10,11,12,13,14,15,16。
Para_02
  1. 然而,系统且稳健地分析空间组学数据仍然具有挑战性。
  2. 需要方法来定量评估跨越动态范围(例如,50微米到1毫米)的空间分布和结构,并识别与功能结果的关联。
  3. 当前的方法主要集中在可视化方面,用于检查细胞多样性,但用于表征与表型结果(如疾病进展)相关空间模式的系统度量有限。
  4. 这种限制导致了空间组学数据分析工具包中的不足。
Para_03
  1. 受生态学的启发,我们认识到有机会在物种生物多样性和细胞多样性之间建立类比。生态学家已经开发了度量标准来量化物种在不同空间尺度和栖息地中的分布17,18,最近的研究已经开始将这些度量标准应用于空间组学数据19,20,21。将生态学的度量标准适应于细胞环境使我们能够量化组织的空间结构,并识别它们与功能结果之间的关联。
  2. 受生态学的启发,我们认识到有机会在物种生物多样性和细胞多样性之间建立类比。生态学家已经开发了度量标准来量化物种在不同空间尺度和栖息地中的分布17,18,最近的研究已经开始将这些度量标准应用于空间组学数据19,20,21。将生态学的度量标准适应于细胞环境使我们能够量化组织的空间结构,并识别它们与功能结果之间的关联。
Para_04
  1. 通过分析各种组学视角下的生物学,我们可以揭示隐藏在单一空间组学模态中的见解。
  2. 一个实施良好的多组学方法可以通过将单细胞数据(如来自单细胞RNA测序(scRNA-seq)技术的数据)与空间组学整合起来,利用大量可用的单细胞数据来丰富所捕获的信息。
  3. 最近的数据整合算法22,23,24,25,26,27,28,29,30,31使得对数千个基因进行高通量scRNA-seq测量能够为诸如来自CODEX的空间组学数据提供信息,这保留了组织的空间背景。
  4. 融合这些方法可以在组织内将蛋白质和RNA映射到单细胞水平。
  5. 通过计算机统一的多组学数据,结合对细胞多样性的多层次视角,提供了对细胞景观的更全面的表征,并将为进一步理解复杂的生物系统铺平道路。
Para_05
  1. 我们介绍了MESA(多组学和生态空间分析),这是一个结合生态原理和多组学整合来解读组织重塑的框架。
  2. 受到生态学的启发,MESA适应了传统上用于衡量生物多样性的多样性指标,用于空间组学,创建了系统量化细胞多样性的工具。
  3. 我们引入了一个多尺度多样性指数(MDI),以及全局和局部多样性指数,以捕捉不仅包括组织总体多样性而且包括局部模式和依赖关系。
  4. 此外,MESA使用多组学方法进行空间组学分析。
  5. MESA在计算机模拟中整合跨模态单细胞数据,以丰富空间组学观察的背景。
  6. 通过多组学带来的额外信息层,MESA促进了对细胞邻域及其在组织微环境中的空间相互作用的扩展视角。
  7. MESA的方法,将差异表达(DE)、基因集富集和配体受体相互作用(LRI)分析纳入这些空间定义的细胞组装体中,进一步增强了对不同疾病状态下组织重塑的机制理解。
Para_06
  1. 将MESA应用于CODEX人类扁桃体32、小鼠脾脏2、人类肠道33和CosMx SMI人类肝脏34的数据集揭示了与组织疾病状态相关的细胞成分、空间结构和功能,这些是以前的技术无法识别的。
  2. 因此,这种对空间模式分析和多组学整合的定量方法推进了我们对组织重塑及其在疾病和疗法中的功能影响的理解。
  3. MESA(https://github.com/Feanor007/MESA)作为Python包可用。

Results

Overview of the MESA pipeline

MESA管道概述

Para_01
  1. MESA将空间组学与来自同一组织类型和疾病状况的相应单细胞数据集(例如,scRNA-seq)相结合(图1a)。
  2. 它通过MaxFuse22在不同模态之间匹配细胞,为空间分析丰富了空间组学数据中的单细胞信息(图1a(i))。
  3. 该框架利用现有的单细胞数据资源,减少了直接进行所有组学实验的必要。
  4. 基于计算机生成的多组学谱图,MESA表征每个细胞的局部邻域,以识别保守且独特的细胞邻域(图1a(ii))。
  5. 此过程聚合来自空间确定的邻居(例如,20个细胞)的多组学信息,以捕捉细胞环境。

Fig. 1: MESA overview.

- 图片说明

◉ 多组学空间分析整合了空间组学数据(例如,CODEX、MIBI、IMC和MERFISH)与单细胞数据集(例如,scRNA-seq和scATAC-seq),使用算法如MaxFuse22。◉ 该框架设计得非常通用,允许利用各种其他数据整合方法以适应不同的分析需求。◉ 这种整合丰富了空间组学数据,并创建了用于下游分析的虚拟多组学空间剖面。◉ 接下来是邻域识别,通过将每个细胞的k最近邻(k-NN)中的多组学信息聚合成邻域特征向量(NFV),捕捉局部细胞环境。◉ k-NN基于空间距离确定。◉ 计算不同类型的NFV,包括细胞组成、局部平均蛋白质表达和局部平均RNA表达(通过scRNA-seq数据的虚拟匹配)。◉ 这些NFV作为聚类的基础,以识别不同的、保守的细胞邻域。◉ MESA进行差异表达分析和GSEA以获得对识别出的细胞邻域的功能性见解。◉ 生态学启发的空间分析使用MDI量化不同空间尺度上的多样性变化。◉ 它的工作原理是将组织样本划分为不同大小的斑块,评估每个斑块内的多样性,并随后计算对应于每个尺度的平均多样性得分。◉ MDI测量跨尺度的多样性变化率:低MDI值表示跨尺度的细胞多样性一致,较高的值表明更多样性的变化,这可能意味着某些细胞类型在组织中的分布不均。◉ 为了表示这一点,MESA通过计算局部斑块的熵生成一个多样性热图。◉ 基于多样性热图,GDI评估具有相似多样性的斑块之间的空间相邻性,而LDI则识别多样性热点(由高多样性定义的区域)和冷点(由低多样性定义的区域)。◉ MESA通过检查这些区域内的细胞类型盛行度和共存情况来分析热点和冷点,有可能揭示在整个组织中考虑时可能不明显的模式。◉ DPI衡量热点和冷点之间的空间接近性和大小关系,较高值表示较大的且更接近的多样性斑块。◉ 由BioRender创建。

Para_02
  1. 在先前的出版物中,我们使用滑动窗口确定细胞邻域10,33,35,该窗口确定局部细胞组成,其中细胞类型是通过聚类或其他方法定义的。
  2. 在这些方法中,细胞类型被归类为单一变量实体(即CD4+ FOXP3+调节性T细胞(Treg细胞)或B220+CD20+B细胞)33,36,而这些细胞上任何给定蛋白质的表达可以存在于一个范围内。
  3. 然而,MESA并不使用这样的细胞标记,而是通过整合多组学信息(如蛋白质和mRNA表达水平或其他相关的任何其他组学数据)超越了这一点。
  4. MESA不是将细胞类型作为预定义的实体来使用,而是评估区域内细胞的平均蛋白质和mRNA水平来确定邻域组成(图1a(ii))。
  5. 这一过程使MESA能够利用蛋白质的动态范围作为细胞状态的代理,这是传统聚类或门控算法所忽略的,因此对区域内细胞之间共调控的蛋白质和mRNA水平更为敏感。
Para_03
  1. 随后,MESA 使用 k-means 聚类来识别保守的邻域模式,接着进行差异表达分析和基因集富集分析(GSEA)以探索功能通路及其意义(图1a(iii)))。这些分析通过多组学方法得以实现,并且能够在复杂的细胞环境中揭示细微的功能通路。
  2. 这些分析是通过多组学方法实现的,并且可以揭示复杂细胞环境中微妙的功能通路。
Para_04
  1. MESA 的第二个组成部分使用系统性指标量化细胞多样性(图 1b)。
  2. 首先,我们提出了一种多样性变化指数(MDI)来评估不同空间尺度上的多样性变化(图 1b(i))。
  3. MDI 通过将组织切片划分为不同大小的斑块,评估每个斑块内的多样性,并计算相应尺度的平均多样性得分。
  4. MDI 是通过对这些尺度上的多样性得分进行线性回归拟合得到的直线斜率,因此是衡量细胞多样性如何随着尺度变化而波动的一个指标。
  5. 较低的 MDI 值表明在各个尺度上多样性保持一致,而较高的值则表明多样性变化更为显著(图 1b(i))。
  6. 例如,具有均匀细胞类型分布的组织在不同尺度上会维持一致的多样性。
  7. 相反,细胞类型分布不均的组织会在不同尺度上表现出更显著的多样性波动。
  8. 为了表示这一点,MESA 通过计算组织样本内局部斑块的多样性生成了一个多样性热图(图 1b(ii))。
  9. 我们利用这一定量方法推导出全局多样性指数(GDI),该指数评估相似多样性的斑块是否在空间上相邻;以及局部多样性指数(LDI),该指数通过区分多样性模式识别‘热点’(高多样性斑块集群)和‘冷点’(低多样性斑块集群)。
Para_05
  1. 这种方法类似于地理生态学中的生物多样性热点和冷点。
  2. MESA通过分析这些区域中细胞类型的丰富度和共存情况来评估热点和冷点,揭示了全组织分析中不明显的信号。
  3. 值得注意的是,这些空间隔室不同于组织邻域/小生境,后者通常由细胞身份而不是细胞多样性定义。
  4. 此外,多样性接近性指数(DPI)评估热点/冷点之间的空间关系(图1b(iii))。
  5. 这一概念类似于生态研究,在生态研究中栖息地的大小和接近程度影响物种动态。
  6. 就像在生态学中,更大且更接近的栖息地增强了物种间的相互作用,较高的DPI值表明这些区域更接近、更大,可能意味着更多的细胞间相互作用。
  7. 相反,较低的DPI值反映了较小且分散的区域,这可能表明较少的细胞间相互作用。
  8. MESA的定量指标使我们能够探索细胞多样性与表型结果(如疾病进展)之间的关联。
  9. 我们在方法部分提供了有关MESA框架的更多细节。

Multiomics analysis enhances tonsil niche characterization

多组学分析增强扁桃体微环境特征鉴定

Para_01
  1. 为了展示多组学如何增强生态位表征,我们将MESA应用于整合了扁桃体scRNA测序数据的扁桃体CODEX数据集。
  2. MESA促进了对传统分析技术无法观察到的不同细胞相互作用和邻域的界定,并揭示了不同邻域之间蛋白质和mRNA的差异表达模式。
  3. 图2a展示了用细胞类型标记颜色编码的扁桃体组织样本。
  4. 图2b基于细胞组成(在先前的技术中常用;左侧)呈现了邻域特征,通过计算机模拟的多组学融合显示了平均蛋白表达(中间)和mRNA表达(右侧)。
  5. 注:扁桃体CODEX数据集编号为32,扁桃体scRNA-seq数据编号为40。

Fig. 2: Multiomics spatial analysis enhances niche characterization in tonsil tissues.

Para_02
  1. 我们观察到在生发中心内一致出现的增强的空间区域划分(图2b中间和右侧面板标记为区域0、1和3)。最初识别出的区域被称为区域1(左侧面板)。
  2. 图2c放大了其中一个这样的生发中心(由虚线圈出)以说明这些区别。
  3. 生发中心主要由B细胞组成(i),对应于区域1(橙色;ii)。
  4. MESA将其细分为不同的区域(橙色、红色和蓝色;iii和iv),这种模式在多个生发中心中均被一致地观察到,揭示了先前算法未检测到的不同亚微环境。
Para_03
  1. 使用香农熵评估了生态位表征的精细度。较高的熵值表示更精细的划分:基于蛋白质和mRNA的方法(3.1和3.0)优于细胞组成(2.7),支持了我们的视觉观察,并证明了MESA识别更细微区域的能力。
  2. 尽管在细胞区室边界或过渡区域中,基于蛋白质和mRNA的结果存在一些小的不一致(图2b、c和补充图1),但总体区室结构保持一致。
  3. 为了展示MESA的鲁棒性,我们将扁桃体CODEX数据与另一个扁桃体单细胞RNA测序数据集(第41号数据集)整合,得到了高度一致的结果,保留了关键的空间结构(扩展数据图1)。
Para_04
  1. 为了评估我们提出的多组学框架的普适性,我们使用了三种额外的聚类方法——BIRCH42、分层聚类43和FlowSOM44——与k-means一起进行评估。
  2. 结果一致表明,使用多组学信息能够更好地界定邻域(补充图2)。
  3. 与基于标记强度的邻域表征方法(包括BANKSY45、CellCharter16和UTAG15)相比,基于细胞组成的方法提供了更精细的表征,但MESA更有效地界定了复杂的邻域(扩展数据图2)。
  4. 最后,虽然应用更细粒度的细胞类型注释增强了基于组成的分析方法,但MESA通过整合连续的多组学表达和空间背景提供了更深入的见解(补充图3)。
Para_05
  1. 细胞组成、蛋白质和mRNA表达在各个区域可视化显示于图2d。
  2. 尽管各个区域的细胞组成相似,所有46种CODEX蛋白标记物和前50个可变mRNA基因显示出明显的表达模式。
  3. 例如,区域1、0和3(红框)显示出相似的细胞构成,但Ki67、CD21和CD22蛋白以及CD74和TUBA1B mRNA的表达水平不同,这与生发中心内已知的不同B细胞亚群的标志物一致46,47,48。
  4. 注:文献引用编号46,47,48在翻译结果中未保留。
Para_06
  1. 此外,DE和GSEA揭示了更细粒度的区域之间的功能差异(图2e和补充图4)。
  2. 区域0显示出包括E2F靶点、G2M检查点和DNA修复在内的途径显著富集,而区域3则显示出通过核因子κB(NF-κB)的TNFA信号传导、IL-2 STAT5信号传导和干扰素-γ反应。
  3. 这些发现与生发中心暗区和明区在B细胞增殖与选择及抗原呈递方面的不同功能一致49。
  4. MESA的分析反映了这种分离,揭示了与文献预期一致的分子特征。
  5. 这种增强的表征展示了MESA揭示复杂组织结构内关键细胞动力学的能力。
  6. 此类见解将有助于阐明淋巴组织内免疫监视和反应的机制。

Eco-spatial analysis reveals autoimmune tissue remodeling

生态空间分析揭示了自身免疫组织重塑

Para_01
  1. 我们应用了MESA的生态空间框架来分析健康小鼠和MRL/lpr小鼠(一种系统性自身免疫疾病的鼠类模型)的CODEX脾脏数据集。这些组织被分割成30微米×30微米的斑块。
  2. 图3a显示了细胞类型图(顶部),多样性热图(中间;红色:更高,蓝色:更低)以及多样性的热点和冷点(底部)。

Fig. 3: Eco-spatial analysis reveals distinct tissue remodeling in autoimmune disease.

- 图片说明

◉ BALBc-1(健康对照)和MRL-8(MRL/lpr)小鼠组织切片的对比可视化显示:(1)细胞类型图(顶部);(2)多样性热图(中间),不同色调表示细胞多样性的不同水平(红色代表更高多样性,蓝色代表更低多样性);以及(3)多样性热点和冷点的地图(底部)。DC,树突状细胞。◉ 对MESA多样性指标的定量评估,包括MDI、GDI和DPI,突出了健康(n=3)和MRL/lpr组织(n=6;b-d样本量相同)之间空间多样性模式的统计学显著差异。标准箱线图指标贯穿始终:中位数(中心线)、四分位数(框)、须(1.5倍IQR)。b-d中的每个点对应一个个体组织样本。◉ 健康组织显示出更高的GDI(P<0.001)和DPI(P=0.014)值,而患病的MRL/lpr组织表现出更高的MDI值(P=0.002)。通过双侧Welch’s t检验对不同组织样本进行了统计比较。◉ 健康和患病脾脏组织中细胞类型的分布占总细胞群体的百分比。通过双侧Welch’s t检验进行比较,并使用BH程序进行FDR校正。值得注意的是,健康和患病组织之间细胞频率的差异在多样性热点内比在整个组织内更为明显。◉ 健康和患病组织中不同细胞类型的共存情况。通过双侧Welch’s t检验进行比较,并使用BH程序进行FDR校正。与前述一样,差异在多样性热点内比在整个组织内更为明显,且P值较低。◉ 对比健康和患病组织中CD8+ T细胞和F4/80+巨噬细胞的共存模式,附有相应的CODEX图像。

Para_02
  1. 高多样性区域与边缘区和红髓相对应,而低多样性区域则对应于B细胞滤泡和套区动脉周围淋巴鞘。
  2. MESA揭示了疾病进程中细胞多样性模式的显著变化。
  3. MRL/lpr组织的MDI高于健康组织(图3b,左)。
  4. 这种差异反映了健康脾脏组织中同质区域的空间排列,这些区域在整个空间尺度上保持一致的细胞类型多样性。
  5. 这些区域主要由B细胞滤泡和套区动脉周围淋巴鞘组成,对脾脏免疫功能至关重要。
  6. 在MRL/lpr组织中,疾病进程通过边缘区消散、套区动脉周围淋巴鞘解体以及红髓中红细胞祖细胞入侵来破坏这种组织结构。
Para_03
  1. 通过MESA,这些后期变化扰乱了以前组织好的组织结构,产生了马赛克样的模式和跨尺度的多样性波动。
  2. 健康的脾脏组织具有更高的GDI(图3b,中间),表明高多样性和低多样性区域的明显分离以及更有序的隔间。
  3. 相反,患病组织显示出较低的GDI和更多的混合模式,这表明脾脏功能受损。
  4. 此外,使用LDI,识别为热点/冷点的区域在健康样本与患病样本中表现出不同的空间接近性。
  5. 健康组织显示较高的DPI,热点更为扩展且接近(图3b,右侧)。
  6. 在健康组织中,热点与红髓(含有红细胞、F4/80+巨噬细胞、基质细胞)对齐,而冷点与B淋巴滤泡(B细胞)和PALS(T细胞)相关联。
  7. 在患病组织中,热点转移到重构的PALS和侵袭前沿,冷点出现在剩余的B淋巴滤泡中。
Para_04
  1. 为了展示MESA在发现这些重要的空间区室方面的独特能力,超越了先前的邻域/生态位方法,我们将它与Spatial-LDA、UTAG和CellCharter进行了比较。
  2. MESA的多样性热点/冷点并不与这些传统的邻域/生态位方法所识别的区域重合(扩展数据图3a),突显了它的独特优势。
Para_05
  1. 在有限的空间组学定量指标中,CellCharter 引入了在空间分析中逐渐受到关注的形状指标,包括旋度、拉长率、线性度和纯度。
  2. MESA 的指标在区分 MRL/lpr 组织与健康组织方面优于 CellCharter(扩展数据图 3b)。
  3. MESA 在表现上也优于已建立的空间生态学指标,如分形维数指数和形状指数(补充图 5)。
  4. 此外,我们将全局和局部 Getis-Ord Gi/Gi* 统计纳入基准测试,MESA 表现更好(补充图 6),并且作为 MESA 软件包中的附加选项。
Para_06
  1. 我们分析了健康和患病脾脏热点区域中的细胞组成和共存情况,以识别与疾病相关的特征性细胞类型或组合。
  2. 在患病脾脏的整体组织和热点区域中,B细胞的频率显著下降(图3c,左)。
  3. 然而,热点区域独特地显示出B220+、DN T细胞以及CD106+CD16/32+CD31+基质群体的增加(图3c,中/右和补充图7-9),突显了以热点为中心的分析在检测细微变化方面的效用。
  4. 跨热点和冷点的细胞类型组成可视化(扩展数据图5)揭示了样本内部和之间的空间异质性。
  5. 就共存而言,患病样本中CD8+ T细胞与CD106+CD16/32+CD31−Ly6c−基质细胞(图3d,左)以及ERTR7+基质细胞(图3d,中)之间的共存增加。
Para_07
  1. 这些模式仅出现在热点区域,而非整个组织(图3d、扩展数据图4和补充图10)。
  2. ERTR7+ 基质细胞与CD8+ T细胞之间的空间关联增强,表明ERTR7+基质细胞在疾病状态下积极促进T细胞运动和可能的激活54。
  3. 相比之下,健康样本显示CD8+ T细胞和F4/80+巨噬细胞共存增加(图3d,右侧),这与F4/80+巨噬细胞在免疫调节和自身免疫预防中的作用一致55。
  4. 在所有研究案例中,热点区域与整个组织相比,这些差异更为明显,达到了统计显著性,P值更低。
  5. 图3e展示了热点区域中CD8+ T细胞和F4/80+巨噬细胞的分布情况,放大后的热点区域和相应的CODEX图像显示健康脾脏与患病脾脏之间频率更高。
  6. 这些细胞频率和相互作用的变化表明脾脏组织结构的重大重组以及免疫景观的改变,揭示了驱动疾病进展和免疫失调的机制。

MESA improves prognostic capabilities for CRC

MESA提升了CRC的预后能力

错误!!! cannot unpack non-iterable NoneType object

Fig. 4: Multiomics and eco-spatial analysis improves prognostic capabilities for CRC.

- 图片说明

◉ 可视化CLR和DII患者组织样本:(1)细胞类型图(顶部),(2)多样性热图(中间,红色:更高多样性,蓝色:更低多样性)以及(3)多样性热点和冷点图(底部)。◉ 对CLR(n=17)和DII(n=18)组织的MESA多样性指标进行定量评估(b和d具有相同的样本量)。分析过程中使用了标准箱线图指标。◉ 分析突出了空间多样性模式的显著差异,CLR组织显示出更高的MDI(P=0.018)、GDI(P=0.006)和DPI(P=0.046),表明两种CRC亚型之间存在不同的空间模式。◉ 统计比较采用双侧Welch t检验。◉ Kaplan-Meier生存曲线根据病理学家注释的CLR/DII分类和MESA多样性指标对CRC患者进行分层。◉ 双侧对数秩检验显示两种方法均具有显著分层效果,MESA指标表现出较低的P值。◉ Cox比例风险模型证明,基于一致性指数(C-index:0.734±0.106)的MESA指标表现优于CLR/DII注释(0.717±0.088),当结合使用时进一步提高(0.763±0.085)。◉ B细胞、Treg细胞以及Treg细胞与CD68+CD163+巨噬细胞共存频率在CLR和DII组织中的丰度。◉ 值得注意的是,在热点区域与整个组织之间的CLR和DII的区别更为明显,基于双侧Welch t检验和BH FDR校正,达到了更低的P值。◉ Circos图展示了细胞丰度和共存频率,节点代表不同的细胞类型,边代表共存关系。节点大小对应细胞类型的丰度,而边的粗细表示共存强度。◉ 差异表达和基因集富集分析揭示了区分位于热点与冷点的CD68+CD163+巨噬细胞的独特基因表达模式。◉ 差异表达采用双侧精确检验,基因集富集分析采用双侧置换检验;所有P值已通过BH程序调整。◉ DE的调整P值阈值设定为0.05,效应量(对数值变化)阈值设定为0.1。

Para_02
  1. 将 MESA 指标应用于 CRC 数据集揭示了 CLR 和 DII 亚型之间的显著差异(图 4b)。
  2. CLR 患者表现出更高的 MDI,并且在各个尺度上细胞多样性具有更动态的变化(图 4b,左)。
  3. 较高的 GDI 表明高多样性和低多样性区域的明显分离(中间)。
  4. 较高的 DPI 反映出更大的、接近的热点(右)。
  5. 相比之下,DII 患者显示出更混合的模式和更小、分散的热点。
  6. MESA 的指标定量地表征了 CRC 组织结构,并且在区分疾病状态方面优于 CellCharter 的指标(补充图 11)。
Para_03
  1. 我们使用了MESA多样性指标来建模结直肠癌患者的生存结果,其表现优于病理学家的传统CLR/DII注释。这证明了这些自动指标在患者分层中的价值。
  2. 基于空间多样性的Cox比例风险模型将患者分为两组,具有显著不同的Kaplan-Meier曲线(P < 0.0001)。
  3. 值得注意的是,基于多样性的分层比CLR/DII注释显示出更大的Kaplan-Meier曲线分离(图4c,左/中)。
  4. 我们的模型还实现了更高的预测准确性,将一致性指数(C-index)从0.717提高到0.734。
  5. 将多样性指标与CLR/DII注释相结合进一步提高了预后能力(C-index:0.763;图4c,右)。
Para_04
  1. 我们分析了热点内的细胞组成和共存情况,以识别与CLR和DII亚型相关的细胞类型及其组合(图4d和补充图11-14)。
  2. CLR和DII患者之间的细胞频率变化与Schürch等人33的研究结果一致,在热点内与整个组织相比差异更为明显。
  3. 例如,B细胞在CLR中的频率高于DII,特别是在热点内与整个组织相比更为显著(图4d,左图)。
Para_05
  1. 更有趣的是,Treg细胞在DII患者中特别是在热点区域更为丰富,这支持了Schürch等人提出的假设,但该假设在他们的原始分析中缺乏统计支持。
  2. DII和CLR之间的Treg细胞频率差异仅在热点区域变得显著,而在整个组织中则不显著(图4d,中间)。
  3. 这些Treg细胞经常与CD68+CD163+巨噬细胞(M2样)共存(图4d,右侧),这与Treg细胞和M2样巨噬细胞可能共同促进肿瘤微环境中的免疫抑制作用相一致,进而可能导致DII患者的预后较差。
Para_06
  1. 此外,DII热点显示B细胞和CD4+ T细胞CD45RO共居减少(补充图14),这与将这些细胞与较低的CRC风险联系起来的研究一致。
  2. 图4e展示了整个组织(左)和热点区域(右)中CLR和DII的细胞共居情况,其中节点大小表示细胞类型的丰度,颜色表示边的数量(越红表示越多)。
  3. 边的厚度代表共居频率,厚度小于0.01的边为了视觉清晰而被排除。
  4. CLR和DII之间存在显著差异的共居模式——仅限于热点区域内(用绿色边表示)——包括Treg细胞与M2样巨噬细胞、CD8+ T细胞,B细胞与CD4+ T细胞CD45RO+,以及粒细胞与M2样巨噬细胞(图4e右侧用箭头指出)。
  5. 这些局部共居模式揭示了在全组织分析中未检测到的亚型差异。
Para_07
  1. 最后,利用MESA的多组学框架,我们分析了基于空间位置的细胞功能差异(图4f和补充图15)。
  2. 整合CRC单细胞RNA测序数据59与CODEX使用MaxFuse22,我们在热区与冷区对CD68+CD163+巨噬细胞进行了差异表达分析(图4f,左)。
  3. 冷区巨噬细胞表达了更高的LYVE1,这是一种淋巴管/血管相关M2样巨噬细胞的标记物60,61,62。
  4. 热区巨噬细胞显示干扰素刺激基因(ISG20, ISG15)和细胞因子(CXCL10, CCL5)上调,表明肿瘤相关表型63,64,65,66,67。
  5. GSEA显示热区巨噬细胞上调了干扰素反应、IL-2/TNF信号传导和补体通路(图4f,右)。
  6. MESA揭示了热区与冷区细胞的不同功能状态。

MESA augments functional analysis for liver cancer

MESA增强了肝癌的功能分析

Para_01
  1. 为了展示MESA的多功能性,我们将其应用于一个人类肝脏组织的CosMx SMI空间转录组学数据集,分析了不同疾病状态下组织重塑中的LRIs。该数据集包括来自健康和肝细胞癌(HCC)肝脏组织的样本,每个样本包含超过300,000个细胞。
  2. 由于样本数量有限(每种条件一个),我们实施了随机亚抽样以促进统计比较,为每种条件生成了10个代表性亚样本(1,600 μm × 1,600 μm,约12,000个细胞),并保持了细胞组成(补充图16)。对整个数据集的分析显示了一致的模式(补充图17)。
  3. 亚样本被划分为50 μm × 50 μm的小块。图5a展示了健康和HCC样本,显示了细胞类型图(顶部),多样性热图(中间;红色:更高,蓝色:更低)以及多样性的热点/冷点(底部)。

Fig. 5: MESA extends to spatial transcriptomics and augments functional analysis of liver cancer.

- 图片说明

◉ 可视化健康和HCC肝组织亚样本,显示:(1)细胞类型图(顶部),(2)多样性热图(中间,红色:更高多样性,蓝色:更低多样性)以及(3)多样性热点和冷点图(底部)。◉ 对MESA多样性指标进行定量评估,突出显示健康(n=10)和HCC(n=10)组织亚样本之间空间多样性模式的显著差异(面板b、c和g具有相同的样本量)。在整个过程中使用了标准箱线图指标。◉ HCC组织显示出更高的GDI(P=0.001)和DPI(P=0.033)值,而健康组织表现出更高的MDI值(P=0.007)。统计比较采用双尾Welch t检验。◉ 细胞类型和细胞共存频率在健康和HCC肝组织中的分布。与整个组织相比,热点内的差异更为明显,并且通过较低的P值达到了统计学意义(采用BH调整的双尾Welch t检验)。◉ 展示不同表达的LRI通路的聚类热图(列:样本,行:通路)。只显示在超过一半的样本中有不同表达的LRIs的通路。颜色强度代表从双尾置换检验中获得的P值,并使用BH方法进行调整。◉ 按通信评分(检测到的LRIs数量)着色的细胞,热点用浅灰色标记。值得注意的是,高通信评分区域与多样性热点重叠。◉ 维恩图展示了肿瘤相关巨噬细胞和T细胞之间的显著LRIs数量,在整合CosMx数据与scRNA-seq数据前后的MaxFuse之后。◉ 条形图提供了每个亚样本中识别出的LRIs的详细分解,展示了多组学整合对LRIs分析范围的改进。◉ 气泡图展示了肿瘤相关巨噬细胞和T细胞之间检测到的LR对(平均百分比±95%置信区间)。气泡大小表示相应LR在多少个亚样本中被检测到。

Para_02
  1. MESA指标显示了健康样本和HCC样本之间存在统计学上的显著差异(图5b)。
  2. 正常肝组织显示出更高的MDI,反映了由于肝小叶结构中肝细胞、库普弗细胞、星状细胞和内皮细胞的复杂多样性,导致不同尺度上存在异质性细胞类型多样性。
  3. HCC组织显示出较低的MDI,因为肿瘤区域一致性较高,在不同尺度上多样性较低(图5b,左)。
  4. HCC组织还显示出更高的GDI,表明高多样性和低多样性区域之间的明显分离,而健康组织中的混合模式反映了支持多样化代谢功能的不同区域的异质性(图5b,中)。
  5. 此外,HCC组织具有更高的DPI,与健康组织相比,热点区域更加广泛且靠近(图5b,右)。
Para_03
  1. 多样性热点展示了健康组织和HCC组织之间不同的细胞组成和共存模式(图5c、扩展数据图6和补充图18–20)。
  2. HCC热点显示了更高的炎症巨噬细胞丰度(图5c,左上)。
  3. 同时增加了与B细胞(图5c,左下)和非炎症性巨噬细胞(图5c,右下)的共存,以及增加了T细胞和非炎症性巨噬细胞的共存(图5c,右上)。
  4. 这些热点内的热点模式具有统计学意义,并识别出巨噬细胞是HCC中的关键物种。
  5. 值得注意的是,这些模式在整体组织分析中未被检测到,突显了专注于热点的方法的价值。
Para_04
  1. 为了探索细胞间通讯,我们使用SpatialDM包对mRNA模式进行了LRI分析。
  2. 图5d显示了LRI通路(行)在样本(列)中的热图。
  3. 正常组织和HCC组织明显聚类,揭示了不同的LRI特征。
  4. 与热点分析相似,巨噬细胞相关的LRI通路,包括SPP1相关的LRI,在健康组织和HCC组织之间显著不同,这进一步强化了巨噬细胞在HCC中的重要性。
  5. 此外,我们基于显著LRI计数为每个细胞计算了一个LRI通信评分,并通过颜色强度在图5e中可视化。
  6. 值得注意的是,高LRI评分区域与多样性热点重叠,尤其是在HCC组织中(在图5a和图5e的最后一行中标记)。
Para_05
  1. 然而,使用CosMx SMI的1,000基因面板分析LRIs可能无法捕捉到所有相互作用的全貌。
  2. MESA的多组学组件通过MaxFuse将CosMx SMI数据与肝癌样本的scRNA-seq数据整合起来,扩展了LRI分析至整个转录组。
  3. 鉴于先前分析中确定的巨噬细胞和T细胞在HCC肿瘤微环境中的重要性,我们重点关注这些细胞类型之间的LRIs。
  4. 图5f展示了MESA的多组学组件扩展后的LRI分析的Venn图,其中在整合前后的分析中有44对核心LR对中的62对被保留下来。
Para_06
  1. 整合后揭示了68个新的LR对,扩展了整合前捕获的相互作用数量。
  2. 图5f中的直方图展示了多组学整合前后亚样本中检测到的LRIs数量,突出了全转录组分析在表征细胞相互作用方面的扩展范围。
  3. 图5g按每个HCC亚样本中表现出特定相互作用的细胞对百分比对顶级LR对进行排名,粉红色的点代表仅在整合后检测到的对,灰色的点表示在整合前和整合后都被检测到的对。
  4. 巨噬细胞和T细胞之间最常见的LRI是MIF-ACKR3。
  5. ACKR3(CXCR7)促进HCC中巨噬细胞的迁移和免疫逃逸75,而MIF与肿瘤大小和患者的预后相关76。
  6. 这些发现强调了T细胞-巨噬细胞相互作用在HCC进展中的关键作用。
  7. 值得注意的是,MIF-ACKR3在最初的1,000基因面板中无法检测到,这凸显了全转录组整合的重要性。

Discussion

Para_01
  1. MESA的发展和实施将生态原理与多组学整合起来,以解码组织环境的复杂空间排列。
  2. 这一分析框架系统地量化了细胞多样性,利用多尺度多样性指数探索细胞异质性与表型结果(如疾病进展)之间的关联。
  3. MESA在各种数据集中的应用通过揭示以前未被认识的空间结构和关键细胞群体来验证其效用,同时也促进了对细胞多样性与疾病机制之间关系的更深入理解。
Para_02
  1. 在综合结果的过程中,MESA 能够通过附加单细胞信息来丰富空间组学数据,揭示了关于细胞空间组织的细致见解。
  2. MESA 使识别微妙的细胞邻域成为可能,这些邻域与功能表型结果密切相关。
  3. 使用多样性指数系统地评估空间模式突显了组织微环境的复杂性以及细胞异质性在生物和病理过程中的关键作用。
  4. 通过对差异表达、基因集富集和基于位置的关系相互分析,MESA 在这些空间定义的细胞组装体中提供了关于疾病状态下组织重塑的机制见解。
Para_03
  1. MESA的两个组成部分(能够促进组织区室多组学整合的功能分析和受生态学启发的组织状态定量测量)可以独立和协同地增强空间组学分析。
  2. 对于多组学部分,我们通过扁桃体实例展示了其促进传统技术无法观察到的不同细胞相互作用的能力,通过结直肠癌实例增强了对组织区室的功能理解,并通过肝细胞癌实例增强了LRI分析。
  3. 其有效性取决于额外单细胞模式的可用性和质量,以及实施的整合方法。
  4. 诸如CycIF(通常包含10-20个标记)的模式可能比CODEX或CosMx(包含超过50个特征)带来更大的整合挑战77。
  5. 此外,虽然我们使用了MaxFuse22,但可以实现其他替代整合方法24,25,26,27,28,29,30,31,78。
  6. 尽管计算整合扩展了分析能力并产生了假设,但实验研究仍然是验证的关键。
Para_04
  1. 生态组件与大多数单细胞空间组学技术兼容,因为MESA指标和热点/冷点识别仅需要单细胞水平的细胞类型信息和空间位置。
  2. MESA的多组学和生态组件的结合使得能够详细映射细胞间的相互作用和组织环境,从而提供对组织结构、疾病机制和治疗机会的见解。
Para_05
  1. MESA应用程序应该超越所探索的数据集,有可能为研究许多组织类型或具有复杂细胞排列的疾病状态提供更多见解。
  2. 结合新兴的空间谱型技术以及单细胞数据集,MESA可能会扩展其效用,使研究人员能够以前所未有的精确度和深度导航生物系统的空间复杂性。
  3. 因此,MESA提供了一个可扩展且多功能的工具集,用于研究健康和疾病状态下组织的空间结构。

Methods

Para_01
  1. 本研究未进行新的生物实验,因此无需遵守伦理规定。

Multiomics spatial analyses

多组学空间分析

Multiomics data fusion with MaxFuse

使用 MaxFuse 进行多组学数据融合

Para_01
  1. 我们整合了空间组学数据(例如,CODEX、MIBI、IMC和CosMx)与单细胞数据(例如,scRNA-seq和scATAC-seq),使用了MaxFuse等算法。
  2. MaxFuse的详细过程已在文献22中描述,并且本研究中使用的相关代码已存档。
  3. 简而言之,对于给定的数据集输入(单细胞空间和测序数据),我们首先识别跨模态的‘共享’特征(例如,CODEX中的CD3蛋白和scRNA-seq中的CD3相关mRNAs)。
  4. 根据皮尔逊相关性计算了基于这些共享特征的跨模态距离矩阵,并随后通过线性分配进行了一轮初步匹配,以创建第一轮单细胞水平配对信息。
  5. 接下来,使用典型相关分析(CCA)来生成基于CCA嵌入的跨模态距离矩阵,该嵌入包含了所有特征的信息,然后通过线性分配进行了第二轮匹配。
  6. 在构建初始匹配和二次匹配的距离矩阵时,执行了一个基于全局细胞群体结构的平滑过程,以增强弱连接特征之间的相关性。
  7. 最后,移除了分数较低的细胞对(基于CCA嵌入),因此只保留高质量的匹配对用于下游分析。
  8. MaxFuse过程中每个数据集使用的超参数详情可以在存档的代码中找到。
Neighborhood identification

邻里识别

Para_01
  1. 局部细胞邻域是根据空间距离定义的每个细胞的最近20个邻居,我们在分析中将k设置为20。这个k值平衡了细胞分辨率和足够的局部相互作用的空间背景,与先前的研究一致10。经验验证表明,在各种组织类型和空间分析技术中,k值在10到30之间可以产生稳健的结果。
  2. 这一数值的k在我们的分析中被设定为20,它平衡了细胞分辨率和足够的空间上下文来反映局部相互作用,这与之前的研究一致10。对不同组织类型和空间谱型技术的经验验证表明,k值在10到30之间能产生稳健的结果。
Para_02
  1. 对于每个细胞i,我们从它的k个最近邻细胞中汇总了信息,重点关注三种关键类型的信息:细胞组成、蛋白质表达和mRNA表达(通过计算内模拟多组学融合)。
  2. 这个汇总过程涉及计算这些特征的平均值,从而为每个细胞生成一个邻域特征向量(NFV),表示为NFVi。
  3. 细胞i邻域中的特征f的NFV计算为:
Para_03
  1. 其中 fk 表示第 k 个最近邻的特征向量。
  2. 如果感兴趣的特征是细胞组成,并且有 M 种不同的细胞类型,fi 是一个 M 维的二进制向量,表示细胞类型的标识。
  3. 如果感兴趣的特征是蛋白质或 mRNA 表达,fi 是一个 p 维的向量,表示表达水平,其中 p 是蛋白质或 mRNA 标记的数量。
Para_04
  1. 我们通过将 k-means 聚类应用于这些 NFV 来识别了保守的、独特的细胞邻域。
  2. 最优聚类数量是基于组内平方和的拐点法确定的,该方法根据点与其各自聚类中心之间的总平方距离量化聚类紧凑性。
Neighborhood characterization

邻里特征描述

Para_01
  1. 为了表征识别出的小区中的分子特征和功能通路,我们进行了差异表达分析和基因集富集分析。
  2. 我们使用双尾精确检验来进行差异表达分析,以识别细胞小区之间的差异表达基因(使用 edgeR v.3.36.0),并通过Benjamini–Hochberg (BH) 方法调整P值以校正多重检验。
  3. 基因集富集分析是通过基于双尾置换的方法对标准化富集评分(使用 fgsea v.1.20.0)进行的,使用标志性基因集来识别富集的通路。
  4. 将单细胞RNA测序数据与空间组学数据整合对于此步骤至关重要。
  5. 多组学整合通过提供更全面的基因表达谱丰富了空间数据,从而能够更深入地表征不同组织微环境的功能状态。

Ecological spatial analyses

生态空间分析

Para_01
  1. 组织样本被切割成一系列标定为(1/2)n(n = 0, 1, 2, …)的网格状斑块,以便进行多尺度分析。
  2. 在每个尺度上,我们计算单个斑块的多样性指数,并取平均值以获得该尺度的整体多样性。
  3. MDI是通过计算拟合到这些特定尺度的多样性指数上的线性回归线的斜率得出的,量化了多样性如何随空间尺度变化。
  4. 为了检查细胞多样性的空间结构,我们使用多样性热图进行空间自相关分析。
  5. 我们通过将样本分割成大约50微米×50微米大小的斑块来生成这种热图,每个斑块包含大约10到20个细胞。
  6. GDI和LDI是从这种热图中得出的,捕捉大范围和局部的多样性模式。
  7. 利用LDI,我们识别出高多样性区域(热点)和低多样性区域(冷点)。
  8. 这种划分使得我们可以深入研究这些定义区域内细胞类型的组成和共存模式,提供了不同于整体组织分析的细胞相互作用和分布动态的不同视角。
  9. 以下各节详细介绍了这些分析步骤。
Spatial tessellation

空间镶嵌

Para_01
  1. 给定一个尺寸为 m × n 的组织样本 S,我们将其分割成一组不重叠的矩形,表示为 ({{{s"}{i"}}}{i = 1}^{t"}),在预定义的尺度 ϵ 下,其中 t 表示矩形块的总数。
  2. 每个矩形 si 的尺寸为 (\frac{m"}{\epsilon }\times \frac{n"}{\epsilon }),其中 ({s"}{i"}\cap {s"}{j,j\ne i"}={\emptyset"}),(\mathop{\bigcup }\nolimits_{i"}^{t"}{s"}_{i"}=S),确保完全覆盖且没有重叠。
  3. 样本中的每个矩形 si 被定义为 ({s"}_{i"}={(x,y)\in {{\mathbb{R"}}}^{2}:a\le x\le a+\frac{m"}{\epsilon },b\le y\le b+\frac{n"}{\epsilon }}),其中 (a, b) 表示 ({{\mathbb{R"}}}^{2}) 中的左下角坐标。
  4. 尺度的选择取决于数据集中细胞的空间密度:对于 CODEX 小鼠脾脏数据集,尺度设置为 ϵ = 64,从而得到大约 30 μm × 30 μm 大小的网格块;
  5. 对于 CODEX CRC 数据集,尺度设置为 ϵ = 32,导致得到更大的网格块,约为 50 μm × 50 μm;
  6. 对于人类肝脏组织的 CosMx 空间转录组数据集,尺度设置为 ϵ = 32,得到大约 50 μm × 50 μm 大小的网格块。
  7. 有关空间镶嵌尺度选择的详细指导,请参阅 MESA 的教程:https://mesa-py.readthedocs.io/en/latest/index.html。
Shannon diversity index

香农多样性指数

Para_01
  1. 香农多样性指数81,表示为H,是一个起源于信息理论但已被广泛应用于各个领域,包括生态学的测量指标。
  2. 该指数量化了预测从数据集中随机抽取的个体数据点类别时的不确定性或熵,并定义为:
Para_02
  1. 在基于细胞类型信息的细胞多样性背景下,S代表不同细胞类型的总数,pi表示属于第i种细胞类型的细胞比例。
  2. 较高的H值表明更大的细胞类型多样性和更异质的细胞组成。
MDI

MDI

Para_01
  1. 设 ϵ > 0 为一个尺度参数,并且 N(ϵ) 表示在尺度 ϵ 下的补丁数量。对于每个补丁 n = 1, 2, …, N(ϵ),我们用 C(n, ϵ) 表示在尺度 ϵ 下补丁 n 中的不同细胞类型的数量。
  2. 令 pc(n, ϵ) 表示在尺度 ϵ 下补丁 n 中细胞类型 c 所占的比例,其中 c = 1, 2, …, C(n, ϵ)。
  3. 我们在尺度 ϵ 下定义多样性指数为
Para_02
  1. 这种表述计算了所有斑块在尺度 ϵ 上的平均熵,量化了每个空间分辨率下的细胞多样性。
  2. MDI 是通过 ID(ϵ) 和 log(ϵ) 之间的线性回归斜率得出的,量化了组织内细胞多样性随空间尺度变化的速度。
GDI and LDI

GDI和LDI

Para_01
  1. 根据我们的空间镶嵌程序,我们在尺度 ϵ 上将组织样本分割为非重叠的斑块。
  2. 在每个斑块内,我们计算香农多样性指数,然后利用该指数组装组织样本的多样性热图。
  3. 通过将莫兰 I 统计量应用于此热图,得出了 GDI,这量化了空间自相关性,如下一节所述。
  4. LDI 是使用局部莫兰 I 统计量计算得出的,并识别细胞多样性中的显著空间聚类模式。
  5. 使用 LDI,我们识别出多样性热点(高多样性值区域被类似高的值包围)和冷点(低多样性值区域被低值包围)。
Moran’s I

莫兰指数

错误!!! - 待补充

Para_02
  1. 其中 N 是斑块的数量,({\mathcal{W"}}=\mathop{\sum }\nolimits_{i = 1}^{N"}\mathop{\sum }\nolimits_{j = 1}^{N"}{w"}{ij"}) 是所有空间权重 (w{ij"}) 的总和,这些权重量化了斑块 i 和斑块 j 之间的空间关系。
  2. 在我们的研究中,如果斑块 i 和斑块 j 是空间邻居,则设置 (w_{ij"}=1),否则 (w_{ij"}=0)。
  3. 通过将多样性热图表示为二维网格来构建空间权重矩阵 ({\mathcal{W"}}),其中通常使用车棋(rook)结构元素建立空间单元之间的连接,如果两个单元共享一条边,则认为它们是邻居。
  4. 结构元素的替代选择包括主教(bishop)(共享顶点)或女王(queen)(共享边或顶点),这取决于所需的空间连续性标准。
  5. 值范围从 -1(完全分散)到 1(完全相关),正值表示空间聚类,负值表示分散,零表示没有空间自相关。
Local Moran’s I

局部莫兰指数

Para_01
  1. Local Moran’s I 在位置特定级别衡量空间自相关。
  2. 对于斑块 i 的 Local Moran’s I 定义为:
Para_02
  1. wij 是空间权重矩阵 ({\mathcal{W"}}) 的元素,定义了斑块 i 和 j 之间的空间连接性,zi 和 zj 如上所述是与平均值的偏差。
  2. 为了评估观察到的局部莫兰指数 I 值的统计显著性,使用了置换方法,在我们的分析中,设定置换次数为 999 次。
Para_03
  1. 热点和冷点——定义为高或低局部莫兰指数值的空间聚类,周围被相似值包围——是基于预先确定的显著性阈值来识别的:脾脏和肝脏数据集为 P = 0.01,结直肠癌(CRC)数据集为 P = 0.05,因为观察到一些CRC组织中的细胞密度较低。对于实际应用,我们建议使用显著性图来可视化组织,其中每个斑块都通过局部莫兰指数值的显著性水平进行注释(补充图21)。虽然0.01的P值阈值通常会产生稳健的结果,但可以放宽到0.05以适应稀疏的细胞分布。LDI量化局部空间自相关性,并能够识别多样性热点和冷点,而GDI测量整个组织的空间自相关性以揭示大规模的多样性模式。
  2. 这是一句话
DPI

DPI

Para_01
  1. 我们通过使用邻接连通组件标记(ndimage.label,scipy,v.1.11.2)将相邻的热点或冷点分组来识别连续的‘多样性岛’。
  2. 受到岛屿生物地理学的启发,我们引入了DPI。
Para_02
  1. Si 表示每个识别出的岛屿的面积,di 表示从岛屿 i 到其最近邻岛屿的最短距离。
  2. 较低的 DPI 值表示较小且分布更广的岛屿,而较高的 DPI 值则反映较大的、更接近的岛屿。
Bray–Curtis dissimilarity

Bray–Curtis不相似性

Para_01
  1. 我们使用 Bray-Curtis 相异度来评估两个岛屿之间的细胞组成,Bray-Curtis 相异度定义为:
Para_02
  1. 其中 xi 表示岛屿 x 中第 i 种细胞类型的数量,yi 表示岛屿 y 中第 i 种细胞类型的数量(空间距离 Bray-Curtis,scipy 版本 1.11.2)。
  2. ,
Cell-type frequency and cohabitation

细胞类型频率和共存

Para_01
  1. 我们通过量化每种细胞类型的频率以及在多样性热点和冷点内及整个组织中的细胞类型对共存频率来分析细胞组成。
  2. 特定细胞类型i的频率计算为Ni/Ntotal,其中Ni是i型细胞的数量,Ntotal是感兴趣区域内的总细胞数量。
  3. 具体而言,对于整个组织的分析,Ntotal是组织样本中所有细胞的总和,而对于热点和冷点的分析,Ntotal对应于这些划定区域内的细胞数量。
Para_02
  1. 细胞类型i和j的共存频率定义为:
Para_03
  1. 对于整个组织的分析,Nij 是包含两种细胞类型的斑块数量,Npatches,total 是整个组织中的斑块总数。
  2. 对于热点和冷点分析,Nij, 热点 或 Nij, 冷点 分别是包含两种细胞类型 i 和 j 的斑块数量在这些区域内的数量。
  3. 我们将这个值除以被识别为热点或冷点的斑块总数,分别表示为 Npatches,hotspots 或 Npatches,coldspots:
Para_04
  1. 这提供了一个标准化的细胞共存测量方法,并使得不同细胞分布的组织区域可以进行标准比较。
  2. 统计显著性是通过Welch’s t检验来评估不同条件下细胞类型频率和共存模式的差异,P值使用BH过程进行调整以控制错误发现率。
Survival analysis

生存分析

Para_01
  1. 我们使用Cox比例风险回归模型(lifelines,版本0.27.7)评估了多样性指标对结直肠癌患者生存的预后价值。
  2. 该模型使用跨尺度的多样性指数并通过五重交叉验证进行拟合。
  3. 通过一致性指数(C-index)评估了模型性能,该指数量化了对患者生存时间排序的预测准确性。
  4. 我们将基于病理学家注释的CLR/DII亚型、自动计算的多样性指数以及两者的结合的模型在交叉验证中的C-index值进行了比较。

Data availability

Para_01
  1. 所有用于本文档的数据均可通过以下链接公开获取。CODEX 扁桃体数据32:https://doi.org/10.1002/eji.202048891;单细胞 RNA 测序扁桃体数据40:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE165860;CODEX 小鼠脾脏数据2:https://doi.org/10.1016/j.cell.2018.07.010;CODEX CRC 数据33:https://doi.org/10.1016/j.cell.2020.07.005;单细胞 RNA 测序 CRC 数据59:https://doi.org/10.1016/j.cell.2021.08.003;CosMx 肝脏数据34:https://doi.org/10.1038/s41587-022-01483-z;单细胞 RNA 测序肝脏数据74:https://doi.org/10.1016/j.jhep.2021.06.028;CellChatDB 数据库86:https://doi.org/10.1038/s41467-021-21246-9。

Code availability

Para_01
  1. MESA代码87可以通过https://mesa-py.readthedocs.io/en/latest/访问,也可以通过https://github.com/Feanor007/MESA在GitHub上访问。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-05-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信菜鸟团 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Basic Information
  • Abstract
  • Main
  • Results
    • Overview of the MESA pipeline
    • Multiomics analysis enhances tonsil niche characterization
    • Eco-spatial analysis reveals autoimmune tissue remodeling
    • MESA improves prognostic capabilities for CRC
    • MESA augments functional analysis for liver cancer
  • Discussion
  • Methods
    • Multiomics spatial analyses
      • Multiomics data fusion with MaxFuse
      • Neighborhood identification
      • Neighborhood characterization
    • Ecological spatial analyses
      • Spatial tessellation
      • Shannon diversity index
      • MDI
      • GDI and LDI
      • Moran’s I
      • Local Moran’s I
      • DPI
      • Bray–Curtis dissimilarity
      • Cell-type frequency and cohabitation
      • Survival analysis
  • Data availability
  • Code availability
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档