词汇 | 解释 |
---|---|
Aggregation problem | a variation in the results will be observed when we use alternative combinations of areal units, even on the same scale. |
Bandwidth | a parameter describing how localized a geographically weighted regression model is. |
Curse of dimensionality | the higher the number of dimensions used, the more equidistant the observations are. |
Geographically weighted regression (GWR) | a method that takes spatial heterogeneity into account because it allows for the relationships between the independent and the dependent variables to alter locally. |
Global spatial autocorrelation measures | statistics assessing the degree of spatial autocorrelation for a variable in the whole dataset. |
Hot and cold spots | aggregations in space of high (hot) or low (cold) values for a variable. |
Interesting locations | a term used instead of “statistically significant” when considering pseudo-p-values in multivariate space. |
Local indicators of multivariate spatial association (LIMSA) | measure of the extent to which neighbors in multivariate space (i.e., spots with gene expression profiles similar to each other) are also neighbors in geographical space. |
Local indicators of spatial association (LISA) | see local spatial autocorrelation measures |
Local spatial autocorrelation measures | statistics assessing the degree of spatial autocorrelation for a variable in every location compared to its neighbors. |
Modifiable aerial unit problem (MAUP) | the choice of spatial data aggregation scale will influence the statistical relationships and process understanding from analyses. |
Multiscale GWR (MGWR) | geographically weighted regression that operates in multiple scales by identifying the best bandwidth for each independent variable. |
Pseudo-p-value | a p value calculated from a normal distribution generated by computational permutations that must be treated with caution. |
Scale problem | different results will be obtained when we aggregate the same set of data on different scales. |
Spatial autocorrelation (SA) | nearby observations tend to be similar, violating one of the major assumptions of classical statistics—that of observation independence. |
Negative SA | nearby values tend to be dissimilar. |
Positive SA | nearby values tend to be similar. |
Spatial heterogeneity | the factors associated with an outcome, and therefore the process, will vary in space. Also referred to as spatial non-stationarity. |
(1) :空间精度,当然生物学上最好是单细胞精度 (2): 空间相关性,即空间角度细胞之间的相互影响 (3):空间异质性,即空间的时空变化
空间转录组学实验产生了生物组织的图谱,以及关于该图谱上位置的相关信息(一系列基因的表达)。通常,这些信息被分析为若干区域,可以是从单个细胞到大型多细胞组织的任何部分。如果改变空间区域的大小,可以得到不同的结果。
一切事物都与其他事物有关,但近处的事物比远处的事物更相关。
空间邻域可以由距离来定义,并且空间相关性可以分析空间的邻域变量(细胞和基因)。
细胞的行为受到其周围环境的影响,包括细胞内信号和与邻近细胞的直接接触。因此,这意味着细胞变量(例如表达的基因),当在其空间环境中考虑时,取决于其周围环境。这表明,公认的scRNA-seq分析统计方法并不完全适合从空间定向的空间转录组学实验中分析数据,因为单细胞的假设检验是独立的。
空间异质性描述了一个过程在定义区域内不同位置的变化。像单个基因表达这样的单个变量可以在组织的不同部分发生变化,在这种情况下,这个单个基因被认为表现出空间异质性。例如肿瘤微环境,肿瘤微环境往往伴随着强烈的区域变异。
标准聚类分析不考虑值的空间分布,只考虑值的相似性。
而如果考虑空间信息,需要考虑基因表达的空间模式,从而导致hotspot和/或coldspot,从而影响聚类。
应该区分空间聚类和空间位置加权聚类,空间聚类试图分析空间上表达相似的区域,空间位置加权聚类则需要考虑空间特征。
所有的转录组学实验,无论是bulk、单细胞还是空间,都在分析基因表达。空间转录组学提供了将这种表达体现到组织上特定位置的能力,这也可能与特定过程或细胞的存在有关。生成基因表达的空间图可以揭示对这些基因功能的过程见解。更重要的是,通过考虑空间相关性并在适当的尺度上检查空间异质性,有可能探索一个生物学过程在空间上的潜在平稳性或非平稳性。
主要是空间形态学注释。
空间转录组学作为一种技术的历史很短,这也意味着用于空间转录组数据分析的工具正在激增。在许多情况下,这些工具利用了为批量或更常见的单细胞分析开发的技术,并将其直接应用于空间转录组学数据。空间转录组学数据的分析方法包括聚类、去卷积、图像分割、3D重建、细胞-细胞相互作用和数据集成等。
聚类是一种有用的工具,因为它对数据进行结构化和排序,允许从复杂的多变量数据集中获得有用的见解,随后,使用这些见解对观察到的数据进行分类或生成假设。例如,Louvain聚类使用Visium数据揭示了健康和患病肝组织的区域模式。
分辨率大于单细胞的空间转录组学技术,如Visium,通常需要基因表达去卷积,以帮助了解捕获区域的细胞类型组成。最常见的去卷积方法依赖于相关的scRNA-seq数据集,该数据集可作为识别空间转录组学数据集中每种细胞类型比例的参考。许多计算方法被用来利用这些参考数据来对空间转录组学数据进行去卷积,包括深度学习和人工智能、贝叶斯模型以及其他统计方法。
与反卷积相反,高分辨率技术通常需要对空间spot进行合并。这可以使用图像分割方法来识别组织的高分辨率显微镜图像中的细胞边界来实现。分割方法可以使用检测到的转录组的分布,例如Baysor,或者可以将组织学图像数据与空间转录组学相结合。
空间转录组学数据很少单独存在,通常需要将它们与其他相关数据类型相结合,以丰富对单个数据集的解释。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。