首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

[Nature Methods] SpaGCN:整合基因表达、空间位置和组织学,通过图卷积网络识别空间域和空间可变基因

今天为大家解读一篇发布于Nature Methods的论文 SpaGCN: Integrating gene expression, spatial location and histology to identify spatial domains and spatially variable genes by graph convolutional network。近些年来,空间转录组学发展迅速。随着空间分辨转录组学(SRT)技术的发展,探究组织微环境背景下的基因表达模式成为可能。为了探究空间基因表达的模式,作者提出了SpaGCN,这是一种图形卷积网络方法,该方法将基因表达、组织空间位置和组织学图像相结合。通过图卷积从相邻点的位置聚集每个位点的基因表达,从而能够识别出具有一致表达和组织学的空间域。随后进行结构域差异表达(DE)分析,检测在已识别出的结构域中表达量大的基因。利用该模型对7个SRT数据集进行分析,该模型可以比之前的方法检测到具有更丰富的空间表达模式的基因。此外,SpaGCN检测到的基因表达模式是可迁移的,可用于研究其他数据集中基因表达的空间变异。并且SpaGCN具有计算速度快,平台独立等优点,使其成为各种SRT研究的理想工具。

01

Spark——RDD

全称为Resilient Distributed Datasets,弹性分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变,可分区,里面的元素可并行计算的集合。RDD在逻辑上是一个数据集,在物理上则可以分块分布在不同的机器上并发运行。RDD允许用户在执行多个查询时显示的将工作缓存在内存中,后续的查询能够重用工作集,这极大的提升了查询速度。 在Spark 中,对数据的所有操作不外乎创建RDD,转换已有RDD以及调用RDD操作进行求值,每个RDD都被分为多个分区,这些分区运行在集群的不同节点上,RDD可以包含Python,Java,Scala中任意类型的对象,甚至可以是用户自定义对象。 RDD是Spark的核心,也是整个Spark的架构基础。它的特性可以总结如下:

04
领券