前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >空间转录组|数据读入,标准数据形式外,还有哪些"天残地缺"可以读取

空间转录组|数据读入,标准数据形式外,还有哪些"天残地缺"可以读取

作者头像
生信补给站
发布2023-08-25 10:19:25
1.1K0
发布2023-08-25 10:19:25
举报
文章被收录于专栏:生信补给站

空间转录组测序可以同时获得细胞的空间位置信息和基因表达数据,虽然囿于当前单个spot的精度问题,但是在组织细胞功能,肿瘤生物学、发育过程等需要空间位置的研究领域仍然可以提供很多非常有价值的东西。

本节会在spaceranger处理fastq,Seurat处理标准数据(h5 + spatial文件夹)外,额外提供以下几种情况如何处理

(1)raw/filtered_feature_bc_matrix 的三个文件 + spatial 文件夹

(2)矩阵文件 + spatial 文件夹

(3)spatial文件夹如果只提供了tissue_hires_image.png

(4)未提供spatial文件夹,只提供了位置信息

数据来源于2022年CELL 文章 A human fetal lung cell atlas uncovers proximal-distal gradients of differentiation and key regulators of epithelial fates 中的空转Fastq数据(E-MTAB-11265)。

一 fastq数据,spaceranger分析

如若初始是fastq数据,首先在10X官网(https://www.10xgenomics.com/cn/support/software/space-ranger/downloads)下载spaceranger软件然后安装,仍然是使用count参数处理fastq 数据即可。

代码语言:javascript
复制
/path/spaceranger count --id=6332STDY10289523 \
--transcriptome=/path/refdata-gex-GRCh38-2020-A/ \
--fastqs=/path/ST_data/ \
--sample=6332STDY10289523 \
--image=/path/V10S24-031_D1.jpg \
--slide=V10S24-031 \
--area=D1

注意slide 和 area的参数 ,可能来源于图片的命名(本示例中的V10S24-031_D1.jpg) ,可能来自于method 或者code的链接中。

如果没有slide信息的话,可以设置为--unknown-slide

二 Seurat 数据读入

上面spaceranger count后会得到outs文件夹,里面有网页版的质控报告,loupe文件,spatial文件夹 和 h5文件等,用于后续分析。

1, Load10X_Spatial 最优输入

outs文件夹中的 filtered_feature_bc_matrix.h5 + spatial文件夹 ,注意这两部分结果需要在同一级。

代码语言:javascript
复制
library(Seurat)
library(hdf5r)
spe = Load10X_Spatial(data.dir = "./outs/",
                            filename = "filtered_feature_bc_matrix.h5",
                            assay = "Spatial", 
                            slice = "Lung")
head(spe@meta.data,2)
#                      orig.ident nCount_Spatial nFeature_Spatial
#AAACAAGTATCTCCCA-1 SeuratProject           7232             2774
#AAACACCAATAACTGC-1 SeuratProject          20915             6318

#空转的话,就是SpatialFeaturePlot ,相较于单细胞转录组的FeaturePlot
SpatialFeaturePlot(spe, features = "nFeature_Spatial")

额,报错了,如下:

Error in FUN(left, right) : non-numeric argument to binary operator

推荐google搜索,解决方法如下(将spe@images$Lung@coordinates的信息改为):

代码语言:javascript
复制
for (i in colnames((spe@images$Lung@coordinates))) {
  spe@images$Lung@coordinates[[i]] <- as.integer(spe@images$Lung@coordinates[[i]])
}

再次尝试,问题解决,注意如果你的数据没有该报错可以不用as.integer 这部分!!!

代码语言:javascript
复制
SpatialFeaturePlot(spe, features = "nFeature_Spatial")

p0 <- SpatialDimPlot(spe,alpha = 0)
p1 <- SpatialDimPlot(spe,alpha = 1)
p0 + p1

非常建议通过 str(spe)查看一下空转的数据结构 ,有助于后续更好的分析!

2,10X的三个文件 + spatial文件夹

默认的Load10X_Spatial函数不能像单细胞转录组一样直接读取3个文件,通过View(Load10X_Spatial) 发现该函数写的比较死。其实我们只需要提取前面读取单细胞数据部分,使用Read10X即可

代码语言:javascript
复制
spe2 = Read10X("./outs/filtered_feature_bc_matrix/")
image2 <- Read10X_Image(image.dir = file.path("./outs/", 
                                              "spatial"), filter.matrix = TRUE)
spe2 <- CreateSeuratObject(counts = spe2, assay = "Spatial")

image2 <- image2[Cells(x = spe2)]
DefaultAssay(spe2 = image2) <- "Spatial"
spe2[["slice1"]] <- image2
#没有报错,无需转化
for (i in colnames((spe2@images$slice1@coordinates))) {
  spe2@images$slice1@coordinates[[i]] <- as.integer(spe2@images$slice1@coordinates[[i]])
}

SpatialFeaturePlot(spe2, features = "nFeature_Spatial")

而Load10X_Spatial函数中的spe2[["slice1"]] 部分,也就是为什么在默认情况下image的slide 名字是slice1 ,所以如果多样本分析的时候记得改名字

3,读取rds文件

部分文献会提供rds文件,但是因为版本不一致常会遇到问题

代码语言:javascript
复制
spe3 <- readRDS("./STData/P1N_Spatial.rds")

SpatialFeaturePlot(spe3 , features = "MS4A1")

google检索解决方案:https://github.com/satijalab/seurat/issues/6312 ,可以UpdateSeuratObject 一下

代码语言:javascript
复制
spe3<- UpdateSeuratObject(spe3)
SpatialFeaturePlot(spe3, features = "MS4A1")

4,只提供 tissue_hires_image.png

spatial文件夹中会有tissue_hires_image.png和 tissue_lowres_image.png 两种tiff图,而Read10X_Image 函数中默认读取 tissue_lowres_image.png图,

因此如果(1)文献只提供了tissue_hires_image.png 或者(2)想绘制高清一些的图,可以使用如下的方法

4.1 尚无Seurat object

文献只提供hires图时候直接使用Load10X_Spatial会报错,可以先指定使用tissue_hires_image图片 ,如下

代码语言:javascript
复制

img = Read10X_Image("./outs/spatial/", 
                    image.name = "tissue_hires_image.png")
spe4 = Load10X_Spatial("./outs/", image = img)
spe4@images$slice1@scale.factors$lowres = spe4@images$slice1@scale.factors$hires
#没有报错,无需转化
for (i in colnames((spe4@images$slice1@coordinates))) {
  spe4@images$slice1@coordinates[[i]] <- as.integer(spe4@images$slice1@coordinates[[i]])
}
#对比一下两张图的差异
p1 <- SpatialFeaturePlot(spe2, features = "nFeature_Spatial")
p2 <- SpatialFeaturePlot(spe4, features = "nFeature_Spatial")
p1 + p2

其他的图可能会差异更明显。

4.2 已有Seurat object

如果前面已经创建了seurat object ,不想从头分析的话 也可以直接替换的,如下先重新定义一个spe5

代码语言:javascript
复制
spe5 <- spe2

lowres = spe5@images$slice1
hires = Read10X_Image("./outs/spatial/", 
                      image.name = "tissue_hires_image.png")

hires@scale.factors$lowres = hires@scale.factors$hires
#Set the assay and key to the same as the lowres (I'm not sure if this is necessary or not).
hires@assay = lowres@assay
hires@key = lowres@key
#Finally, add the image into the object and everything should be good!
spe5@images$slice1 = hires
#没有报错,无需转化
for (i in colnames((spe5@images$slice1@coordinates))) {
  spe5@images$slice1@coordinates[[i]] <- as.integer(spe5@images$slice1@coordinates[[i]])
}

p1 <- SpatialFeaturePlot(spe2, features = "nFeature_Spatial")
p2 <- SpatialFeaturePlot(spe5, features = "nFeature_Spatial")
p1 + p2

该解答来源于https://github.com/satijalab/seurat/discussions/4833

5,只提供位置信息

没有提供spatial文件夹,只提供了空转spot的位置信息,可以按照单细胞的方式读取,但是无法绘制如上的空转切片为背景的图。

以上是总结的一些空转数据的读入方式,请查收!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-06-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信补给站 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1, Load10X_Spatial 最优输入
  • 2,10X的三个文件 + spatial文件夹
  • 3,读取rds文件
  • 4,只提供 tissue_hires_image.png
  • 5,只提供位置信息
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档