前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >seurat3的merge功能和cellranger的aggr整合多个10X单细胞转录组对比

seurat3的merge功能和cellranger的aggr整合多个10X单细胞转录组对比

作者头像
生信技能树jimmy
发布2020-03-30 11:35:38
1.6K0
发布2020-03-30 11:35:38
举报
文章被收录于专栏:单细胞天地单细胞天地

昨天我在单细胞天地的教程:使用seurat3的merge功能整合8个10X单细胞转录组样本 完完整整的展示了如何使用seurat3的merge功能整合8个10X单细胞转录组样本,因为这个数据集的文章作者使用的是cellranger流程,而且我们在单细胞天地多次分享过流程笔记,大家可以自行前往学习,如下:

我们得比较一下,作者的ellranger的aggr整合多个10X单细胞转录组得到的表达矩阵,跟我们使用seurat3的merge功能整合8个10X单细胞转录组样本后的表达矩阵是否有差异。

幸运的是,作者在GEO数据库也放上去了自己ellranger的aggr整合多个10X单细胞转录组得到的表达矩阵,所以我们只需要下载走seurat3的降维分群即可跟昨天的教程:使用seurat3的merge功能整合8个10X单细胞转录组样本 聚类分群结果进行对比啦!

首先走seurat3的降维分群流程

代码语言:javascript
复制
library(Seurat)
sce=CreateSeuratObject(counts = Read10X('input/'), 
                     project = 'merge' )

# 步骤 ScaleData 的耗时取决于电脑系统配置(保守估计大于一分钟)
sce <- ScaleData(object = sce, 
                     vars.to.regress = c('nCount_RNA'), 
                     model.use = 'linear', 
                     use.umi = FALSE)
sce <- FindVariableFeatures(object = sce, 
                                mean.function = ExpMean, 
                                dispersion.function = LogVMR, 
                                x.low.cutoff = 0.0125, 
                                x.high.cutoff = 4, 
                                y.cutoff = 0.5)
length(VariableFeatures(sce)) 
sce <- RunPCA(object = sce, pc.genes = VariableFeatures(sce))
# 下面只是展现不同降维算法而已,并不要求都使用一次。
sce <- RunICA(sce )
sce <- RunTSNE(sce )
#sce <- RunUMAP(sce,dims = 1:10)
#VizPCA( sce, pcs.use = 1:2)
DimPlot(object = sce, reduction = "pca") 
DimPlot(object = sce, reduction = "ica")
DimPlot(object = sce, reduction = "tsne")
#DimPlot(object = sce, reduction = "umap")

# 针对PCA降维后的表达矩阵进行聚类 FindNeighbors+FindClusters 两个步骤。
sce <- FindNeighbors(object = sce, dims = 1:20, verbose = FALSE) 
sce <- FindClusters(object = sce, resolution = 0.3,verbose = FALSE)
# 继续tSNE可视化
DimPlot(object = sce, reduction = "tsne",group.by = 'RNA_snn_res.0.3')
DimPlot(object = sce, reduction = "tsne",
        group.by = 'orig.ident')
head(rownames(sce@meta.data))
tail(rownames(sce@meta.data))
library(stringr)
table(str_split(rownames(sce@meta.data),'-',simplify = T)[,2],
      sce@meta.data$RNA_snn_res.0.3)

可以看到4个发育时期的8个样本,仍然是同一个发育时期的2个样本非常类似,不同发育时期的样本就差异很大。所以也可以理解为10X单细胞转录组的样本批次效应被去除了。

这些细胞亚群的tSNE图如下:

结论就是seurat3的merge功能和cellranger的aggr整合多个10X单细胞转录组的效果是类似的,但是仍然是有学员提出merge完全不带任何样本效应处理的功能,就只是合并一下数据,这个时候SCtransform就值得拥有。

我们下一讲会详细说明,其实大家也可以自己看看试试看更多数据整合,去除批次效应算法,比如

这本书基本上都介绍了:https://broadinstitute.github.io/2019_scWorkshop/correcting-batch-effects.html

仔细检查两次分类

前面我们虽然得到的结论都是同一个发育时期的2个样本非常类似,不同发育时期的样本就差异很大。实际上,我们有着8个样本的详细信息,是可以深入比较每个细胞的:

需要注意的是样本命名方式不一样,所以要仔细调整顺序哦。

可以看到,两次聚类分群几乎一致,只不过是分的群的数量不一样,所以稍微有一点差异。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-10-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 单细胞天地 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 首先走seurat3的降维分群流程
  • 仔细检查两次分类
相关产品与服务
批量计算
批量计算(BatchCompute,Batch)是为有大数据计算业务的企业、科研单位等提供高性价比且易用的计算服务。批量计算 Batch 可以根据用户提供的批处理规模,智能地管理作业和调动其所需的最佳资源。有了 Batch 的帮助,您可以将精力集中在如何分析和处理数据结果上。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档