前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >单细胞亚群细胞数量不一致,如何实现抽样?

单细胞亚群细胞数量不一致,如何实现抽样?

作者头像
生信技能树jimmy
发布2021-05-18 12:23:41
3.7K0
发布2021-05-18 12:23:41
举报
文章被收录于专栏:单细胞天地单细胞天地

分享是一种态度

有人提问,他自己做单细胞的gsva, 细胞通讯,转录因子,拟时序, inferCNV这些分析,发现特别的消耗计算资源,因为项目很多,每个细胞亚群都是过万的细胞。希望可以将这些单细胞亚群进行抽样,使得其细胞数量一致。

我们以 seurat 官方教程为例:

代码语言:javascript
复制
rm(list = ls())
library(Seurat)
# devtools::install_github('satijalab/seurat-data')
library(SeuratData)
library(ggplot2)
library(patchwork)
library(dplyr)
load(file = 'basic.sce.pbmc.Rdata')

DimPlot(pbmc, reduction = 'umap', 
        label = TRUE, pt.size = 0.5) + NoLegend()

sce=pbmc

如果你不知道 basic.sce.pbmc.Rdata 这个文件如何得到的,麻烦自己去跑一下 可视化单细胞亚群的标记基因的5个方法,自己 save(pbmc,file = 'basic.sce.pbmc.Rdata') ,我们后面的教程都是依赖于这个 文件哦!

比如subset函数就有downsample参数

使用起来超级方便,subset(sce, downsample = 15) 即可,全部的 代码如下:

代码语言:javascript
复制
features= c('IL7R', 'CCR7','CD14', 'LYZ',  'IL7R', 'S100A4',"MS4A1", "CD8A",'FOXP3',
            'FCGR3A', 'MS4A7', 'GNLY', 'NKG7',
            'FCER1A', 'CST3','PPBP')

DoHeatmap(subset(sce ), 
          features = features, 
          size = 3
          )
table(Idents(sce))
DoHeatmap(subset(sce, downsample = 15), 
          features = features, size = 3)

抽样前后很容易看出来:

可以看到:

自己写函数进行抽样

代码语言:javascript
复制

# 每个细胞亚群抽10 
allCells=names(Idents(sce))
allType = levels(Idents(sce))

choose_Cells = unlist(lapply(allType, function(x){
  cgCells = allCells[Idents(sce)== x ]
  cg=sample(cgCells,10)
  cg
}))

cg_sce = sce[, allCells %in% choose_Cells]
cg_sce
table(Idents(cg_sce))

可以看到抽样很成功:

代码语言:javascript
复制
> as.data.frame(table(Idents(cg_sce)))
          Var1 Freq
1  Naive CD4 T   10
2   CD14+ Mono   10
3 Memory CD4 T   10
4            B   10
5        CD8 T   10
6 FCGR3A+ Mono   10
7           NK   10
8           DC   10
9     Platelet   10

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-05-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 单细胞天地 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 比如subset函数就有downsample参数
  • 自己写函数进行抽样
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档