前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >使用SingleR构建自定义细胞亚群数据库

使用SingleR构建自定义细胞亚群数据库

作者头像
生信技能树jimmy
发布2022-01-10 09:16:45
7060
发布2022-01-10 09:16:45
举报
文章被收录于专栏:单细胞天地

前面的教程:混合到同一个10X样品里面的多个细胞系如何注释,我们提到了可以使用细胞系的表达量矩阵去跟细胞亚群表达量矩阵进行相关性计算,然后就可以判断细胞亚群的生物学意义啦。当然了,我们也给出来了一个比较不错的可视化方法,见:如果你觉得相关性热图不好看,或者太简陋

如何很多朋友留言问,为什么不使用现成的工具呢,比如SingleR就构建自定义细胞亚群数据库。我们当然知道这样的工具很好用,但是我们要分享的是技术细节,如果一切都使用现成的工具,就都被包装起来了,成为了一个黑匣子。

而现成工具,其实就在于熟读文档罢了,SingleR构建自定义细胞亚群数据库,我这里也给大家演示一下:

代码语言:javascript
复制
rm(list = ls())
library(SingleR)
library(Seurat)
library(ggplot2)

# 读入scRNA数据 -------
scRNA <- readRDS("../step1_聚类/sce_all.Rds")
table(Idents(scRNA) )
Idents(scRNA) <- "RNA_snn_res.0.2"
table(Idents(scRNA) )
# 读入参考数据集 -------
Ref <- read.csv("../step2_注释/processed_reference.csv")
Ref <- textshape::column_to_rownames(Ref, loc = 1)
head(Ref)

可以看到每个细胞系都有自己的表达量,如下所示的一个矩阵,在R里面就是一个数据框。

参考细胞系表达量矩阵

接下来才是SingleR构建自定义细胞亚群数据库,其实调用的是SingleCellExperiment这个对象构建的模式,主要是scater包需要学习一下,代码如下:

代码语言:javascript
复制

ref_sce=SingleCellExperiment::SingleCellExperiment(assays=list(counts=Ref))
ref_sce=scater::logNormCounts(ref_sce)
library(SingleCellExperiment)
logcounts(ref_sce)[1:4,1:4]
colData(ref_sce)$Type=colnames(Ref)
ref_sce

有了SingleR构建自定义细胞亚群数据库,接下来我们只需要把自己的单细胞矩阵提取出来即可;

代码语言:javascript
复制

testdata <- GetAssayData(scRNA, slot="data")

pred <- SingleR(test=testdata, ref=ref_sce, 
                labels=ref_sce$Type,
                #clusters = scRNA@active.ident
)
table(pred$labels)
head(pred) 

可以看到,两个矩阵使用SingleR函数处理一下,就可以拿到了 单细胞的亚群映射关系,如下所示:

代码语言:javascript
复制
> as.data.frame(table(pred$labels))
        Var1 Freq
1    HEK293T  835
2   MCF10A.x   71
3   MCF10A.y  396
4     MCF7.x   30
5     MCF7.y 1177
6 MDAMB134VI  478
7      SUM44  316
8     T47D.x  966
9     T47D.y  345

这个时候的我们也可以把SingleR对细胞系表达量矩阵和我们单细胞矩阵的相关性矩阵提取出来:

代码语言:javascript
复制
pred@listData[["scores"]]

就是前面的 全部的细胞系和全部的具体的每个单细胞的表达相关性矩阵(Pearson correlation coefficient)

表达相关性矩阵(Pearson correlation coefficient)

可以看到,殊路同归!

如果你对单细胞数据分析还没有基础认知,可以看基础10讲:

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-07-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 单细胞天地 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档