专栏首页生信菜鸟团使用SingleR构建自定义细胞亚群数据库

使用SingleR构建自定义细胞亚群数据库

前面的教程:混合到同一个10X样品里面的多个细胞系如何注释,我们提到了可以使用细胞系的表达量矩阵去跟细胞亚群表达量矩阵进行相关性计算,然后就可以判断细胞亚群的生物学意义啦。当然了,我们也给出来了一个比较不错的可视化方法,见:如果你觉得相关性热图不好看,或者太简陋

如何很多朋友留言问,为什么不使用现成的工具呢,比如SingleR就构建自定义细胞亚群数据库。我们当然知道这样的工具很好用,但是我们要分享的是技术细节,如果一切都使用现成的工具,就都被包装起来了,成为了一个黑匣子。

而现成工具,其实就在于熟读文档罢了,SingleR构建自定义细胞亚群数据库,我这里也给大家演示一下:

rm(list = ls())
library(SingleR)
library(Seurat)
library(ggplot2)

# 读入scRNA数据 -------
scRNA <- readRDS("../step1_聚类/sce_all.Rds")
table(Idents(scRNA) )
Idents(scRNA) <- "RNA_snn_res.0.2"
table(Idents(scRNA) )
# 读入参考数据集 -------
Ref <- read.csv("../step2_注释/processed_reference.csv")
Ref <- textshape::column_to_rownames(Ref, loc = 1)
head(Ref)

可以看到每个细胞系都有自己的表达量,如下所示的一个矩阵,在R里面就是一个数据框。

参考细胞系表达量矩阵

接下来才是SingleR构建自定义细胞亚群数据库,其实调用的是SingleCellExperiment这个对象构建的模式,主要是scater包需要学习一下,代码如下:

ref_sce=SingleCellExperiment::SingleCellExperiment(assays=list(counts=Ref))
ref_sce=scater::logNormCounts(ref_sce)
library(SingleCellExperiment)
logcounts(ref_sce)[1:4,1:4]
colData(ref_sce)$Type=colnames(Ref)
ref_sce

有了SingleR构建自定义细胞亚群数据库,接下来我们只需要把自己的单细胞矩阵提取出来即可;

testdata <- GetAssayData(scRNA, slot="data")

pred <- SingleR(test=testdata, ref=ref_sce, 
                labels=ref_sce$Type,
                #clusters = scRNA@active.ident
)
table(pred$labels)
head(pred) 

可以看到,两个矩阵使用SingleR函数处理一下,就可以拿到了 单细胞的亚群映射关系,如下所示:

> as.data.frame(table(pred$labels))
        Var1 Freq
1    HEK293T  835
2   MCF10A.x   71
3   MCF10A.y  396
4     MCF7.x   30
5     MCF7.y 1177
6 MDAMB134VI  478
7      SUM44  316
8     T47D.x  966
9     T47D.y  345

这个时候的我们也可以把SingleR对细胞系表达量矩阵和我们单细胞矩阵的相关性矩阵提取出来:

pred@listData[["scores"]]

就是前面的 全部的细胞系和全部的具体的每个单细胞的表达相关性矩阵(Pearson correlation coefficient)

表达相关性矩阵(Pearson correlation coefficient)

可以看到,殊路同归!

如果你对单细胞数据分析还没有基础认知,可以看基础10讲:

往期回顾

一模一样又有何难

我以为我画错了

这算是不一样吗

OSCA单细胞数据分析笔记13—Multi-sample comparison




如果你对单细胞转录组研究感兴趣,但又不知道如何入门,也许你可以关注一下下面的课程

本文分享自微信公众号 - 生信菜鸟团(bio_123456789),作者:生信技能树

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2021-07-23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 单细胞类型注释工具singleR

    目前用于单细胞类型鉴定的工具有很多,我们认为比较适合大众直接上手使用的软件就是singleR了。那么,singleR到底是如何实现细胞注释的呢?今天,我们就一起...

    生信交流平台
  • 使用SingleR对小鼠免疫单细胞自动注释并不可靠

    让我想起来了被免疫细胞里面的淋巴系和髓系的细胞细分群及注释支配的恐惧,虽然在前面的例子:人人都能学会的单细胞聚类分群注释 ,我们演示了第一层次的分群,但是第二...

    生信菜鸟团
  • 细胞亚群注释神器SingleR把它的参考数据库放在了celldex包

    最近在这个教程下面看到了一下留言,说下载SingleR 的数据库失败。我帮忙看了看, 注意到 Revised: June 14th, 2020的时候Single...

    生信技能树
  • 文献分享——SingleR包来源

    前言背景小知识肺中2种巨噬细胞端粒相关基因——TRF1ssGSEA分析条件培养基(conditioned medium)正文PART1:前言PART2:关于Si...

    生信技能树jimmy
  • celaref ||单细胞细胞类型定义工具

    Sarah Williams (2019). celaref: Single-cell RNAseq cell cluster labelling by ref...

    百味科研芝士
  • 如果你觉得相关性热图不好看,或者太简陋

    就有粉丝提问,把单细胞亚群使用 AverageExpression 函数做成为了亚群矩阵,是不是忽略了单细胞亚群的异质性呢?毕竟每个单细胞亚群背后都是成百上...

    生信菜鸟团
  • 单细胞分析十八般武艺8:Garnett

    单细胞初级8讲和高级分析8讲 单细胞分析十八般武艺1:harmony 单细胞分析十八般武艺2:LIGER 单细胞分析十八般武艺3:fastMNN 单细胞分析十八...

    生信技能树jimmy
  • 子宫腺肌病在位内膜和异位病灶的单细胞转录组分析

    背景 子宫腺肌病(Adenomyosis,AM)作为常见的妇科慢性良性疾病,其精确的发病机理尚不清楚。单细胞RNA测序(Single-cell RNA sequ...

    生信技能树jimmy
  • 单细胞||SingleR鉴定细胞类型

    SingleR是用于单细胞RNA测序(scRNAseq)数据的自动注释方法(Aran et al.2019)。给定具有已知标签的样本(单细胞或RNAseq)参考...

    生信编程日常
  • singleR的7个数据库文件下载失败的解决方案

    singleR自带7个数据库文件,需要联网才能下载,其中5个是人类数据,2个是小鼠的数据:

    生信技能树jimmy
  • 单细胞转录组基础分析五:细胞再聚类

    单细胞测序技术是近年最大的生命科学突破之一,相关文章频繁发表于各大顶级期刊,然而单细胞数据的分析依然是大家普遍面临的障碍。本专题将针对10X Genomics单...

    生信技能树jimmy
  • sc-RNA-seq Key issues guide

    单细胞技术(single-cell technologies )越来越被生命科学家广泛地应用在不同物种、不同器官的研究上。在2019年之前基于单细胞测序技术,特...

    生信技能树jimmy
  • SCCAF 单细胞聚类评估框架

    本文作者提出了单细胞聚类评估框架(Single-Cell Clustering Assessment Framework, SCCAF),用于从单细胞 RNA ...

    生信技能树jimmy
  • Cell Ontology:解析细胞类型新维度

    记得在文章CD8+CD28- Treg||我就不信就我一个人觉得现有的细胞群命名有点麻烦和文章单细胞数据科学的十一个重大挑战中,我们提出过传统细胞类型定义的困惑...

    生信技能树jimmy
  • Barcoding || 海量单细胞的关键技术

    故事要从第一届单细胞培训班开始讲起,还记得在讲完第一场单细胞技术简介及应用之后,问大家有没有什么问题可以讨论。有位老师问:请问什么叫Barcode?

    生信技能树jimmy
  • 单细胞转录组基础分析六:伪时间分析

    单细胞测序技术是近年最大的生命科学突破之一,相关文章频繁发表于各大顶级期刊,然而单细胞数据的分析依然是大家普遍面临的障碍。本专题将针对10X Genomics单...

    生信技能树jimmy
  • 骨髓基质在正常和白血病个体中的细胞图谱|Cell,Nature联袂解析

    基质细胞是几乎每个器官中都存在的定义不明确的非实质成分,在器官发育,体内平衡和修复中起关键作用。对骨髓基质的研究已经确定了干细胞生态位中的基质细胞的细胞亚型,其...

    生信宝典
  • 10x单细胞测序技术揭示肝脏细胞全景图

    不知不觉在单细胞转录组领域做知识分析也快两年了,很幸运聚集了五个小伙伴携手共进,我们承诺不间断更新5个月,把我们这两年的学习成果全部掏出来给大家,包括5个栏目:

    生信技能树jimmy
  • 【生信文献200篇】50 scRNAseq-CAFs

    英文标题: Spatially and functionally distinct subclasses of breast cancer-associated...

    生信菜鸟团

扫码关注云+社区

领取腾讯云代金券