前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >scRNAseq包更新动作太大

scRNAseq包更新动作太大

作者头像
生信技能树
发布2020-08-28 10:38:25
1.5K0
发布2020-08-28 10:38:25
举报
文章被收录于专栏:生信技能树生信技能树

我以前是这样介绍 scRNAseq 这个 R包中的数据集:

  • 这个包内置的是 Pollen et al. 2014 数据集,人类单细胞细胞,分成4类,分别是 pluripotent stem cells 分化而成的 neural progenitor cells (“NPC”) ,还有 “GW16” and “GW21” ,“GW21+3” 这种孕期细胞,理解这些需要一定的生物学背景知识,如果不感兴趣,可以略过。
  • 这个R包大小是50.6 MB,下载需要一点点时间,先安装加载它们。

这个数据集很出名,截止2019年1月已经有近400的引用了,后面的人开发R包算法都会在其上面做测试,比如 SinQC 这篇文章就提到:We applied SinQC to a highly heterogeneous scRNA-seq dataset containing 301 cells (mixture of 11 different cell types) (Pollen et al., 2014).这里面的表达矩阵是由 RSEM (Li and Dewey 2011) 软件根据 hg38 RefSeq transcriptome 得到的,总是130个文库,每个细胞测了两次,测序深度不一样。

当时我也指出来了,这个 Pollen et al. 2014 数据集,本质上属于地址为https://hemberg-lab.github.io/scRNA.seq.datasets/human/tissues/ ,的宝藏网页。

代码语言:javascript
复制
library(scRNAseq)
## ----- Load Example Data -----
data(fluidigm)
ct <- floor(assays(fluidigm)$rsem_counts)
ct[1:4,1:4]

最近看它,https://bioconductor.org/packages/3.11/data/experiment/vignettes/scRNAseq/inst/doc/scRNAseq.html

一个超级大的更新:Created: May 25, 2016; Compiled: 2020-05-07

之前是 data(fluidigm) 即可加载 Pollen et al. 2014 数据集,现在是 使用函数ReprocessedFluidigmData()来下载数据集:

代码语言:javascript
复制
library(scRNAseq)
fluidigm <- ReprocessedFluidigmData()
fluidigm

而且,它不仅仅是一个数据集;仅仅是作者自己文章数据集就包括:

  • ReprocessedFluidigmData() provides 65 cells from Pollen et al. (2014).
  • ReprocessedTh2Data() provides 96 T helper cells from Mahata et al. (2014).
  • ReprocessedAllenData() provides 379 cells from the mouse visual cortex, which is a subset of the data from Tasic et al. (2016).

他们还可以处理一切单细胞公共数据集,命名很简单:

而且可以很方便的自己添加公共数据集

如果你的R编程能力不够,可以直接发邮件给作者来添加数据集。如果能看懂代码,就使用这个包附带的数据处理方式。

  • inst/scripts/make-X-Y-data.Rmd, a Rmarkdown report that creates all components of a SingleCellExperiment. X should be the last name of the first author of the relevant study while Y should be the name of the biological system.
  • inst/scripts/make-X-Y-metadata.R, an R script that creates a metadata CSV file at inst/extdata/metadata-X-Y.csv. Metadata files should follow the format described in the ExperimentHub documentation.
  • R/XYData.R, an R source file that defines a function XYData() to download the components from ExperimentHub and creates a SingleCellExperiment object.
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-08-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 而且可以很方便的自己添加公共数据集
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档