前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >如果你的单细胞转录组项目只有一个稀疏矩阵如何下游分析呢

如果你的单细胞转录组项目只有一个稀疏矩阵如何下游分析呢

作者头像
生信技能树jimmy
发布2020-06-16 19:05:12
1.6K1
发布2020-06-16 19:05:12
举报
文章被收录于专栏:单细胞天地

前面我在:10X单细胞转录组理论上有3个文件才能被读入R进行seurat分析,预告了一个疑难点,数据集GSE127465里面明明是可以下载到看起来是10X标准的3个文件,但是的确没办法读入到R里面进行seurat流程。

我发现 GSE127465_human_counts_normalized_54773x41861.mtx.gz 没有啥问题,妥妥的稀疏矩阵,但是 GSE127465_human_cell_metadata_54773x25.tsv.gz 里面很明显并不是普通的细胞信息,里面五花八门。

我想了想,只能是读入这个稀疏矩阵了,放弃另外的两个文件,细胞信息和基因信息,可以后期加上。代码如下:

代码语言:javascript
复制
rm(list=ls())
options(stringsAsFactors = F)
library(Seurat) 
library(Matrix)
x=readMM("raw/GSE127465_human_counts_normalized_54773x41861.mtx")
x
colnames(x)
rownames(x)
dim(x)

这个稀疏矩阵文件gz格式压缩是500M,解压后1.4G,我本来是想把它转为普通矩阵然后构建seurat对象,但是考虑到其是54773x41861的信息,我就放弃了 ,毕竟是在学生的“辣鸡”电脑,才8G电脑。

代码语言:javascript
复制
# 这个 x 是前面 readMM函数读入的稀疏矩阵
# 如果下面的代码保存,就说明readMM读入的稀疏矩阵,需要首先转为普通矩阵
CreateSeuratObject(counts = x, 
                             meta.data =meta,
                             min.cells = 3, 
                             min.features = 200, 
                             project = "GSE127465")

然后就可以进行后续分析了,走seurat流程。

其实我可以自己构造另外两个文件,然后把3个文件存放在同一个文件夹,然后使用下面的代码进行读取

代码语言:javascript
复制
rm(list=ls())
options(stringsAsFactors = F)
library(Seurat)
sce1 <- CreateSeuratObject(Read10X('../10x-results/WT/'),
                          "GSE127465")

我回去后一直在思考,为什么这个作者并没有提供标准的3个文件,而仅仅是一个稀疏矩阵呢?

后来我看了看文献,我勒个去,这个根本就不是10x的单细胞转录组,而是inDrop技术。

inDrop技术单细胞转录组技术
inDrop技术单细胞转录组技术

所以全文压根就没有10X的事情,仅仅是Matrix包的readMM函数即可。在数据集GSE127465配套的文章里面也写的很清楚:

inDrop数据分析流程
inDrop数据分析流程

关于那个indrop.py的流程,见:单细胞drop-seq数据的分析流程以及debug过程

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-06-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 单细胞天地 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档