首页
学习
活动
专区
圈层
工具
发布
30 篇文章
1
使用PHATE复现Science Immunology上文章的结果
2
你确定你研究的是成纤维细胞吗
3
读取loom格式的单细胞文件
4
velocyto的正确安装方法
5
Seurat4.0系列教程20:单细胞对象的格式转换
6
Seurat4.0系列教程8:细胞周期评分和回归分析
7
MACA: 一款自动注释细胞类型的工具
8
肺癌四阶段:AAH-AIS-MIA-IA的单细胞图谱
9
你认为是双细胞人家说是全新细胞亚群
10
copykat为什么没有infercnv直观呢
11
一大波神经元单细胞亚群相关的标志基因
12
单细胞转录组分析—追踪移植后造血干细胞的分化
13
单细胞转录组揭示肺腺癌特有的肿瘤微环境
14
小细胞肺癌(SCLC)病人的scRNA-seq数据分析
15
单细胞转录组分析COVID-19重症患者肺泡巨噬细胞亚型
16
CancerSCEM: 人类癌症单细胞表达图谱数据库
17
你真的需要如此多的单细胞亚群注释工具吗
18
使用PHATE进行单细胞高维数据的可视化
19
小鼠早期原肠化的转录异质性和细胞命运决定的scRNA-seq图谱
20
单细胞测序揭示PD-L1免疫治疗联合紫杉醇化疗在三阴性乳腺癌中的作用机制
21
单细胞转录组的细分亚群的降维聚类分群加上gsea或者gsva以及转录因子和拟时序流程(仅需8000元)
22
单细胞不同亚群和状态能区分吗
23
肿瘤相关成纤维细胞异质性
24
肿瘤样品的单细胞需要提取上皮细胞继续细分
25
乳腺癌患者抗PD1治疗期间肿瘤内变化的单细胞图谱
26
晚期非小细胞肺癌肿瘤异质性和微环境的单细胞分析
27
脑组织单细胞悬液制备流程
28
什么,你想要的单细胞亚群比例太少了?
29
让Single cell UMAP注释支棱起来
30
RNAvelocity4:velocyto.R的使用
清单首页生信文章详情

读取loom格式的单细胞文件

万事开头难,考虑到很多小伙伴在做单细胞公共数据分析的时候往往是在第一个步骤读取作者上传的表达量矩阵去构建seurat对象就各种屏蔽,非常有必要把18种单细胞数据格式文件都给大家梳理一下 。

现在我们来演示一下如何读取loom格式的单细胞文件,首先需要安装并且加载一些包:

代码语言:javascript
复制
library(hdf5r) 
library(loomR)
library(LoomExperiment)
# remotes::install_github("aertslab/SCopeLoomR")
# remotes::install_local('mojaveazure-loomR-0.2.0-beta-54-g1eca16a.tar.gz')
library(SCopeLoomR)

值得注意的是,有一些包其实是在GitHub上面哦,如果你网络比较差,需要自己想办法解决,如果连包读无法安装,不妨试试看我们的**马拉松授课(直播一个月互动教学) ,可以看完我们从2000多个提问互动交流里面精选的200个问答!2021第二期_生信入门班_微信群答疑整理,以及 2021第二期_数据挖掘班_微信群答疑笔记

与十万人一起学生信,你值得拥有下面的学习班:

接下来我们以 GSE160756 ,为例子,进入https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE160756 可以看到,其数据集的7个样品,都是以loom格式文件分享给大家的。

以loom格式文件分享给大家的

我们的示例代码如下所示 ;

代码语言:javascript
复制

###### step1:导入数据 ######  
path='GSE160756_RAW/'
samples=list.files(path )
samples 
sceList = lapply(samples,function(pro){ 
  # pro=samples[1] 
  print(pro) 
  folder=file.path(path,pro) 
  print(pro)
  print(folder)
  # 导入loom文件
  lfile <- connect(filename =folder, mode = "r+")
  ct <- as.data.frame(lfile[["matrix"]][,])
  colnames(ct) <- lfile[["row_attrs/gene_names"]][] # 添加gene_name
  rownames(ct) <- lfile[["col_attrs/cell_names"]][] # 添加cell_name
  ct[1:5,1:5]
  ct <- t(ct) # 注意转置
  sce=CreateSeuratObject(counts = ct,
                         project =  pro )
  return(sce)
})
names(sceList)  
samples  

读取全部的loom文件后,成为了一个列表,里面是每个样品独立的seurat对象,需要合并,代码如下所示:

代码语言:javascript
复制

sce.all=merge(x=sceList[[1]],
              y=sceList[ -1 ],
              add.cell.ids = samples) 
as.data.frame(sce.all@assays$RNA@counts[1:10, 1:2])
head(sce.all@meta.data, 10)
table(sce.all@meta.data$orig.ident) 


library(stringr)
phe=str_split(rownames(sce.all@meta.data),'_',simplify = T)
head(phe)
table(phe[,4])
table(phe[,3])

sce.all@meta.data$rep=phe[,4]
sce.all@meta.data$group=phe[,3]
sce.all@meta.data$orig.ident = paste0(
  sce.all@meta.data$group,
  sce.all@meta.data$rep
)
table(sce.all@meta.data$orig.ident) 

因为是多个样品,通常是建议走harmnoy流程进行整合哦。

大家在下面的文章里面可以搜索到10x单细胞转录组数据的文章公布在geo数据库的链接:

如果你对单细胞数据分析还没有基础认知,可以看基础10讲:

最基础的往往是降维聚类分群,参考前面的例子:人人都能学会的单细胞聚类分群注释

下一篇
举报
领券