前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >使用cell ranger进行单细胞转录组定量分析

使用cell ranger进行单细胞转录组定量分析

作者头像
生信修炼手册
发布2019-12-19 11:43:00
1.6K0
发布2019-12-19 11:43:00
举报
文章被收录于专栏:生信修炼手册生信修炼手册

欢迎关注”生信修炼手册”!

在RNA_seq数据的定量分析中,都是首先将reads比对到参考基因组,然后再使用定量软件进行定量,比如经典的hisat+stringTie的分析策略,对于单细胞转录组而言,其定量的原理也是一样的,只不过由于引入了UMI标签的设计,在定量时需要考虑相同UMI标签来自同一个转录本,直接使用传统的分析软件就不合适了。

官方提供的cell ranger软件不仅提供了数据拆分,也提供了定量等分析内容。

定量的前提都是需要将reads比对到参考基因组上,对于比对而言,第一步都是先对参考基因组建立索引,官网提供了人和小鼠的参考基因组供下载,网址如下

https://support.10xgenomics.com/single-cell-gene-expression/software/downloads/latest

对于其他物种,我们只需要有基因组的fasta文件和转录本的gtf文件,就可以自定义参考基因组,步骤如下

1. 对GTF文件进行过滤

在原始的GTF文件中,会包含非常多类型的基因,可以通过mkgtf子命令,筛选其中感兴趣的基因,用法如下

代码语言:javascript
复制
cellranger mkgtf \
hg38.ensembl.gtf \
hg38.ensembl.filtered.gtf \
--attribute=gene_biotype:protein_coding

通过attribute属性来筛选,上述例子中只筛选出蛋白编码基因对应的记录。

2. 建立索引

通过mkref子命令来建索引,用法如下

代码语言:javascript
复制
cellranger mkref \
--genome=output_genome \
--nthreads=10 \
--fasta=input.fa \
--genes=input.gtf

genome参数指定输出结果的目录,建好索引之后的目录结构如下

代码语言:javascript
复制
.
├── fasta
│   ├── genome.fa
│   └── genome.fa.fai
├── genes
│   └── genes.gtf
├── pickle
│   └── genes.pickle
├── reference.json
└── star

可以看到,cell ranger对基因组建立了STAR的索引,然后通过STAR将reads比对到参考基因组上。

定量分析通过count子命令实现,用法如下

代码语言:javascript
复制
cellranger count \
--id=sample345 \
--transcriptome=database_path \
--fastqs=fastq_path \
--sample=mysample \

id参数指定输出目录的名字,transcriptome参数指定基因组索引所在目录,fastqs指定mkfastq命令产生的序列文件所在目录,sample参数指定需要分析的样本,在fastq_path下对应一个子目录。

count子命令不仅可以进行定量分析,还提供了聚类,PCA, tSNE等一系列分析结果,输出结果目的录下文件很多,在后续我们会详细解读该命令的输出结果。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-12-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 对GTF文件进行过滤
  • 2. 建立索引
相关产品与服务
云数据库 SQL Server
腾讯云数据库 SQL Server (TencentDB for SQL Server)是业界最常用的商用数据库之一,对基于 Windows 架构的应用程序具有完美的支持。TencentDB for SQL Server 拥有微软正版授权,可持续为用户提供最新的功能,避免未授权使用软件的风险。具有即开即用、稳定可靠、安全运行、弹性扩缩等特点。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档