前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >单细胞专题 | 3.单细胞转录组的上游分析-从BCL到FASTQ

单细胞专题 | 3.单细胞转录组的上游分析-从BCL到FASTQ

作者头像
DoubleHelix
发布2022-06-13 12:51:58
1.1K0
发布2022-06-13 12:51:58
举报
文章被收录于专栏:生物信息云生物信息云

单细胞专题 | 1.单细胞测序(10×genomics技术)的原理

单细胞专题 | 2.如何开始单细胞RNASeq数据分析


(1) 软件安装和介绍

Cellranger mkfastq 管道可用于将 BCL 文件解码为单个库的 FASTQ 文件。如果测序提供程序已经完成了这一步,则可以直接使用每个库的 FASTQ 文件进行数据分析。cellranger mkfastq的本质是调用bcl2fastq生成bcl2fastq,并生成额外的10x样本信息。Bcl2fastq是 illumina开发的bcl到fastq的转换程序。cellranger下载安装地址如下:

https://support.10xgenomics.com/single-cell-gene-expression/software/downloads/latest?

安装cellranger

代码语言:javascript
复制
#解压下载的软件
# https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/using/tutorial_in
tar -xzf cellranger-6.1.2.tar.gz
代码语言:javascript
复制
#配置环境变量,注意解压后的文件路径
echo 'export PATH=~/softwares/cellranger-6.1.2:$PATH' >> ~/.bashrc
source ~/.bashrc
代码语言:javascript
复制
cellranger testrun --id=tiny

在conda环境中安装bcl2fastq,因为Cellranger依赖于bcl2fastq。

代码语言:javascript
复制
#https://anaconda.org/dranew/bcl2fastq
conda install -c dranew bcl2fastq

(2) 案例

公司提供的bcl原始测序文件,本次教学使用使用cellranger的测试数据

代码语言:javascript
复制
curl -O https://cf.10xgenomics.com/supp/cell-exp/cellranger-tiny-bcl-1.2.0.tar.gz
curl -O https://cf.10xgenomics.com/supp/cell-exp/cellranger-tiny-bcl-simple-1.2.0.csv

tar -zxvf cellranger-tiny-bcl-1.2.0.tar.gz
tree -L 2 cellranger-tiny-bcl-1.2.0/

您的数据可能看起来有点不同,这取决于测序仪器使用。查看目录的前几个级别是检查完整性的好方法。如果您没有看到 RTAComplete.txt、 RunInfo.xml 和 runParameters.xml 文件,那么管道很可能会失败。如果缺少任何这些文件,请与您的测序提供程序联系,并要求获得完整的运行目录。

代码语言:javascript
复制
cat cellranger-tiny-bcl-simple-1.2.0.csv

• Lane:要处理flowcell的那个通道。可以是单个泳道(1)、范围(例如 2-4)或flowcell中所有泳道(*)。 • Sample:样本名称。所有生成的 FASTQ 表头前缀,对应于所有下游 10x 管道中的 --sample 参数。样本名称只允许使用字母、数字、下划线_和-;不允许使用其他符号,包括点(“.” )。 • Index:用于文库构建的 10x 样本索引,例如 SI-TT-D9 或 SI-GA-A1。


查看帮助文档

代码语言:javascript
复制
cellranger mkfastq --help

Cellranger mkfastq 将 BCL 文件解码为单个库的 FASTQ 文件

代码语言:javascript
复制
cellranger mkfastq --id=tiny-bcl --run=cellranger-tiny-bcl-1.2.0 --csv=cellranger-tiny-bcl-simple-1.2.0.csv

• --id:mkfastq命令输出FASTQ文件的文件夹名称

• --run:BCL(Base CALL)所在文件夹名称(该文件为illumina测序的下机文件)

• --csv:对应BCL文件的样本信息表,用于描述如何在 Illumina flow 单元上对样本进行索引。

查看输入:tree -L 2 tiny-bcl/

运行时间根据系统资源的不同而不同,但是它不应该占用多于几分钟的时间。现在转到 fastq _ path 目录。

代码语言:javascript
复制
 cd tiny-bcl/outs/fastq_path/

具有有效排序索引的Demultiplexed FASTQ 文件可以在以 flow cell id 命名的目录下找到,在本例中为 H35KCBCXY。

这些来自 cellranger mkfastq 管道的输出作为 cellranger count的输入。我们后续介绍

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-04-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 MedBioInfoCloud 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • (2) 案例
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档