专栏首页生信补给站单细胞工具箱|Cell Ranger-V6.0 开启单细胞之旅(上)

单细胞工具箱|Cell Ranger-V6.0 开启单细胞之旅(上)

Cell Ranger是一个10X genomics公司的单细胞分析软件,将原始的fastq文件生成后续分析的feature-barcode表达矩阵。

其中包括很多模块,本次主要介绍cellranger mkfastq、cellranger count,cellranger aggr 和 cellranger reanalyze四个功能模块。

一 Cell Ranger下载安装

1.1 下载

进入cellranger官网(https://support.10xgenomics.com/)后,发现支持的分析模块有很多,先介绍单细胞转录组。选择单细胞转录组模块,点击进入

软件-下载-选择你想要的cellranger版本,

https://support.10xgenomics.com/single-cell-gene-expression/software/downloads/latest

1)curl ,wget 和 直接网页下载,三种方式均可;

2)记得下载注释文件

3)注意查看md5值(很重要

1.2 安装

Step1:解压下载的软件安装包

#进入文件存放的位置,示例为opt
$ cd /opt
#解压
$ tar -xzvf cellranger-6.0.1.tar.gz

解压缩到一个名为cellranger-6.0.1的新目录,包含Cell Ranger及其依赖项和Cell Ranger脚本。

Step2:同样的方式解压参考文件

$ tar -xzvf refdata-gex-GRCh38-2020-A.tar.gz

Step3:配置环境

将Cell Ranger目录添加到$PATH中,注意路径要准确,示例为/opt ,

$ export PATH=/opt/cellranger-6.0.1:$PATH

为使用方便可以添加到.bashrc文件中。

1.3 测试安装

可以查看一下版本和帮助,或者参考官网的Site Check Script 的方式。

cellranger -V
cellranger -h

下载:https://support.10xgenomics.com/single-cell-gene-expression/software/downloads/latest

安装:https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/installation

二 mkfastq模块

cellranger使用mkfastq功能来拆分Illumina 原始数据(raw base call (BCL)),输出 FASTQ 文件。

2.1 下载示例数据

点击下载即可

2.2 Running mkfastq with a Simple CSV Samplesheet

1)首先示例矩阵数据解压缩,当前目录下生成cellranger-tiny-bcl-1.2.0文件夹

tar -xvzf cellranger-tiny-bcl-1.2.0.tar.gz

2)Simple CSV Samplesheet文件

格式:三列(Lane、Sample、Index),逗号分隔,不太容易出现格式错误。示例数据cellrangerver -tiny-bcl-simple-1.2.0.csv如下:

Lane,Sample,Index
1,test_sample,SI-TT-D9

Lane

Which lane(s) of the flowcell to process. Can be either a single lane, a range (e.g., 2-4) or '*' for all lanes in the flowcell.

Sample

The name of the sample. This name is the prefix to all the generated FASTQs, and corresponds to the --sample argument in all downstream 10x pipelines.Sample names must conform to the Illumina bcl2fastq naming requirements. Only letters, numbers, underscores and hyphens area allowed; no other symbols, including dots (".") are allowed.

Index

The 10x sample index that was used in library construction, e.g., SI-TT-D9 or SI-GA-A1

3)run mkfastq

需要安装且配置bcl2fastq软件

$ cellranger mkfastq --id=cellranger-tiny-bcl-1.2.0 \
                     --run=/path/to/cellranger-tiny-bcl-1.2.0 \
                     --csv=cellranger-tiny-bcl-simple-1.2.0.csv

id :即为解压后的文件夹名字

run:为解压后的文件夹的绝对路径

在id名的新文件夹中既有生成的fastq文件了,可以用于后续的count分析。

另一种请参考https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/using/mkfastq

三 count 模块

此处使用转录组数据进行count分析,通过fastq文件得到细胞和基因的定量结果。

3.1 必要参数

$ cellranger count --id=sample345 \
                   --transcriptome=/opt/refdata-gex-GRCh38-2020-A \
                   --fastqs=/home/jdoe/runs/HAWT7ADXX/outs/fastq_path \
                   --sample=mysample \
                   --expect-cells=1000 \

--id= 名称 --fastqs= fastq.gz文件保存的绝对路径 --sample= fastq.gz文件名"-"之前的字段 --transcriptome= 参考基因组路径

--expect-cells= 期望细胞数(可选)

3.2 参数列表

参数详细介绍详见:

https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/using/count#args中的Command-Line Argument Reference 部分

可以注意下以下参数:

--expect-cells

(optional) Expected number of recovered cells. Default: 3,000 cells.

和实验匹配

--nosecondary

(optional) Add this flag to skip secondary analysis of the feature-barcode matrix (dimensionality reduction, clustering and visualization). Set this if you plan to use cellranger reanalyze or your own custom analysis.

仅获得表达矩阵,不进行后续的降维,聚类和可视化分析

--chemistry

(optional) Assay configuration. NOTE: by default the assay configuration is detected automatically, which is the recommended mode. You should only specify chemistry if there is an error in automatic detection. Select one of:auto for auto-detection (default),...

  • auto for auto-detection (default),
  • ...

3.3 结果文件

结果文件列表以及简要描述说明

File Name

Description

web_summary.html

Run summary metrics and charts in HTML format

网页简版报告以及可视化

metrics_summary.csv

Run summary metrics in CSV format

possorted_genome_bam.bam

Reads aligned to the genome and transcriptome annotated with barcode information

possorted_genome_bam.bam.bai

Index for possorted_genome_bam.bam

filtered_feature_bc_matrix

Filtered feature-barcode matrices containing only cellular barcodes in MEX format. (In Targeted Gene Expression samples, the non-targeted genes are not present.)

过滤掉的barcode信息

filtered_feature_bc_matrix_h5.h5

Filtered feature-barcode matrices containing only cellular barcodes in HDF5 format. (In Targeted Gene Expression samples, the non-targeted genes are not present.)

过滤掉的barcode信息HDF5 format;

raw_feature_bc_matrices

Unfiltered feature-barcode matrices containing all barcodes in MEX format

原始barcode信息

raw_feature_bc_matrix_h5.h5

Unfiltered feature-barcode matrices containing all barcodes in HDF5 format

原始barcode信息HDF5 format

analysis

Secondary analysis data including dimensionality reduction, cell clustering, and differential expression

molecule_info.h5

Molecule-level information used by cellranger aggr to aggregate samples into larger datasets

cloupe.cloupe

Loupe Browser visualization and analysis file

Loupe Cell Browser 输入文件

feature_reference.csv

(Feature Barcode only) Feature Reference CSV file

target_panel.csv

(Targeted GEX only) Targed panel CSV file

参考资料:https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/using/mkfastq

本文分享自微信公众号 - 生信补给站(Bioinfo_R_Python),作者:生信补给站

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2021-07-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • sc-ATAC-seq细胞类型注释策略

    解释任何单细胞测序数据的起点都是对给定数据集中的细胞簇进行注释。由于缺乏专门设计的工具以及在单细胞ATAC-seq数据中使用不直观的顺式和跨式调控元素(unin...

    生信技能树jimmy
  • 10X Cell Ranger ATAC 算法概述

    执行此步骤是为了修复条形码(barcode,细胞的标识)中偶尔出现的测序错误,从而使片段与原始条形码相关联,从而提高数据质量。16bp条形码序列是从“I2”索引...

    生信技能树jimmy
  • 单细胞数据中到底应该如何处理线粒体基因

    线粒体是参与细胞凋亡启动和执行的主要细胞器之一。线粒体基因在大多数细胞中表达,其表达水平是细胞类型特异性的。也就是说这个也是和细胞类型及其状态有关系的。

    生信技能树jimmy
  • Cell Ranger 3.0 VS 2.0做了哪些改动(10x数据上游分析神器)

    不知不觉在单细胞转录组领域做知识分析也快两年了,很幸运聚集了五个小伙伴携手共进,我们承诺不间断更新5个月,把我们这两年的学习成果全部掏出来给

    生信技能树jimmy
  • 单细胞分群后继续分亚群的一些例子

    比如发表在 Nat Med. 2018 Aug; 题目是:Phenotype molding of stromal cells in the lung tumo...

    生信技能树jimmy
  • scRNA-seq—读入数据详解

    在量化基因表达之后,我们需要将该数据导入R,以生成用于执行QC的矩阵。在本课中,我们将讨论盘点数据可以采用的格式,以及如何将其读入R,以便我们可以继续工作流程中...

    生信技能树jimmy
  • BRCA1和BRCA2基因敲除小鼠的单细胞转录组

    数据在 https://www.ncbi.nlm.nih.gov/bioproject/PRJNA632854 :

    生信技能树
  • 三个10X单细胞转录组样本CCA整合

    其中,我委婉的指出来了,那个文章对两个两个样本的10X单细胞转录组数据的整合是有问题的,不过他们文章发表期刊是 Immunity影响因子很高,二十多分,其实单细...

    生信技能树jimmy
  • 你的单细胞分群数量太少可能就是因为你测的细胞数量不够

    不过我感兴趣的并不是他们做的单细胞资源整理,尽管他们收集了超过500个单细胞转录组研究的数据,我感兴趣的是他们文末的一个补充结论:

    生信技能树jimmy
  • 单细胞测序揭示皮肤伤口中成纤维细胞的异质性

    不知不觉在单细胞转录组领域做知识分析也快两年了,很幸运聚集了五个小伙伴携手共进,我们承诺不间断更新5个月,把我们这两年的学习成果全部掏出来给大家,包括5个栏目:

    生信技能树jimmy
  • scHLAcount || 单细胞转录组HLA等位基因分析

    scHLAcount允许我们使用个性化的参考基因组计算HLA I类基因HLA-A、B和C的单细胞转录组序列数据中的分子数;和HLA II类基因DPA1, DPB...

    生信技能树jimmy
  • 单细胞RNA-seq数据分析最佳实践(上)

    Luecken MD, Theis FJ. Current best practices in single-cell RNA-seq analysis: a ...

    生信技能树jimmy
  • cellranger更新到5啦(全新使用教程)

    同样的,需要自己简单注册后就可以获取wget下载地址,因为版权的问题,我这里就不复制粘贴出来地址啦,反正简单填写邮箱即可注册拿到地址。

    生信技能树
  • 拿奖拿到手软的单细胞技术

    我们生信技能树旗下的单细胞天地,只分享干货计划,致力于让每个人都能理解自己的单细胞数据,早日发表。

    生信技能树
  • 是否可以根据10X转录组数据来推断基因组CNV信息呢?

    这个问题,说实话,很难回答,因为要是能完整回答这个问题,其实就是一篇正经的生物信息学文章了。

    生信技能树jimmy
  • scRepertoire||单细胞免疫组库分析:R语言应用(一)

    10× Genomics单细胞免疫组库VDJ分析必知必会(https://www.jianshu.com/p/db4831091a5c) 免疫组库数据分析||i...

    生信技能树jimmy
  • 两个样品的10x单细胞转录组数据分析策略

    链接: https://www.sciencedirect.com/science/article/abs/pii/S1074761319302845

    生信技能树jimmy
  • 单细胞转录组数据分析并不一定要过于个性化

    所以我自己在2019年录制了两套不同层级的单细胞转录组数据分析视频教程,还配套了视频学习笔记,今年(2020)在培养学徒的过程中,我又安排学徒根据这两套视频精炼...

    生信技能树jimmy
  • 使用Loupe Cell Browser查看10X单细胞转录组分析结果

    10X genomics公司不仅为单细胞转录组数据分析提供了配套的cell Ranger软件,同时也提供了专门的分析结果查看软件-Loupe Cell Brow...

    生信修炼手册

扫码关注云+社区

领取腾讯云代金券