前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >CeleScope 教程 || FocuSCOPE™单细胞EB病毒基因检测数据分析

CeleScope 教程 || FocuSCOPE™单细胞EB病毒基因检测数据分析

作者头像
生信技能树jimmy
发布2022-06-13 09:33:19
1.1K0
发布2022-06-13 09:33:19
举报
文章被收录于专栏:单细胞天地

🍳 恭喜!当您打开这个文档,说明您已经获得单细胞数据,开启了单细胞数据分析之旅。在您正式使用CeleScope分析新格元单细胞数据之前,我们希望向您介绍celescope软件的一些基本过程。您可以快速阅读文档,并在您的服务器上完成FocuSCOPE™单细胞EB病毒基因检测并完成参考基因组构建以及EB病毒单细胞转录组下机数据到表达矩阵的分析。

一、简介

人类EBV(Epstein-Barr virus,EBV)是疱疹病毒科嗜淋巴细胞病毒属的成员,人群普遍易感,超过90%的正常人感染过EBV,多为无症状携带。传统EBV检测常用抗体检测,RNAScope,PCR技术等,然而单细胞层次上的靶向测序目前还相对空白。为了进行单细胞水平的靶向测序,提高EBV的检出率,新格元2021年推出了FocuSCOPE™ Single Cell mRNA × EBV Library Kit,该试剂盒主要针对EBNA1、EBNA2、EBER1、EBER2、ZEBRA等设计捕获靶点。我们知道EBER1/EBER2(EBERs)被认为是EBV潜伏感染的标志物。FocuSCOPE™单细胞EB病毒基因检测试剂盒可以在提高EB病毒检测分辨率的基础上给EB病毒基础研究提供单细胞水平的研究工具。

二、实验原理

FocuSCOPE™单细胞EB病毒基因检测试剂盒能完成单细胞捕获、细胞裂解、分子标签标记、细胞mRNA捕获、全转录组文库和EB病毒靶向基因转录组富集文库的构建等全流程实验。

三、应用场景

细胞亚群特异的感染机制研究

  • 细胞类群EB病毒基因检测
  • EB病毒对细胞亚群基因表达的调控

EB病毒与耐药机制

  • 不同疾病EB病毒基因表达比较
  • 感染动力学研究
  • EB病毒成瘤机制探究
  • 不同疾病EB病毒生命周期调控
  • 疾病相关检测标志物发掘

探索临床治疗

  • 用药前vs用药后
  • 不同治疗策略对比
  • 预后监测

四、产品优势

高效捕获靶向区域

  • 特异性探针设计,可提高靶向捕获基因效率

覆盖EB病毒的全部生命周期

  • 靶向基因覆盖了EB病毒的裂解期和潜伏期
  • 三种潜伏状态的标志基因

靶向基因真实表达

  • 体现EB感染细胞中所有基因的真实表达,
  • 无偏检测细胞内靶基因的表达值。

单细胞层面EB病毒与宿主的相互作用

  • 能够在单个细胞层面研究EB病毒感染动力学探究
  • EBV致瘤机制

五、CeleScope FocuSCOPE™ EB病毒基因检测分析流程

CeleScope生成的单细胞转录组数据的基本流程。

FocuSCOPE pipeline (单细胞FocuSCOPE™EB病毒基因检测数据分析) 包含10个主要指令,可以通过 celescope capture_virus {指令} --help 查看:

代码语言:javascript
复制
$ celescope capture_virus --help
usage: celescope capture_virus [-h]
                               {mkref,sample,barcode,cutadapt,consensus,star_virus,count_virus,filter_virus,analysis_virus}
                               ...

Single-cell capture_virus

positional arguments:
  {mkref,sample,barcode,cutadapt,consensus,star_virus,count_virus,filter_virus,analysis_virus}

optional arguments:
  -h, --help            show this help message and exit

下载测试数据与脚本

为了便于测试软件,我们在github上托管了测试数据(请注意,这些数据仅供测试用途,部分数据是人为生成的)。

代码语言:javascript
复制
mkdir test_dir
cd test_dir
git clone https://github.com/singleron-RD/celescope_test_data.git
git clone https://github.com/singleron-RD/celescope_test_script.git

当然,也可以在gitee上下载:

代码语言:javascript
复制
mkdir test_dir
cd test_dir
git clone https://gitee.com/singleron-rd/celescope_test_data.git
git clone https://gitee.com/singleron-rd/celescope_test_script.git

所有的软件DEMO测试数据我们已经在celescope rna的教程中下载过,这里可以看一下capture_virus数据的结构,让我们看一看下载的测试数据

代码语言:javascript
复制
$ tree -L 2
.
|-- EBV_genome
|   |-- EBV_genome.fasta
|   `-- mkref.sh
|-- capture_virus_script
|   |-- EBV.mapfile
|   `-- EBV_run.sh
|-- fake_match_dir
|   |-- 06.count
|   `-- 08.analysis_rna_virus
`-- fastq
    |-- capture_virus_1.fq.gz
    `-- capture_virus_2.fq.gz

下面是测试脚本:

代码语言:javascript
复制
$ tree
.
|-- EBV.mapfile
`-- EBV_run.sh

六、CeleScope FocuSCOPE™ EB病毒基因检测分析流程实操

单细胞EB病毒基因检测研究在实验过程中会构建一个单细胞转录组文库和单细胞EB病毒靶基因序列富集,因此数据分析也分为两个环节:

  • (1) 单细胞转录组分析
  • (2) 单细胞EB病毒靶基因检测分析

本篇文章内只介绍单细胞EB病毒靶基因检测分析流程,而celescope分析单细胞转录组数据的教程已在前期中介绍过。在分析之前我们先要激活我们celescope软件的运行环境,使用conda activate celescope命令进行激活。

1. 用 mkref 指令创建一个参考基因组文件

mkref用于创建基因组参考目录

每个物种构建一次参考基因组即可,以后运行直接读取,不用多次构建。

需要基因组序列文件与注释信息:fasta文件和gtf文件

第一步,下载EB病毒参考基因组序列文件 首先我们下载我们在github上托管了测试数据,我们就可以获得EB病毒参考基因组序列文件。

代码语言:javascript
复制
mkdir test_dir
cd test_dir
git clone https://github.com/singleron-RD/celescope_test_data.git

下载完成以后,通过脚本命令cd /celescope_test_data/capture_virus/EBV_genome进入到EBV_genome文件目录中,我们可以查看一下具体内容。

代码语言:javascript
复制
$ tree
.
|-- EBV_genome.fasta
`-- mkref.sh

第二步, 使用mkref指令构建EB病毒参考基因组索引文件。

  • 配置mkref.sh脚本
代码语言:javascript
复制
$ vim mkref.sh 
celescope capture_virus mkref \
 --genome_name EBV \
 --fasta EBV_genome.fasta \
 --genomeSAindexNbases 7
# --dry_run #该指令不运行,该指令指只写入config file,然后退出。  
  • 运行配置脚本 sh mkref.sh。 运行完以后我们可以查看一下索引文件的生成。
代码语言:javascript
复制
$ tree
.
|-- EBV_genome.fasta
|-- Genome
|-- Log.out
|-- SA
|-- SAindex
|-- celescope_genome.config
|-- chrLength.txt
|-- chrName.txt
|-- chrNameLength.txt
|-- chrStart.txt
|-- genomeParameters.txt
`-- mkref.sh

2、用 multi_capture_virus构建celescope capture_virus 分析的 shell 脚本

一个是配置 mapfile文件 --mapfile 是multi_capture_virus下的参数,需要提供一个制表符分隔 (tab-delimited) 的文本文件。mapfile的每一行代表双端(paired-end)fastq文件。

代码语言:javascript
复制
$ cat EBV.mapfile 
capture_virus   /../celescope_test/celescope_test_data/capture_virus/fastq      capture_virus_test    /../celescope_test/celescope_test_data/capture_virus/fake_match_dir
  • 第一列: capture_virus_fastq_ID:对应capture_virus_fastq文件的名称前缀
  • 第二列: capture_virus_datapath:对应 capture_virus_fastq文件的路径
  • 第三列: capture_virus_name:对应质控报告的名称
  • 第四列: 对应与其“配对的”单细胞转录组分析 “fake_match_dir” 路径

另一个是 shell 脚本文件: EBV_run.sh

代码语言:javascript
复制
$ vim EBV_run.sh 
multi_capture_virus\
 --mapfile ./EBV.mapfile \
 --virus_genomeDir /mnt/sdd/singleron_training_class/resources/celescope_test/celescope_test_data/capture_virus/EBV_genome \
 --not_consensus \
 --mod shell

3、生成shell脚本

(1)运行刚编辑好的shell脚本EBV_run.sh

代码语言:javascript
复制
$ sh EBV_run.sh

(2)运行完以后就可以自动生成一个名称为shell的文件目录。

代码语言:javascript
复制
$ tree -L 1
.
|-- EBV.mapfile
|-- EBV_run.sh
`-- shell

shell目录中会有一个以capture_virus_test命名的脚本运行的存储数据,以及一个运行的shell脚本capture_virus_test.shcapture_virus_test.sh脚本中的每行指令对应每一步分析(质控报告的每一部分数据)。

4、投递shell脚本

进入到shell目录后,就可以运行脚本capture_virus_test.sh,然后在终端命令行中输入sh capture_virus_test.sh。那么程序就会在当前的终端界面运行。但是,如果在当前的终端界面中进行运行,终端界面就不能关闭,也不能掉线,否则运行的程序就会中断。那么,为了避免这种情况发生,我们可以使用nohup将运行脚本投递后台运行,执行nohup sh capture_virus_test.sh &,并生成一个nohup.out运行的日志文件。

代码语言:javascript
复制
$ tree -L 1
.
|-- capture_virus_test
|-- capture_virus_test.sh
`-- nohup.out

如果对每一步做了什么感兴趣,可以单独运行查看,capture_virus_test.sh里面是:

代码语言:javascript
复制
$ cat capture_virus_test1.sh 
celescope capture_virus sample --outdir .//capture_virus_test1/00.sample --sample capture_virus_test1 --assay capture_virus --thread 4 --chemistry auto  --fq1 /mnt/sdd/singleron_training_class/resources/celescope_test/celescope_test_data/capture_virus/fastq/capture_virus_1.fq.gz 
celescope capture_virus barcode --outdir .//capture_virus_test1/01.barcode --sample capture_virus_test1 --assay capture_virus --thread 4 --chemistry auto --lowNum 2  --fq1 /mnt/sdd/singleron_training_class/resources/celescope_test/celescope_test_data/capture_virus/fastq/capture_virus_1.fq.gz --fq2 /mnt/sdd/singleron_training_class/resources/celescope_test/celescope_test_data/capture_virus/fastq/capture_virus_2.fq.gz 
celescope capture_virus cutadapt --outdir .//capture_virus_test1/02.cutadapt --sample capture_virus_test1 --assay capture_virus --thread 4 --minimum_length 20 --nextseq_trim 20 --overlap 10 --insert 150  --fq .//capture_virus_test1/01.barcode/capture_virus_test1_2.fq 
celescope capture_virus consensus --outdir .//capture_virus_test1/03.consensus --sample capture_virus_test1 --assay capture_virus --thread 4 --threshold 0.5 --not_consensus --min_consensus_read 1  --fq .//capture_virus_test1/02.cutadapt/capture_virus_test1_clean_2.fq 
celescope capture_virus star_virus --outdir .//capture_virus_test1/04.star_virus --sample capture_virus_test1 --assay capture_virus --thread 4 --outFilterMultimapNmax 1 --starMem 30 --virus_genomeDir /mnt/sdd/singleron_training_class/resources/celescope_test/celescope_test_data/capture_virus/EBV_genome  --fq .//capture_virus_test1/02.cutadapt/capture_virus_test1_clean_2.fq 
celescope capture_virus count_virus --outdir .//capture_virus_test1/05.count_virus --sample capture_virus_test1 --assay capture_virus --thread 4 --min_query_length 35  --capture_bam .//capture_virus_test1/04.star_virus/capture_virus_test1_virus_Aligned.sortedByCoord.out.bam --match_dir /mnt/sdd/singleron_training_class/resources/celescope_test/celescope_test_data/capture_virus/fake_match_dir 
celescope capture_virus filter_virus --outdir .//capture_virus_test1/06.filter_virus --sample capture_virus_test1 --assay capture_virus --thread 4 --min_support_reads 2 --umi_threshold_method auto  --match_dir /mnt/sdd/singleron_training_class/resources/celescope_test/celescope_test_data/capture_virus/fake_match_dir --raw_read_count_file .//capture_virus_test1/05.count_virus/capture_virus_test1_raw_read_count.json 
celescope capture_virus analysis_virus --outdir .//capture_virus_test1/07.analysis_virus --sample capture_virus_test1 --assay capture_virus --thread 4  --filter_tsne_file .//capture_virus_test1/06.filter_virus/capture_virus_test1_filtered_UMI_tsne.csv

5、结果目录

代码语言:javascript
复制
$ tree
.
|-- 00.sample
|   `-- stat.txt
|-- 01.barcode
|   |-- capture_virus_test1_2.fq
|   `-- stat.txt
|-- 02.cutadapt
|   |-- capture_virus_test1_clean_2.fq
|   |-- cutadapt.log
|   `-- stat.txt
|-- 04.star_virus
|   |-- capture_virus_test1_virus_Aligned.out.bam
|   |-- capture_virus_test1_virus_Aligned.sortedByCoord.out.bam
|   |-- capture_virus_test1_virus_Aligned.sortedByCoord.out.bam.bai
|   |-- capture_virus_test1_virus_Log.final.out
|   |-- capture_virus_test1_virus_Log.out
|   |-- capture_virus_test1_virus_Log.progress.out
|   |-- capture_virus_test1_virus_SJ.out.tab
|   `-- stat.txt
|-- 05.count_virus
|   |-- capture_virus_test1_raw_read_count.json
|   `-- stat.txt
|-- 06.filter_virus
|   |-- capture_virus_test1_filtered_UMI_tsne.csv
|   `-- stat.txt
|-- 07.analysis_virus
|   `-- stat.txt
`-- capture_virus_test1_report.html

当我们运行完以后,就可以得到一个单细胞EB病毒基因检测分析的网页报告。

  • 质控报告的样本和软件的基本信息
  • 数据质控信息
  • 基因组比对信息
  • 细胞与基因定量情况
  • EB病毒基因靶基因信息

以上就是完整的新格元单细胞EB病毒基因检测分析过程,接下来就可以进行FocuSCOPE™单细胞EB病毒基因检测数据的分析了。

好啦,新格元CeleScope单细胞数据分析的七篇系列教程就告一段落啦!更多软件更新信息和新兴的单细胞分析方法可以参考我们的CeleScope的GitHub网址:https://github.com/singleron-RD/CeleScope

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-05-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 单细胞天地 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、简介
  • 二、实验原理
  • 三、应用场景
    • 细胞亚群特异的感染机制研究
      • EB病毒与耐药机制
        • 探索临床治疗
        • 四、产品优势
          • 高效捕获靶向区域
            • 覆盖EB病毒的全部生命周期
              • 靶向基因真实表达
                • 单细胞层面EB病毒与宿主的相互作用
                • 五、CeleScope FocuSCOPE™ EB病毒基因检测分析流程
                  • CeleScope生成的单细胞转录组数据的基本流程。
                  • 六、CeleScope FocuSCOPE™ EB病毒基因检测分析流程实操
                    • 1. 用 mkref 指令创建一个参考基因组文件
                      • 2、用 multi_capture_virus构建celescope capture_virus 分析的 shell 脚本
                        • 3、生成shell脚本
                          • 4、投递shell脚本
                            • 5、结果目录
                            领券
                            问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档