前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >SpeedSeq:快速的基因组数据分析软件

SpeedSeq:快速的基因组数据分析软件

作者头像
生信修炼手册
发布2019-12-19 10:49:50
1.7K0
发布2019-12-19 10:49:50
举报
文章被收录于专栏:生信修炼手册生信修炼手册

SpeedSeq是一款开源的基因组数据变异分析软件,主要功能如下

  1. alignments, 序列比对
  2. variant detection, 变异检测
  3. functional annotation, 突变位点的功能注释

该软件最大的特点就是快速,对于50X的人类全基因组数据, 原始的fastq到vcf文件只需要13小时左右,对应的文章发表在nature methods上,链接如下

http://ucgd.genetics.utah.edu/wp-content/uploads/2015/08/nmeth.3505.pdf

该软件是一个完整的pipeline, 集成了多款软件,可以用于检测以下多种基因组变异

  1. germline and somatic mutations, 通过freebayes软件来检测突变微位点
  2. structural variants,通过lumpy-sv软件来检测结构变异

其流程图示意如下

源代码保存在github上,链接如下

https://github.com/hall-lab/speedseq

该软件按照功能,拆分成了以下5个子模块

1. align

该模块将双端测序的fastq数据比对到参考基因组上,然后进行markduplicate, sort, index等步骤, 和GATK流程中的数据预处理步骤一致,用法如下

代码语言:javascript
复制
speedseq align \
-R  "@RG\tID:sample1\tSM:sample1\tLB:sample1" \
-t 10 \
-o sample1 \
hg19.fa \
sample1_R1.fastq.gz \
sample1_R2.fastq.gz

使用bwa软件比对参考基因组,然后使用samblaster进行markduplicate, sambamba软件进行bam文件的sort。

2. var

该模块用于检测生殖变异,输入为align模块产生的bam文件,用法如下

代码语言:javascript
复制
speedseq var \
-t 10 \
hg19.fa \
sample1.bam

使用freebayes软件来检测生殖变异,输出文件为VCF文件。

3. somatic

该模块用于检测体细胞突变,输入为align模块产生的bam文件,用法如下

代码语言:javascript
复制
speedseq somatic \
-t 10 \
-o tumor \
hg19.fa \
normal.bam\
tumor.bam

使用freebayes软件来检测体细胞突变,需要配对的肿瘤和正常样本,输出文件为VCF文件。

4. sv

该模块用于检测结构变异,用法如下

代码语言:javascript
复制
speedseq sv \
-o sample \
-B sample.bam \
-D sample.discordants.bam \
-S sample.splitters.bam \
-R hg19.fa \
-o sample \
-t 10

使用lumpy-sv软件来检测结构变异,输出文件为VCF文件。

5. realign

该模块从bam文件中提取双端的fastq序列,再进行和align模块相同的处理,用法如下

代码语言:javascript
复制
speedseq realign \
-t 10 \
-o sample \
hg19.fa \
sample.ba

要求bam文件必须包含read group信息,输出文件和align模块相同。对于全基因组数据的分析,使用speedseq可以大大加快处理速度。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-08-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. align
  • 2. var
  • 3. somatic
  • 4. sv
  • 5. realign
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档