前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >freebayes进行SNP calling

freebayes进行SNP calling

作者头像
生信修炼手册
发布2020-05-11 10:14:51
1.6K0
发布2020-05-11 10:14:51
举报
文章被收录于专栏:生信修炼手册生信修炼手册

freebayes 是一款snp calling 软件,其灵敏度高,用法简便,所以广受欢迎。

软件的安装过程如下

代码语言:javascript
复制
git clone --recursive git://github.com/ekg/freebayes.git
cd freebayes/
make

编译成功之后,在bin目录就是可执行文件。为了使用方便,可以将bin目录添加到PATH环境变量中。

对于freebayes而言,只需要两个输入文件,一个是参考基因组的fasta文件,另外一个是比对产生的bam文件。基本用法如下

代码语言:javascript
复制
freebayes -f ref.fasta align.bam >var.vcf

参考基因组的fasta文件需要有后缀为.fai的索引文件,可以通过samtools来构建,命令如下

代码语言:javascript
复制
samtools faidx ref.fasta

如果你提供的fasta文件没有对应的索引,程序会自动去构建。对于大型参考基因组而言,建议是先构建好索引。比对的bam文件可以按照GATK官方推荐的预处理流程得到。

输出结果是VCF格式的,示例如下

头部

代码语言:javascript
复制
##fileformat=VCFv4.2
##fileDate=20180626
##source=freeBayes v1.2.0
##reference=ref.fasta
##contig=<ID=NC_023084.1,length=156971>
##phasing=none
##commandline="./freebayes --fasta-reference ref.fasta align.bam"
##INFO=<ID=NS,Number=1,Type=Integer,Description="Number of samples with data">

正文

代码语言:javascript
复制
#CHROM    POS    ID    REF    ALT    QUAL    FILTER    INFO    FORMAT    GW1
NC_023084.1    107    .    G    T    331.137    .    AB=0;ABP=0;AC=2;AF=1;AN=2;AO=13;CIGAR=1X;DP=13;DPB=13;DPRA=0;EPP=3.17734;EPPR=0;GTI=0;LEN=1;MEANALT=1;MQM=60;MQMR=0;NS=1;NUMALT=1;ODDS=22.627;PAIRED=0.615385;PAIREDR=0;PAO=0;PQA=0;PQR=0;PRO=0;QA=423;QR=0;RO=0;RPL=0;RPP=31.2394;RPPR=0;RPR=13;RUN=1;SAF=6;SAP=3.17734;SAR=7;SRF=0;SRP=0;SRR=0;TYPE=snp;technology.illumina=1    GT:DP:AD:RO:QR:AO:QA:GL    1/1:13:0,13:0:0:13:423:-38.3849,-3.91339,0

VCF格式之前的文章中已经详细介绍过,每个字段的含义可以参考头部的注释信息。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-06-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档