随便找一个SNP-calling的综述就可以找到一大堆软件的评价,我这里强烈推荐A survey of tools for variant analysis of next-generation genome sequencing data : http://bib.oxfordjournals.org/content/15/2/256.short
如果你在找变异这一个知识点还很模糊,甚至可以花点时间来翻译一下,同时欢迎大家交流自己的学习心得(http://www.biotrainee.com/thread-109-1-1.html 论坛回帖即可)
我很早以前处理外显子数据的时候,就比较过几个软件的找变异的效果,这里就继续沿用上次的思路!
我比较了gatk,freebayes,bcftools,varscan ,都是引用率比较高的而且经受了时间的考验的好软件。
【直播】我的基因组(四):计算资源的准备
它们的下载安装方法是:
## Download and install bcftools ## http://www.htslib.org/download/ ## http://www.htslib.org/doc/bcftools-1.0.html cd ~/biosoft mkdir bcftools && cd bcftools wget https://github.com/samtools/bcftools/releases/download/1.3.1/bcftools-1.3.1.tar.bz2 tar xvfj bcftools-1.3.1.tar.bz2 cd bcftools-1.3.1 make cp bcftools /home/jianmingzeng/biosoft/myBin ~/biosoft/myBin/bin/bcftools --help ## Download and install freebayes ## https://github.com/ekg/freebayes ## http://clavius.bc.edu/~erik/CSHL-advanced-sequencing/freebayes-tutorial.html cd ~/biosoft mkdir freebayes && cd freebayes ## wget -O freebayes-master.zip https://codeload.github.com/ekg/freebayes/zip/master ## unzip freebayes-master.zip wget http://clavius.bc.edu/~erik/freebayes/freebayes-5d5b8ac0.tar.gz tar xzvf freebayes-5d5b8ac0.tar.gz cd freebayes make ~/biosoft/freebayes/freebayes/bin/freebayes cd ~/biosoft ## https://sourceforge.net/projects/varscan/files/ ## http://varscan.sourceforge.net/index.html mkdir VarScan && cd VarScan wget https://sourceforge.net/projects/varscan/files/VarScan.v2.3.9.jar ## GATK有一点特殊,需要注册才能下载,微信公众号后台回复GATK也可以,我传给你哈 我这里就直接秀我以前处理的3个外显子测序结果的这4个软件的差异吧!
明显可以看出,大部分的snp位点都至少有两到三个软件支持。所以,只有测序深度达到一定级别,用什么软件来做snp-calling,其实影响并不大。
如果软件有区别的那些位点,通常我们还是需要在IGV里用肉眼仔细辨别的,毕竟这是关乎于个人健康的大事呀!
参考:http://www.bio-info-trainee.com/1150.html(阅读原文即可)
文:Jimmy
图文编辑:吃瓜群众