前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Gerbil:支持GPU加速的kmer count工具

Gerbil:支持GPU加速的kmer count工具

作者头像
生信修炼手册
发布2020-05-08 16:27:46
7340
发布2020-05-08 16:27:46
举报
文章被收录于专栏:生信修炼手册生信修炼手册

欢迎关注"生信修炼手册"!

对于基因组组装而言,kmer count是最基础的分析内容之一,传统的kmer count工具在kmer长度小于32时,有着较好的性能,但是对于较大长度的kmer, 内存消耗和运行速度都差强人意。随着测序读长的不断增加,一款能够支持较大kmer的计数,而且性能良好的工具就显得非常的有必要。

Gerbil就是这样的一款工具,除了在算法上进行优化外,还引入了GPU加速,进一步加强其性能,对应文献链接如下

https://almob.biomedcentral.com/articles/10.1186/s13015-017-0097-9

在文献中列举出了以下几款kmer count工具

  1. Jellyfish
  2. BFCounter
  3. DSK
  4. KMC
  5. Turtle
  6. MSPKmerCounter
  7. KCMBT

这些工具对于长度大于32的kmer, 性能都没有Gerbil好。对于hg38基因组,各个软件的运行速度比较如下

随着kmer长度的增加,Gerbil 的运行时间始终是最快的,其中的gGerbil代表GPU加速版的Gerbil。

软件的github链接如下

https://github.com/uni-halle/gerbil

安装过程如下

代码语言:javascript
复制
git clone https://github.com/uni-halle/gerbil.git
cd gerbil
mkdir build
cd build
cmake ..
make

基本用法如下

代码语言:javascript
复制
gerbil -k 32 input.fasta temp_dir output_dir

-k参数指定kmer的长度,input.fasta代表输入序列文件,temp_dir代表临时文件的目录,output_dir代表输出文件的目录。 和jellysifh不同,Gerbil支持多种输入文件格式

  1. fastq/fasta
  2. fastq.gz/fasta.gz
  3. fastq.bz2/fasta.bz2
  4. stdin
  5. txt

支持fastq和fasta两种格式,也支持gzip和bzip两种压缩格式,还可以从标准输入流读取文件,甚至可以是一个txt文件,每一行是一个文件路径,这样就可以,一次处理多个输入文件。

软件的输出文件是二进制文件,可以通过toFasta命令转换为纯文本格式。

更多参数和用法参考github上的说明文档。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-07-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档