欢迎关注"生信修炼手册"!
GeneMark-ES软件用于预测真核生物中的蛋白编码基因,和其他预测基因结构的软件不同,它采用的是非监督算法,可以不依赖训练集进行预测。官网如下
http://exon.biology.gatech.edu/GeneMark/gmes_instructions.html
安装过程如下:
wget http://topaz.gatech.edu/GeneMark/tmp/GMtool_lqacT/gm_key_64.gz
wget http://topaz.gatech.edu/GeneMark/tmp/GMtool_lqacT/gm_et_linux_64.tar.gz
tar xzvf gm_et_linux_64.tar.gz
gunzip gm_key_64.gz
cp ../../gm_key_64 ~/.gm_key
gm_key文件是软件的通行证,需要拷贝到家目录下,软件本身只需要解压缩就可以了。
基本用法如下
gmes_petap.pl --ES --cores 10--sequence genome.fa
gmes_petap.pl
本身整合了geneMark-ES和geneMark-ET两个功能,genemark-ES用于基因组数据的预测,geneMark-ET用于转录组数据的预测。
--ES
表示采用genemark-ES算法,--cores
指定并行的CPU个数,--sequence
指定输入的fasta格式的序列。
对于真菌,有专门的参数,示例如下
gmes_petap.pl --fungus --cores 10--sequence genome.fa
默认配置下,输出文件名为genemark.gtf
, 保存在软件的安装目录,采用GTF格式来记录基因的结构信息。