前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >一键批量计算kaks

一键批量计算kaks

作者头像
阿凡亮
发布2020-04-13 13:37:48
1.7K0
发布2020-04-13 13:37:48
举报
文章被收录于专栏:生物信息学生物信息学

ParaAT是中科院基因组所的章张课题组开发的工具,它整合了计算ka/ks所需的一整套分析,包括:

  1. 蛋白序列比对(可选 clustalw2 | t_coffee | mafft | muscle)
  2. 根据蛋白比对结果回译成codon对应的核酸比对结果 (Back-translated nucleotide alignments guided by amino acid alignments are more reliable and accurate than direct nucleotide alignments)
  3. 计算kaks值(KaKs_Calculator实现)

ParaAT安装

1. 下载ParaAT2.0

(https://bigd.big.ac.cn/tools/paraat)

解压后,“ParaAT.pl”是运行的脚本。可以把解压后的路径加入环境变量,或者用脚本所在的绝对路径来运行也可以。

2. 安装所需的依赖工具,依赖工具需要加入环境变量

  • 蛋白比对工具,推荐安装muscle,比对效果相对最好,比对速度快,但

它比其它工具更消耗内存。

  • KaKs_Calculator (http://bigd.big.ac.cn/tools/kaks)

准备输入文件

1. 同源基因列表,文件格式如下:

代码语言:javascript
复制
geneA1  geneA2  geneA3geneB1  geneB2  geneB3geneC1  geneC2  geneC3geneD1  geneD2  geneD3

每一行表示一组同源基因,每一列表示每个物种对应的基因。gene ID之间用tab符隔开。

2. fasta格式的蛋白序列文件和核酸序列文件,注意gene ID要与同源基因列表文件中的ID一致;

3. 多线程运行,指定线程数量的文件。

这个文件只需要写入一个数字即可,表示有多少个线程同时运行。

三种示例文件可以在解压的安装包中找到,分别是:test.homologs, test.pep, test.cds, proc

运行ParaAT

运行代码如下:

代码语言:javascript
复制
ParaAT.pl -h test.homologs -n test.cds -a test.pep -p proc -m muscle -g -k -o result_dir

-h, 指定同源基因列表文件

-n, 指定核酸序列文件

-a, 指定蛋白序列文件

-p, 指定多线程文件

-m, 指定比对工具

-g, 去除比对有gap的密码子

-k, 用KaKs_Calculator 计算kaks值

-o, 输出结果的目录

注:

1. 如果需要用PAML,Hyphy等工具分析kaks时,ParaAT也可以生成这些工具所需的输入文件(-f 参数)

2. 如果是细菌的序列,需要设置成细菌对应的Genetic Code used (-c 11)。其他物种同理,默认的是The Standard Code (-c 1)

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-09-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生物信息学 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档