专栏首页生物信息学一键批量计算kaks

一键批量计算kaks

ParaAT是中科院基因组所的章张课题组开发的工具,它整合了计算ka/ks所需的一整套分析,包括:

  1. 蛋白序列比对(可选 clustalw2 | t_coffee | mafft | muscle)
  2. 根据蛋白比对结果回译成codon对应的核酸比对结果 (Back-translated nucleotide alignments guided by amino acid alignments are more reliable and accurate than direct nucleotide alignments)
  3. 计算kaks值(KaKs_Calculator实现)

ParaAT安装

1. 下载ParaAT2.0

(https://bigd.big.ac.cn/tools/paraat)

解压后,“ParaAT.pl”是运行的脚本。可以把解压后的路径加入环境变量,或者用脚本所在的绝对路径来运行也可以。

2. 安装所需的依赖工具,依赖工具需要加入环境变量

  • 蛋白比对工具,推荐安装muscle,比对效果相对最好,比对速度快,但

它比其它工具更消耗内存。

  • KaKs_Calculator (http://bigd.big.ac.cn/tools/kaks)

准备输入文件

1. 同源基因列表,文件格式如下:

geneA1  geneA2  geneA3geneB1  geneB2  geneB3geneC1  geneC2  geneC3geneD1  geneD2  geneD3

每一行表示一组同源基因,每一列表示每个物种对应的基因。gene ID之间用tab符隔开。

2. fasta格式的蛋白序列文件和核酸序列文件,注意gene ID要与同源基因列表文件中的ID一致;

3. 多线程运行,指定线程数量的文件。

这个文件只需要写入一个数字即可,表示有多少个线程同时运行。

三种示例文件可以在解压的安装包中找到,分别是:test.homologs, test.pep, test.cds, proc

运行ParaAT

运行代码如下:

ParaAT.pl -h test.homologs -n test.cds -a test.pep -p proc -m muscle -g -k -o result_dir

-h, 指定同源基因列表文件

-n, 指定核酸序列文件

-a, 指定蛋白序列文件

-p, 指定多线程文件

-m, 指定比对工具

-g, 去除比对有gap的密码子

-k, 用KaKs_Calculator 计算kaks值

-o, 输出结果的目录

注:

1. 如果需要用PAML,Hyphy等工具分析kaks时,ParaAT也可以生成这些工具所需的输入文件(-f 参数)

2. 如果是细菌的序列,需要设置成细菌对应的Genetic Code used (-c 11)。其他物种同理,默认的是The Standard Code (-c 1)

本文分享自微信公众号 - 生物信息学(swxxx1),作者:zbl

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-09-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 只用一行来颠覆你处理文件的方式

    引言:生物信息学文件多样,通常我们会遇到各种将不同格式进行转换或者把文件修改成我们想要的那种格式的需求,不懂生信的小伙伴们会请教会生信的小伙伴,其实会生信的同学...

    阿凡亮
  • 基于机器学习的蛋白质亚细胞定位预测

    蛋白质是生命活动的主要承担者,也是组成人体一切细胞、组织的重要成分。研究表明,所有蛋白质有对应的亚细胞器,不同功能的蛋白质只有存在于特定的亚细胞器,才能正常发挥...

    阿凡亮
  • 单倍型分析软件Haploview的导入格式及使用

    Haplovew目前主要接受:Linkage Format;PHASE format;PLINK format;Hapmap format;Haps fo...

    阿凡亮
  • 打卡群刷题总结0812——路径总和 II

    链接:https://leetcode-cn.com/problems/path-sum-ii

    木又AI帮
  • Hack the box靶机实战:Haystack

    HayStack 在 HTB 里面的难度评级是简单,但其实它一点都不简单。在一堆西班牙语中找到用户名和密码真的好头痛。对于 root 权限,你应该对 ELK 有...

    FB客服
  • Istio安全-证书管理(istio 系列六)

    默认情况下,istio的CA会生成一个自签的根证书和密钥,并使用它们签发负载证书。istio的CA也会使用管理员指定的证书和密钥,以及管理员指定的根证书来签发负...

    charlieroro
  • 【DB笔试面试696】在Oracle中,什么OSWatcher工具?

    OSWbb(OSWatcher Black Box)是Oracle开发、提供的一个小巧,但是实用、强大的系统工具,它可以用来抓取操作系统的性能指标,用于辅助监控...

    小麦苗DBA宝典
  • Android SystemUI(一):图文并茂的介绍 :D

    菜天哥哥
  • 使用Spring Boot和Kotlin创建RESTfull API

    使用 Kotlin 结合 SpringBoot 开发一个 RESTFul版本的 HelloWorld。

    全科
  • IDEA配置Resin

    前两天运行项目需要Resin,搜索时发现可用信息不多,在此记录一下配置过程,以及期间遇上的问题。

    汐楓

扫码关注云+社区

领取腾讯云代金券