专栏首页生信修炼手册FastTree:速度最快的最大似然法进化树构建软件

FastTree:速度最快的最大似然法进化树构建软件

欢迎关注”生信修炼手册”!

FastTree 是基于最大似然法构建进化树的软件,它最大的特点就是运行速度快,支持几百万条序列的建树任务。官方的说法是,对于大的比对数据集,FastTree 比phyml或者RAxML 快100到1000倍。官网如下

http://www.microbesonline.org/fasttree/

FastTree 支持核酸和蛋白的进化树构建,对于核酸,可选的替换模型包括以下几种

  1. JC
  2. GTR

默认的模型为JC。

对于蛋白质,可选的替换模型包括以下几种

  1. JTT
  2. LG
  3. WAG

默认的模型为JTT。

利用不同的测试数据集,比较了fastTree 不同替换模型和RAxML, PhyML 运行速度的差异。结果如下

对于蛋白序列而言,FastTree 的运行速度比其他两款软件快了1000多倍,而且对于几万条序列的比对,其他两款软件的运行时间太久,超过了可以忍受的范围;对于核酸序列而言,默认的JC模型的速度最快, GTR模型速度少稍差一筹,其他两款软件同样运行速度慢的不行。

FastTree 除了运行速度快之外,准确度也令人满意,比较的结果如下

对于几万条的核酸序列,只有FastTree, NJ, Clearcut 这3个软件有结果,而FastTree 的准确度是最高的,从此可以看出,对于几万条核酸序列的进化树分析,FastTree 是最佳选择之一;对于蛋白序列,在可以运行出结果的前提下,FastTree 的准确度相比RAxML, PhyML 都稍差一点。

综合运行速度和建树的准确性,FastTree 都是最佳的进化树构建软件之一。 我们可以直接从官网下载可执行文件

FastTree要求输入的多序列比对结果为FASTA或者Phylip格式,对于蛋白质的进化树构建,基本用法如下

FastTree protein.fasta > tree

也可以选择LG或者WAG替换模型,用法如下

FastTree -lg protein.fasta > tree
FastTree -wag protein.fasta > tree

对于核酸序列,基本用法如下

FastTree -nt nucleotide.fasta > tree

也可以选择GTR替换模型,用法如下

FastTree -nt  -gtr nucleotide.fasta > tree

默认生成的tree 文件是 Newick格式, 可以导入 figTree 或者 TreeViewer等软件中进行查看。

·end·

—如果喜欢,快分享给你的朋友们吧—

本文分享自微信公众号 - 生信修炼手册(shengxinxiulian),作者:lzyg

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-08-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 详解参考基因组的下载方式

    在数据分析中,经常需要下载物种的参考基因组序列。通常情况下,可以考虑以下3个数据库

    生信修炼手册
  • 使用cell ranger拆分10X单细胞转录组原始数据

    cell ranger是10X genomics公司提供的,专门用于分析10X 单细胞转录组数据的pipeline, 包含了原始数据拆分,表达定量,聚类分析等多...

    生信修炼手册
  • 使用DREME挖掘序列中的de novo motif

    将contorl对应的序列集合称之为negative sequences, 将另一组称之positive sequences,采用费舍尔精确检验分析motif在...

    生信修炼手册
  • Docker容器实战(七) - 容器中进程视野下的文件系统

    这么一搞,进程就真的被“装”在了一个与世隔绝的房间里,而这些房间就是PaaS项目赖以生存的应用“沙盒”。

    JavaEdge
  • 3.1.4 、Google Tag Manager基础知识——GTM部署

    在了解完GTM账户和容器的操作界面后,对各个位置的功能和操作都有一定的了解,接下来看如何部署GTM跟踪代码。

    GA小站
  • Android和IOS的TLS问题

    这个问题起源于以前给客户端写的一个log模块,然后里面为了线程安全且多线程下不互相写乱,并且因为这些系统基本都用比较高版本的编译器,都支持C++11了,所以就用...

    owent
  • JavaScript之对数组中元素进行增删改

    JavaScript中数据类型无非是:简单类型+复杂类型,什么是简单什么又是复杂。从电脑物理存储上讲,简单就是所见即所得,你看见什么,电脑里面存的就只是什么,并...

    用户1148399
  • SIGIR2020|图灵奖得主Hinton主题演讲:无监督对比学习将是神经网络的未来

    第二种方法,是Becker和Hinton在1992年提出的,通过训练一个深层神经网络的两个副本,以相同图像的两种不同剪裁作为输入,产生具有高度互信息的输出向量。...

    新智元
  • 3.1 .1、Google Tag Manager基础知识——GTM简介

    Google Tag Manager(谷歌代码管理系统,GTM)可以帮助您快速轻松地更新网站或移动应用上的代码和代码段,例如用于流量分析和营销优化的代码和代码段...

    GA小站
  • 让决策者充分利用云计算价值的10个方法

    在本文中列出了10个与云计算接触时需要留意的关键点,以帮助企业的业务决策者避免陷入一些IT误区,并从云计算中找到对于企业来说最有价值的部分。 1、在采购之前先了...

    静一

扫码关注云+社区

领取腾讯云代金券