专栏首页生信修炼手册Newick: tree文件格式简介

Newick: tree文件格式简介

欢迎关注”生信修炼手册”!

Newick 是最常见的进化树文件格式,了解这种格式之前,有必要先掌握树状结构的构成。首先来看一个tree的示例

对于一棵树而言,其节点可以分成三类

  1. root node
  2. internal nodes
  3. leaf nodes

在上述示例中,一共有A-F共6个节点。其中A-D, 通常称之为叶子节点leaf nodes, 叶子节点往下在没有其他的节点了; E称之为内部节点internal nodes,往下还有其他的节点;F称之为根节点root node, 是整个树中所有节点的公共祖先。

所有节点之间存在了层级关系,A,B,E这3个节点直接和根节点F相连,是树状结构中的第一层,CDE相连,是树状结构中的第二层。位于同一层级的节点,互称为同胞节点sliding nodes; 层级关系中位于上一层的节点,称之为父节点parent node,比如E就是CD的父节点; 类似的,CD称为E的子节点child node

树状结构中,除了节点外,还包括了分支 branch, 分支长度是非常重要的属性。比对从根节点F到叶子节点A的分支长度为0.1, 到叶子节点B的长度为0.2。

当我们表示一个树状结构时,本质上是表示节点和分支的信息。对于newick这种格式,采用圆括号将同胞节点括起来,多个节点之间用逗号相连,比如A和B表示为

(A,B)

对于父节点,直接写在子节点圆括号的外面,比如C,D, E 表示为

(C,D)E

通过圆括号的嵌套区分不同层级,然后就可以表示出一个完整的树,上述的tree表示为

(A,B, (C,D)E)F

上述的表示方式缺少了分支的信息,对于分支的信息,将其当做节点的属性来表示,和节点的名称之间用冒号:分割,比如A:0.1。当加上分支信息后,上面的tree表示为

(A:0.1,B:0.2,(C:0.3, D:0.4)E:0.5)F

这种表示方式涵盖了tree文件中所有的信息,但是在实际使用中,我们通常更关注叶子节点,内部结点只是用来呈现tree的层级结构,其名称并不是很重要。同时根节点也可以忽略不显示,所以上述tree可以表示为

(A:0.1,B:0.2,(C:0.3, D:0.4):0.5)

·end·

—如果喜欢,快分享给你的朋友们吧—

本文分享自微信公众号 - 生信修炼手册(shengxinxiulian),作者:lzyg

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-08-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 如何从PPI网络进一步挖掘信息

    从数据库中得到蛋白质的相互作用信息之后,我们可以构建蛋白质间的相互作用网络,但是这个网络是非常复杂的,节点和连线的个数很多,如果从整体上看,很难挖掘出任何有生物...

    生信修炼手册
  • Co-LncRNA:lncRNA与蛋白编码基因的共表达网络数据库

    有多项研究表明lncRNA与众多生物学过程,复杂疾病相关,为了进一步探究lncRNA在这些生命活动中的具体作用,我们需要对lncRNA的功能进行分析。

    生信修炼手册
  • 详解GO的层级关系在富集分析中的应用

    对于Gene ontology 而言,目前共有2万多个Go trems。 做完富集分析后,我们可能会得到几百甚至几千个富集到的GO terms, 这样的一个数据...

    生信修炼手册
  • 聊聊树与二叉树

    数据结构中的树是什么样子呢?他就像是一个倒着生长的树,对照着两幅图看,是不是很相似。其中圆圈的位置就是数据存放的地方。

    大猫的Java笔记
  • 【从二叉树到红黑树】清晰理解红黑树的演变---红黑的含义

    网上关于红黑树的博文很多,但是多是上来即讲定义,未说其所以然,难以理解且无所营养,甚者示例图有误且概念模糊的比比即是;

    云服务器最新
  • 动画 | 什么是红黑树?(基于2-3树)

    学习过2-3树之后就知道应怎样去理解红黑树了,如果直接看「算法导论」里的红黑树的性质,是看不出所以然。我们也看看一颗二分搜索树满足红黑的性质:

    我脱下短袖
  • 我画了 20 张图,给女朋友讲清楚红黑树

    红黑树是一种常见的自平衡二叉查找树,常用于关联数组、字典,在各种语言的底层实现中被广泛应用,Java的TreeMap和TreeSet就是基于红黑树实现的。本篇分...

    范蠡
  • Redis主从复制

    爱撒谎的男孩
  • Gephi实战,从零开始

    Gephi 是一款网络分析领域的数据可视化处理软件,开发者对它寄予的希望是:成为 “数据可视化领域的Photoshop” ,可运行在Windows,Linux及...

    咻咻ing
  • 动画 | 什么是2-3-4树?

    画了一系列树的动画,从二分搜索树,到AVL树,再到2-3树,再到基于2-3树的红黑树,都可以发现这些树都跟二叉查找树很像啊。

    我脱下短袖

扫码关注云+社区

领取腾讯云代金券