二叉树是使用较多的一种树形结构,如比较经典的二叉排序树,Huffman编码等,都使用到了二叉树的结构,同时,在机器学习算法中,基于树的学习算法中也大量使用到二叉树的结构,因此,我们有必要对二叉树的结构有比较详细的了解和掌握。
二叉树(Binary Tree)是包含nn个节点的有限集合,该集合或者为空集(此时,二叉树称为空树),或者由一个根节点和两棵互不相交的、分别称为根节点的左子树和右子树的二叉树组成。
一棵典型的二叉树如下图所示:
由上述的定义可以看出,二叉树中的节点至多包含两棵子树,分别称为左子树和右子树,而左子树和右子树又分别至多包含两棵子树。由上述的定义,二叉树的定义是一种递归的定义。
对于一棵二叉树,如果每一个非叶子节点都存在左右子树,并且二叉树中所有的叶子节点都在同一层中,这样的二叉树称为满二叉树。
一棵满二叉树如下图所示:
对于一棵具有nn个节点的二叉树按照层次编号,同时,左右子树按照先左后右编号,如果编号为ii的节点与同样深度的满二叉树中编号为ii的节点在二叉树中的位置完全相同,则这棵二叉树称为完全二叉树。
一棵完全二叉树如下图所示:
对于二叉树,包含一些性质:
若要想对二叉树进行操作,首先需要定义二叉树的存储结构,对于如下图所示的二叉树:
其对应的存储有两种:
首先,我们来看顺序存储结构,简单来讲,顺序存储结构是指用一维数据存储二叉树中的节点,其中,数组的下标要能体现节点之间的逻辑关系,对于上述的二叉树,其顺序存储结构为:
在顺序存储结构中,“^”表示的是没有节点,从顺序存储可以看出,若出现大量“^”,则对空间是一种极大的浪费。
在二叉树中,每一个节点至多存在左右子树,因此在链式存储结构中,每一个节点的结构为:
其中,data 称为数据域,lchild和rchild称为指针域,分别指向左孩子和右孩子。
在实际使用中,根据不同的需要,使用顺序存储结构和链式存储结构。对于链式存储结构,我们定义如下:
typedef struct BiNode{
int data;// 数据域的值
struct BiNode *left;// 左孩子
struct BiNode *right;// 右孩子
}binode;
在二叉树的操作中,二叉树的遍历是基本的操作,对于二叉树的遍历操作,主要分为:
对于前序遍历,首先遍历根节点,其次遍历左孩子,再遍历右孩子,按照如此的顺序遍历整棵树,其代码如下:
// 先序遍历
void pre_order(binode *p){
if (p != NULL){
printf("%d\t", p->data);
pre_order(p->left);
pre_order(p->right);
}
}
对于中序遍历,首先遍历左子树,其次遍历父节点,最后遍历右子树,按照如此的顺序遍历整棵树,其代码如下:
// 中序遍历
void in_order(binode *p){
if (p != NULL){
in_order(p->left);
printf("%d\t", p->data);
in_order(p->right);
}
}
对于后序遍历,首先遍历左子树,其次遍历右子树,最后遍历父节点,其代码如下:
// 后序遍历
void post_order(binode *p){
if (p!= NULL){
post_order(p->left);
post_order(p->right);
printf("%d\t", p->data);
}
}
对于层次遍历,需要使用链表存储每一层的节点,同时,遍历完一个节点,将其左右子节点增加近链表中,其代码为:
// 层次遍历
void lever_order(binode *p){
// 使用队列
list<binode *> t;
if (p != NULL){
t.push_back(p);
}
while (t.size() > 0){
printf("%d\t", (t.front())->data);
if ((t.front())->left != NULL){
t.push_back((t.front())->left);
}
if ((t.front())->right != NULL){
t.push_back((t.front())->right);
}
t.pop_front();
}
}
最终的遍历结果为: