第五节:树(下)
5.1 堆
1.堆的介绍
优先队列:特殊的“队列”,取出元素的顺序是依照元素的优先权(关键字)大小,而不是元素进入队列的先后顺序。
堆的两个特性:
(1)结构性:用数组表示的完全二叉树;
(2)有序性:任一结点的关键字是其子树所有结点的的最大值(最小值):
①最大堆:也称“大顶堆”:最大值
②最小堆,也称“小顶堆”:最小值。
2.最大堆的操作
(1)最大堆的创建
(2)最大堆的插入
当插入一个元素时,我们首先要想到将元素插入到最右下角的位置。然而,所插入的值有可能比其父结点还要大,因此我们需要将其与父结点调换位置。若此时该元素仍然要比新位置的父结点大,那么继续调换位置,直到满足要求。代码实现如下所示:
注意:H->Element[ 0 ] 是哨兵元素,它不小于堆中的最大元素,以便省去i>=1的语句,控制顺环结束。
(3)最大堆的删除
取出根结点(最大值)元素,同时删除堆的一个结点。
如图1所示。我们想取出最大值58这个点。我们需要做的是:
①把58取出,然后用最后一个元素来替补根这个位置。
②找出31的较大的孩子,然后跟31比较。发现孩子44要比31大,于是将44和31交换位置。
③再比较31和子孩子35,发现35大于31,因此交换35和31的位置。完成。
图1
代码如下:
T(N) = O ( logN)
3.最大堆的建立
堆的一个重要应用就是堆排序。要进行排序,首先需要建立堆。
建立最大堆:将已经存在的N个元素按最大堆的要求存放在一个一位数组中。
方法1:通过插入操作,将N个元素一个个相继插入到一个初始为空的堆中去,其时间代价最大为O(NlogN)。不合适。
方法2:在限行时间复杂度下建立最大堆。
(1)将N个元素按输入顺序存入,先满足完全二叉树的结构特性。
(2)调整各结点位置,以满足最大堆的有序特性。
要这样做,首先要寻找到最后一个由儿子的结点。由右往左,由下往上,直到根结点。
代码如下:
5.2 哈夫曼树和哈夫曼编码
1.哈夫曼编码介绍
设一棵二叉树有n个叶子结点,每个叶子结点带有权值wk,从根结点到每个叶子结点的长度为lk,则每个叶子结点的带权路径长度之和就是这棵树的“带权路径长度(Weighted Path Length,简称WPL)”。
假设有n个权值{w1,w2, …… ,wn} ,构造有n个叶子的二叉树,每个叶子的权值是n个权值之一。这样的二叉树也许可以构造多个,其中必有一个(或几个)是带权路径长度WPL最小的。达到WPL最小的二叉树就称为最优二叉树或哈夫曼树。
2.哈夫曼树的构造
每次把权值最小的两棵二叉树合并
3.哈夫曼树的特点
(1)没有度为1的结点;
(2)n个叶子结点的哈夫曼树共有2n-1个结点;
(3)哈夫曼树的任意非叶节点的左右子树交换后仍是哈夫曼树。
5.3 集合
1.集合基本介绍
集合运算包括交、并、补、差以及判定一个元素是否是某一集合中等。逻辑上,可以用树结构表示集合,树的每个结点代表一个集合元素。
但是更好的方法是用数组存储形式。
数组中每个元素的类型描述为:
数组每个分量都是一个结构,包含两个域:一个是Data,代表结点的信息;一个是Parent,是一个下标数值,指向父结点的下标,若为-1,代表其为根结点。这样,图2左侧的数组就可以用来表示右侧3棵树。
图2
2.集合运算
(1)集合的查找操作(用根结点表示)
int Find( SetType S[ ], ElementType X )
这段代码的意思是,首先寻找到X的下标i,如果X不在集合中,那么返回-1;若X在集合中,则需要返回其根结点的下标,这时候就利用若i的父结点大于等于0,那么久把i的父结点赋值给i,直到找到根结点,返回树根结点在数组S中的下标。
(2)集合的并操作
首先分别找到X1和X2两个元素所在集合树的根结点,如果它们不同根,则将其中一个根结点的父结点指针设置成另一个根结点的数组下标就行了。
为了改善合并以后的查找性能,可以采用小的集合合并到相对大的集合中。为了区分小的和大的,所以可以将根结点的Parent由-1改为-A,其中A代表该集合有多少元素。这样我们就可以知道哪个集合小,哪个集合大了。
领取专属 10元无门槛券
私享最新 技术干货