PHP数据结构(十四)
——键树(双链树)
(原创内容,转载请注明来源,谢谢)
一、概念
键树又称为数字查找树,该树的度>=2,每个节点不是存储关键字,而是存储组成关键字的一个字符或数值的一个数字。例如现有下列字符串:lin、li、linhxx、php、pdo、phper,使用键树存储的结果如下图:
从上图可以看出,键树由一个不代表任何内容的根节点、若干字符节点和一个结束节点组成,结束节点统一用$表示。
二、存储
键树有两种存储方式,一种称为双链树存储,另一种称为多重链表存储(又称Trie树)。
1、双链树存储
以树的孩子兄弟表示键树,每个节点包括三个域:symbol域,存储关键字的字符;first域,存储第一棵子树的节点;next域,存储下一个兄弟指针。
双链树对于查找而言非常便利,而对于增加、删除节点较为复杂。双链树存储如下图所示。
从双链树进行查找和插入的方法,即字符串逐个比较的方法,用第一个字符和根节点下面的所有第一级子节点进行比较,如果存在则进入该子树,再用第二个字符和子树的第一级子节点进行比较;如果比较失败,则插入一个子树。
编程思想:
1)把字符串逐个进行遍历,遍历第一个字符串的时候在双链树的第一行,第二个进入第二行;
2)先横向遍历,如果没有找到节点,则生成一个节点,并让上一个兄弟节点指向该节点,再进入其子节点进行循环。如果找到节点,则直接进入其子节点。
3)子节点生成后,需要将其父节点指向该子节点。
4)代码的关键在于用两个临时栈,一个是兄弟节点栈,在横向遍历的时候暂存;一个是双亲节点栈,用于在纵向遍历的时候暂存。
代码执行结果如下:
源码如下:
<?php
//键树-双链树结构-节点
class Node{
public $symbol;//标记字符
public $last;//标记第一个兄弟节点
public $first;//标记第一个子节点
public function __construct($symbol =null, $first = null, $last = null){
$this->symbol = $symbol;
$this->first = $first;
$this->last = $last;
}
}
classDoubleLinkKeyTree{
private $tree;
public function __construct(){
$this->tree = newNode();//根节点
$this->tree->first =new Node();
}
//构造双链树
//格式:array($str1,$str2, $str3)
public function generate(array$arrStr){
//初始情况:把最后一个字符串直接生成到树
$strLast =array_pop($arrStr);//剔除最后一个字符串,采用最后一个不采用第一个是因为array_pop速度比array_shift快
$strLast .= '$';//加上结束符
$curNode = $this->tree;
for($i=0;$i<strlen($strLast);$i++){
$curNode->first =new Node($strLast[$i]);
$curNode =$curNode->first;
}
$curNode =$this->tree->first;//当前节点回到根节点的第一个子树
$broStack = array();//兄弟节点栈
$parStack = array();//双亲节点栈
//逐个字符串生成双链树的节点
foreach($arrStr as $str){
$str .= '$';//加上结束符
//遍历字符串str的每一个字符
for($i=0;$i<strlen($str);$i++){
//如果节点是空,则
if(null ==$curNode){
//获取双亲节点
$parNode= array_pop($parStack);
//构造子节点并入栈
$curNode= new Node($str[$i]);
array_push($parStack,$curNode);
//修改双亲阶段指向
$parNode->first= $curNode;
//修改子节点指向
$curNode= $curNode->first;
continue;
}
//遍历兄弟节点
while(null!= $curNode && $curNode->symbol != $str[$i]){
array_push($broStack,$curNode);
$curNode= $curNode->last;
}
if(null ==$curNode){
//回溯上一个兄弟节点
$lastNode= array_pop($broStack);
//建立节点并入栈
$curNode= new Node($str[$i]);
array_push($parStack,$curNode);
//将上一个节点指向该节点
$lastNode->last= $curNode;
//开始遍历该节点的子节点
$curNode= $curNode->first;
continue;
}
//如果兄弟节点找到相同的节点,则遍历子节点
if($curNode->symbol== $str[$i]){
array_push($parStack,$curNode);
$curNode= $curNode->first;
continue;
}
$broStack =array();//释放兄弟节点栈(因为每一个字符结束要去下一行搜索,本行的兄弟节点栈没有意义)
}
//遍历完一个字符串,回到根节点
$curNode =$this->tree->first;
}
return $this->tree;
}
//查询是否存在树中
public function search($str){
$curNode = $this->tree;
//如果树还没生成,返回false
if(null == $curNode){
return false;
}
$curNode =$this->tree->first;
//如果树还没生成,返回false
if(null == $curNode){
return false;
}
$isExist = true;
$str .= '$';//拼接上结束符
for($i=0;$i<strlen($str);$i++){
if(null ==$curNode){
$isExist =false;
break;
}
//如果匹配,则查下一个字符
if($str[$i] ==$curNode->symbol){
$curNode =$curNode->first;
continue;
}
//查找兄弟节点
while(null !=$curNode && $str[$i] != $curNode->symbol){
$curNode =$curNode->last;
}
//兄弟节点都没有匹配的,则返回false
if(null ==$curNode){
$isExist =false;
break;
}
//兄弟节点匹配的,查找其子节点
$curNode =$curNode->first;
}
return $isExist;
}
}
$doubleLinkKeyTree= new DoubleLinkKeyTree();
$res =$doubleLinkKeyTree->generate(array('lin', 'php', 'li'));
print_r($res);
——written by linhxx 2017.07.14