PHP数据结构(十四) ——键树(双链树)

PHP数据结构(十四)

——键树(双链树)

(原创内容,转载请注明来源,谢谢)

一、概念

键树又称为数字查找树,该树的度>=2,每个节点不是存储关键字,而是存储组成关键字的一个字符或数值的一个数字。例如现有下列字符串:lin、li、linhxx、php、pdo、phper,使用键树存储的结果如下图:

从上图可以看出,键树由一个不代表任何内容的根节点、若干字符节点和一个结束节点组成,结束节点统一用$表示。

二、存储

键树有两种存储方式,一种称为双链树存储,另一种称为多重链表存储(又称Trie树)。

1、双链树存储

以树的孩子兄弟表示键树,每个节点包括三个域:symbol域,存储关键字的字符;first域,存储第一棵子树的节点;next域,存储下一个兄弟指针。

双链树对于查找而言非常便利,而对于增加、删除节点较为复杂。双链树存储如下图所示。

从双链树进行查找和插入的方法,即字符串逐个比较的方法,用第一个字符和根节点下面的所有第一级子节点进行比较,如果存在则进入该子树,再用第二个字符和子树的第一级子节点进行比较;如果比较失败,则插入一个子树。

编程思想:

1)把字符串逐个进行遍历,遍历第一个字符串的时候在双链树的第一行,第二个进入第二行;

2)先横向遍历,如果没有找到节点,则生成一个节点,并让上一个兄弟节点指向该节点,再进入其子节点进行循环。如果找到节点,则直接进入其子节点。

3)子节点生成后,需要将其父节点指向该子节点。

4)代码的关键在于用两个临时栈,一个是兄弟节点栈,在横向遍历的时候暂存;一个是双亲节点栈,用于在纵向遍历的时候暂存。

代码执行结果如下:

源码如下:

<?php
//键树-双链树结构-节点
class Node{
         public $symbol;//标记字符
         public $last;//标记第一个兄弟节点
         public $first;//标记第一个子节点
         public function __construct($symbol =null, $first = null, $last = null){
                   $this->symbol = $symbol;
                   $this->first = $first;
                   $this->last = $last;
         }
}
classDoubleLinkKeyTree{
         private $tree;
         public function __construct(){
                   $this->tree = newNode();//根节点
                   $this->tree->first =new Node();
         }
         //构造双链树
         //格式:array($str1,$str2, $str3)
         public function generate(array$arrStr){
                   //初始情况:把最后一个字符串直接生成到树
                   $strLast =array_pop($arrStr);//剔除最后一个字符串,采用最后一个不采用第一个是因为array_pop速度比array_shift快
                   $strLast .= '$';//加上结束符
                   $curNode = $this->tree;
                   for($i=0;$i<strlen($strLast);$i++){
                            $curNode->first =new Node($strLast[$i]);
                            $curNode =$curNode->first;
                   }
                   $curNode =$this->tree->first;//当前节点回到根节点的第一个子树 
                   $broStack = array();//兄弟节点栈
                   $parStack = array();//双亲节点栈
                   //逐个字符串生成双链树的节点
                   foreach($arrStr as $str){
                            $str .= '$';//加上结束符 
                            //遍历字符串str的每一个字符
                            for($i=0;$i<strlen($str);$i++){
                                     //如果节点是空,则
                                     if(null ==$curNode){
                                               //获取双亲节点
                                               $parNode= array_pop($parStack);
                                               //构造子节点并入栈
                                               $curNode= new Node($str[$i]);
                                               array_push($parStack,$curNode);
                                               //修改双亲阶段指向
                                               $parNode->first= $curNode;
                                               //修改子节点指向
                                               $curNode= $curNode->first;
                                               continue;
                                     }
                                     //遍历兄弟节点
                                     while(null!= $curNode && $curNode->symbol != $str[$i]){
                                               array_push($broStack,$curNode);
                                               $curNode= $curNode->last;
                                     }
                                     if(null ==$curNode){
                                               //回溯上一个兄弟节点
                                               $lastNode= array_pop($broStack);
                                               //建立节点并入栈
                                               $curNode= new Node($str[$i]);
                                               array_push($parStack,$curNode);
                                               //将上一个节点指向该节点
                                               $lastNode->last= $curNode;
                                               //开始遍历该节点的子节点
                                               $curNode= $curNode->first;
                                               continue;
                                     }
                                     //如果兄弟节点找到相同的节点,则遍历子节点
                                     if($curNode->symbol== $str[$i]){
                                               array_push($parStack,$curNode);
                                               $curNode= $curNode->first;
                                               continue;
                                     }
                                     $broStack =array();//释放兄弟节点栈(因为每一个字符结束要去下一行搜索,本行的兄弟节点栈没有意义)
                            }                          
                            //遍历完一个字符串,回到根节点
                            $curNode =$this->tree->first;
                   }
                   return $this->tree;
         }
         //查询是否存在树中
         public function search($str){
                   $curNode = $this->tree;
                   //如果树还没生成,返回false
                   if(null == $curNode){
                            return false;
                   }
                   $curNode =$this->tree->first;
                   //如果树还没生成,返回false
                   if(null == $curNode){
                            return false;
                   }
                   $isExist = true;
                   $str .= '$';//拼接上结束符
                   for($i=0;$i<strlen($str);$i++){
                            if(null ==$curNode){
                                     $isExist =false;
                                     break;
                            }                          
                            //如果匹配,则查下一个字符
                            if($str[$i] ==$curNode->symbol){
                                     $curNode =$curNode->first;
                                     continue;
                            }
                            //查找兄弟节点
                            while(null !=$curNode && $str[$i] != $curNode->symbol){
                                     $curNode =$curNode->last;
                            }
                            //兄弟节点都没有匹配的,则返回false
                            if(null ==$curNode){
                                     $isExist =false;
                                     break;
                            }
                            //兄弟节点匹配的,查找其子节点 
                            $curNode =$curNode->first;
                   }
                   return $isExist;
         }
}
$doubleLinkKeyTree= new DoubleLinkKeyTree();
$res =$doubleLinkKeyTree->generate(array('lin', 'php', 'li'));
print_r($res);

——written by linhxx 2017.07.14

相关阅读:

PHP数据结构(十三) ——动态查找表(二叉排序树)

PHP数据结构(十二) ——静态查找表​

PHP数据结构(十一) ——图的连通性问题与最小生成树算法(2)

PHP数据结构(十一) ——图的连通性问题与最小生成树算法(1)

PHP数据结构(十) ——有向无环图与拓扑算法

PHP数据结构(九) ——图的定义、存储与两种方式遍历

PHP数据结构(八) ——赫夫曼树实现字符串编解码(实践2)

PHP数据结构(八) ——赫夫曼树实现字符串编解码(实践1)

PHP数据结构(八) ——赫夫曼树实现字符串编解码(理论)

PHP数据结构(七) ——串与实现KMP算法

PHP数据结构(六) ——树与二叉树之概念及存储结构

PHP数据结构(六) ——数组的相乘、广义表

PHP数据结构(五) ——数组的压缩与转置

PHP数据结构(四) ——队列

PHP数据结构(三)——运用栈实现括号匹配

PHP数据结构(二)——链式结构线性表

PHP数据结构(一)——顺序结构线性表

原文发布于微信公众号 - 决胜机器学习(phpthinker)

原文发表时间:2017-07-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏有趣的Python

6-玩转数据结构-二分搜索树

电脑中的文件夹就是一种树结构,计算机中让人们使用的存储结构来源于生活。图书馆分区,分类,分子类。

932
来自专栏老马说编程

计算机程序的思维逻辑 (6) - 如何从乱码中恢复 (上)?

我们在处理文件、浏览网页、编写程序时,时不时会碰到乱码的情况。乱码几乎总是令人心烦,让人困惑。希望通过本节和下节文章,你可以自信从容地面对乱码,恢复乱码。 谈...

1835
来自专栏小樱的经验随笔

POJ 1659 Frogs' Neighborhood(可图性判定—Havel-Hakimi定理)【超详解】

Frogs' Neighborhood Time Limit: 5000MS Memory Limit: 10000K Total Submis...

2738
来自专栏用户2442861的专栏

从头到尾彻底理解KMP(2014年8月22日版)

作者:July 时间:最初写于2011年12月,2014年7月21日晚10点 全部删除重写成此文,随后的半个多月不断反复改进。

693
来自专栏人工智能LeadAI

排序算法:Python 实现

import sys print (sys.version) # 3.5.2 |Continuum Analytics, Inc.| (default, J...

34310
来自专栏林德熙的博客

正则表达式30分钟入门教程

30分钟内让你明白正则表达式是什么,并对它有一些基本的了解,让你可以在自己的程序或网页里使用它。

190
来自专栏xingoo, 一个梦想做发明家的程序员

多边形游戏

多边形游戏是一个单人玩的游戏,开始时有一个由n个顶点构成的多边形。每个顶点被赋予一个整数值,每条边被赋予一个运算符“+”或“*”。所有边依次用整数从1到n编号。...

18710
来自专栏编程

文本提取仨兄弟

周二 · 函数  关键词:left、right、mid 1语法 =Left(text,[num_chars]) =Right(text,[num_chars])...

1858
来自专栏算法修养

FZU 2087 统计树边

Problem 2087 统计树边 Accept: 197 Submit: 571 Time Limit: 1000 mSec Memory...

33011
来自专栏熊二哥

正则表达式快速入门

6月进入前端技术的学习,正则算是跳不过的一个坎了,这部分没有太多需要理解的内容,知道就是王道。 ? ? 正则表达式(Regular Expression):在...

1735

扫描关注云+社区