【腾讯云CKV缓存】cloud key value·红黑树排名实现过程解析

问题

红黑树是一种自平衡的二叉查找树,它可以在O(logn)时间内执行查找、插入和删除。在c++ STL,linux内核中都有使用。

红黑树本身是有序的,现在问题是对于指定的元素,如何能快速查到它在整个元素集的排名,或者根据排名快速查询对应的元素?

思路

排名分顺序和逆序,这里只讨论顺序的情况。顺序的话排名就是求比当前元素小的元素的个数,根据红黑树的性质,左子树的节点都比根节点小,右子树的节点都比根节点大,求排名就等价于求节点左子树元素的个数。

根据树的递归性质,我们只需要在每个节点增加一个字段count用来统计当前节点子树的个数,同时在红黑树做插入、删除操作的时候更新count字段,就能在O(logn)的时间内查询到该元素的排名。

实现

红黑树节点增加count字段,count[x]表示x节点子节点元素的个数,包括它的左子树,它的右子树和它自己本身。

count[x] = count[left[x]] + count[right[x]] + 1; // x非空
count[x] = 0; // x为空

红黑树旋转的时候,保证count满足我们的定义就可以。

左旋

左旋后:

count[x] = count[α] + count[β] + 1
count[y] = count[x] + count[γ] + 1

左旋伪代码:

LEFT-ROTATE(T, x)
    y = right[x]
    right[x] = left[y]
    p[left[y]] = x
    p[y] = p[x]
    count[x] = count[left[x]] + count[left[right[x]]] + 1
    count[right[x]] = count[left[x]] + count[left[right[x]]] + count[right[right[x]]] + 2
    if p[x] == nil
    then root[T] = y
    else if x == left[p[x]]
        then left[p[x]] = y
        else right[p[x]] = y
    left[y] = x
    p[x] = y

右旋

右旋后:

count[y] = count[γ] + count[β] + 1
count[x] = count[x] + count[α] + 1

右旋伪代码:

RIGHT-ROTATE(T, y)
    x = left[y]
    left[y] = right[x]
    p[right[x]] = y
    p[x] = p[y]
    count[y] = count[right[y]] + count[right[left[y]]] + 1
    count[left[y]] = count[right[y]] + count[left[left[y]]] + count[right[left[y]]] + 2
    if p[y] == nil
    then root[T] = x
    else if y == right[p[y]]
        then right[p[y]] = x
        else left[p[y]] = x
    right[x] = y
    p[y] = x

插入和删除的时候对于count的修改比较简单,只修改节点所有祖先节点的count,插入的时候,我们先按照红黑树的规则插入到指定位置,然后对该节点的所有祖先节点的count都增加1,然后再做平衡调整,删除的时候类似。

根据排名查询元素

跟红黑树普通的查询类似,只不过用来比较的域换成了count,这里分为三种情况:

1.节点左子树个数 + 1 == rank,表示已经找到需要查询的元素

2.节点左子树个数 + 1 > rank, 表示当前节点左子树个数大于rank - 1,我们需要在左子树中递归查询

3.节点左子树个数 + 1 < rank, 表示当前节点左子树个数大于rank - 1, 我们需要在右字数中查询,注意这个时候需要修改rank值

QUERYBYRANK(T, r)
    y = root[T]
    while y != nil
        if count[left[y]] + 1 == r then
            // find it
            exit
        else if count[left[y]] +1 > r then
            y = left[y]
        else
            r = r - count[left[y]] - 1
            y = right[y]

查询排名

红黑树普通查询,O(logn)可以查询到指定元素的排名

RANK(T, x)
    y = root[T]
    while y != nil
        if key[x] == key[y] then
            // find it
            r = count[y]
            exit
        else if key[x] < key[y] then
            y = left[y]
        else y = right[y]

总结

插入、删除、查找算法都是在原红黑树的基础上进行简单修改,时间复杂度均为O(logn)。

红黑树增加count扩展后,增加的count操作主要在红黑树的旋转,每次红黑树平衡最多3次旋转,所以对红黑树的性能影响很小,可以用来实现游戏中常见的排行榜功能。但是当元素集合的总量达到一定规模比如千万级,可能会有性能问题,主要消耗在红黑树key的字符串比较上。

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏菩提树下的杨过

数据结构C#版笔记--啥夫曼树(Huffman Tree)与啥夫曼编码(Huffman Encoding)

哈夫曼树Huffman tree 又称最优完全二叉树,切入正题之前,先看几个定义 1、路径 Path 简单点讲,路径就是从一个指定节点走到另一个指定节点所经过的...

2489
来自专栏mathor

LeetCode54. 螺旋矩阵&LeetCode59.螺旋矩阵 II&LeetCode48. 旋转图像

 要是去找每次移动下标之间的关系就错了,很难找到,应该从宏观角度去看,首先打印的是最外层一圈,然后打印倒数第二层的一圈,...依次下去,所以应该这么做,找到...

782
来自专栏云霄雨霁

查找----基于红黑平衡树

1300
来自专栏desperate633

LeetCode 54. Spiral Matrixsolution

新建一个direction类,用它来控制坐标的移动,有两个函数,一个move,一个是turn。

651
来自专栏ACM算法日常

PAT甲级 1053 Path of Equal Weight

Given a non-empty tree with root R, and with weight Wi assigned to each tree nod...

1085
来自专栏腾讯数据库技术

如何利用红黑树实现排名?

1823
来自专栏前端儿

重建二叉树

题目很简单,给你一棵二叉树的后序和中序序列,求出它的前序序列(So easy!)。

1431
来自专栏小怪聊职场

爬虫课程(四)|深度优先和广度优先算法

5504
来自专栏mathor

图的常见算法

 图是由一系列点和边的集合构成的,一般有邻接矩阵和邻接表两种表示方式,c/c++可以看我的这篇文章:搜索(1)  这篇文章主要讲java语言中图的相关算法。首...

1032
来自专栏小樱的经验随笔

约瑟夫问题方法总结

n个人围成一个圈,每个人分别标注为1、2、...、n,要求从1号从1开始报数,报到k的人出圈,接着下一个人又从1开始报数,如此循环,直到只剩最后一个人时,该人即...

3258

扫码关注云+社区