闲扯一下redis的三大衍生数据结构

引言

说起的数据结构,大家可能对五大基础数据类型比较熟悉:,,,,。那么除此之外,还有三大衍生数据结构,大家平时是很少接触的,即:、、

另外,我觉得,这三个数据结构,只能说是锦上添花。真正在项目中,我还真没用过。

下面大家来看看这三大数据结构的定义用途

bitmaps

定义

说到这个,其实它就是,但它可以对的位进行操作。然后呢,这个位操作,有自己的命令,所以和操作的命令又不大一样!

可以这么理解

bitmaps为一个以位为单位的数组,数组的每个单元只能存储0和1

下面举个例子,比如我们要做一个set操作,为,为,那么执行如下命令

那么的ASCII为

接下来,你可以用位命令命令取出,取出每一位的内容。

用途

网上传言,此结构用来统计一定时间内的,活跃的用户数,使用的结构比传统的结构省空间。然而,这种用途有很大的局限性,我后文会说到。先说一下,网上的说法。

假设有30个用户,其中有5个用户,在这天登陆了。假设这5个用户的userid=2,4,8,11,12。

那么,我们假设key为,将其值用于记录用户登陆信息。那么为了记录上述5个用户登陆过,我们将该值的第2位,第4位,第8位,第11位,第12位设为1,即执行下述命令

这个时候,比如你要判断userid=11的用户,在2018-10-04这天,有没有登陆过,就执行下述命令

结果为1,就代表用户登陆过。如果返回结果为0,则代表用户没登陆过。

如果要统计,2018-10-04,这一天登陆的用户数,可以执行下面的命令

上面的命令就可以统计出,2018-10-04,这一天5个用户登陆过。

ok,到这里大家就查不多能明白了。

先说一下,这里的,可以理解为偏移量。比如实际项目中的userid位1000002,那么偏移量就是2。大家在项目中,可以灵活变通。

然而这种方式有一个局限性。我们在实际项目中,如果userid是使用uuid生成的,那么,你要如何根据这些userid生成偏移量?莫非你还要去找一个hash函数,生成偏移量?就算找到了相应的hash函数,你能确保一定不发生hash碰撞,导致偏移量一致?

所以,大家了解即可。

HyperLogLog

定义

并不是一种数据结构,而是一种算法,可以利用极小的内存空间完成独立总数的统计

其实,大家可能对该算法比较陌生。我们中有一个库叫,其中也实现了算法。我大概说一下该算法的原理,我不想去长篇大论的搬出数学论文来,大家看着也无聊,这里指的是超级的意思,它的前世是LogLog算法。这里博主蜻蜓点水的装13一下,大家能领悟到精髓即可。

假设有如下对话

我:"小曲啊,假设啊,我一轮丢5次硬币,丢了很多轮之后,发现这几轮中,最多出现连续的2次反面1次正面,你能猜出来我丢了多少轮么!"

小曲:"应该没几轮吧,顶多就七八轮。"

我:"卧槽,这么机智,怎么算的?"

小曲:"很简单啊,正反面概率都是1/2,连着二次反面,一次正面。不就是1/2*1/2*1/2=1/8么!"

我:"那要是最多出现连续的4次反面1次正面呢?"

小曲:"那应该是很多很多轮吧!"

我:"果然机智!"

上述聊天,出自我和同事曲之间的,日常互吹!如有雷同,纯属巧合!

好了,原理讲完了!只是他的估算算法比较复杂!没这么简单而已!而且这么估,误差还比较大!下面给出算法的伪代码。

需要说明的是

就是把你的输入元素,映射成二进制长串。映射成二进制长串后,就可以类比到我最先说的抛硬币的结果了。至于最后的结果为什么用,大家可以去查文献。毕竟这文章是在讲,不是在讲这个算法。而且这个算法,后面还经过了一系列演进,比如将入参集合分为m个部分,然后将个部分的结果求一个平均数,最后以2的次幂,来估计独立总数!这些读者有兴趣可以自行查询!

用途

这个结构可以非常省内存的去统计各种计数,比如注册数、每日访问数。当然,存在误差!Redis官方给出的数字是0.81%的失误率。

用法也很简单如下所示

上面就是演示了,2018-10-04这天,约4个ip登陆了系统!

网上有一张和传统集合结构的占用空间对比图,贴出来,给大家看看

注意了,再强调一次,使用此结构是存在误差的!比如你了一百万条数据进去,结果的结果可能就999756条!

Geo

定义

Geo可以用于存储经纬度、计算两地之间的距离、范围计算等。其底层实现是zset。

用途

主要有以下六组命令

:增加某个地理位置的坐标。

:获取某个地理位置的坐标。

:获取两个地理位置的距离。

:根据给定地理位置坐标获取指定范围内的地理位置集合。

:根据给定地理位置获取指定范围内的地理位置集合

:获取某个地理位置的geohash值。

我这里直接贴官网文档的例子,大家有兴趣可以自行查询.

首先,先给key增加两个坐标

其次,计算两个坐标之间的举例

最后,计算距离经纬度距离和范围内的坐标有哪些

总结,我目前还没涉及到和地图有关的业务,因此该结构用的还比较少。大家根据项目具体需求使用即可!

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181031G12LIQ00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券