《Redis设计与实现》读书笔记(五) ——Redis中的整数集合

《Redis设计与实现》读书笔记(五) ——Redis中的整数集合

(原创内容,转载请注明来源,谢谢)

一、概述

整数集合(intset)是redis数据结构集合(set)的底层实现之一,如果set中只包含整数元素,且元素个数不多时,redis会使用整数集合作为set的底层实现。

二、整数集合实现

整数集合是redis保存整数值集合的底层实现,可以保存int16_t、int32_t、int64_t的整数值,且集合中每个值都不一样。结构如下:

typedef struct         intset{
uint32_t encoding;
uint32_t length;
int8_t contents[];
}intset;

其中,encoding是编码方式,length是集合的元素个数,contents是保存集合中的元素,每个元素在contents数组中,从小到大排列。

contents虽然被定义是int8_t类型,但是实际是根据encoding进行确认。如果encoding是INTSET_ENC_INT16,则contents里面每一个元素都是int16_t类型(值在-32768~32767);如果是INTSET_ENC_INT32,则contents里面每一个元素都是int32_t类型(值在-2^32~2^32-1);如果encoding是INTSET_ENC_INT64,则contents里面每一个元素都是int64_t类型(值在-2^64~2^64-1)。

包含五个整数元素的整数集合如下图所示:

该contents占底层空间大小是16*5=80字节。

三、整数集合升级

1、升级过程

当要将一个新元素添加到contents里面,而该元素的类型比contents现有的元素长时,则redis会对contents进行升级(upgrade)。升级过程如下:

1)根据新元素的类型,扩展contents底层空间大小,并为新元素分配空间(但还没将元素添加进数组)。

2)将底层现有元素都转换成新类型,转换后继续放在原位置上,保持大小顺序不变。

3)将新元素添加到底层数组,并且将intset的length值加1,修改encoding的值为新的数据类型。

由于新元素加入后,导致类型需要扩充,说明这个新元素,要么比现有最大的元素大,要么比现有最小的元素小,即新元素的索引要么是0,要么是length-1。

因此,底层数组元素转换后,迁移位置的过程是:

1)如果新元素最大,则转换过程是将现有最大的元素转换到最后新增的位置前面的位置(最后的位置留给新元素),然后次大的数据转换,以此类推。

2)如果新元素最小,则转换过程是将现有最大的元素转换到最后新增的位置,然后次大的转换,直到原contents最小的元素转换后,第一个位置留给新元素。

2、升级的优势

升级的主要优势是提升灵活性、节约内存。

1)灵活性

C语言是静态语言,redis由C语言实现,因此为了避免错误,不会将不同的类型放到一个数据结构里面。因此,redis的自动升级,使得可以放置不同类型的整数,而不会报错。

2)节约内存

当有需要的时候才升级,而不是默认都用int64_t类型,则节约了内存。

3、不支持降级

redis不支持降级,因此一旦升级后,即使后来大类型的元素被删除,仍会保持原来的状态。例如已经升级到int64_t,后面集合的所有int64_t的元素都被删除,只剩下int32_t的元素,contents的编码仍将采用int64_t。

——written by linhxx 2017.08.30

原文发布于微信公众号 - 决胜机器学习(phpthinker)

原文发表时间:2017-08-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏前端儿

大小写互换

  现在给出了一个只包含大小写字母的字符串,不含空格和换行,要求把其中的大写换成小写,小写换成大写,然后输出互换后的字符串。

1062
来自专栏java小白

LinkedHashMap的accessOrder

1829
来自专栏HTML5学堂

PHP入门-常量基本规则

PHP入门-常量基本规则 HTML5学堂:本文是PHP的入门用文章,主要介绍PHP的常量的基本规则以及定义和获取方法。 前几天把PHP的基本语法以及变量的基本规...

37015
来自专栏python读书笔记

《算法图解》NOTE 2 数组、链表及选择排序1.数组2.链表3.选择排序法

1333
来自专栏流媒体

C++ string

812
来自专栏史上最简单的Spring Cloud教程

Java 代理模式

什么是代理 代理是一种设计模式,它的核心思想,是将对目标的访问转移到代理对象上。这样做的好处就是,目标对象在不改变代码的情况下,可以通过代理对象加一些额外的功能...

2068
来自专栏C语言及其他语言

[蓝桥杯]字符逆序

题目描述 将一个字符串str的内容颠倒过来,并输出。str的长度不超过100个字符。 输入 输入包括一行。 第一行输入的字符串。 输出 输出转换好的逆序字符串。...

3435
来自专栏风中追风

try,finally中都有return时程序的执行顺序

 在Java中当try、finally语句中包含return语句时,执行情况到底是怎样的,finally中的代码是否执行,大家各有各的说法,刚好今天有个朋友问了...

36315
来自专栏大闲人柴毛毛

Redis源码分析(四)——Redis数据结构-整数集合

1. 整数集合特点 有序:集合中所有值按照从小到大顺序排列。 不重复 可以存储int16_t、int32_t、int64_t三种类型的整数 1. 数据结构 t...

3767
来自专栏nummy

python双端队列deque

由于deque是一种序列容器,因此同样支持list的一些操作,如用getitem()检查内容,确定长度,以及通过匹配标识从序列中间删除元素。

682

扫码关注云+社区