《Redis设计与实现》读书笔记(五) ——Redis中的整数集合

《Redis设计与实现》读书笔记(五) ——Redis中的整数集合

(原创内容,转载请注明来源,谢谢)

一、概述

整数集合(intset)是redis数据结构集合(set)的底层实现之一,如果set中只包含整数元素,且元素个数不多时,redis会使用整数集合作为set的底层实现。

二、整数集合实现

整数集合是redis保存整数值集合的底层实现,可以保存int16_t、int32_t、int64_t的整数值,且集合中每个值都不一样。结构如下:

typedef struct         intset{
uint32_t encoding;
uint32_t length;
int8_t contents[];
}intset;

其中,encoding是编码方式,length是集合的元素个数,contents是保存集合中的元素,每个元素在contents数组中,从小到大排列。

contents虽然被定义是int8_t类型,但是实际是根据encoding进行确认。如果encoding是INTSET_ENC_INT16,则contents里面每一个元素都是int16_t类型(值在-32768~32767);如果是INTSET_ENC_INT32,则contents里面每一个元素都是int32_t类型(值在-2^32~2^32-1);如果encoding是INTSET_ENC_INT64,则contents里面每一个元素都是int64_t类型(值在-2^64~2^64-1)。

包含五个整数元素的整数集合如下图所示:

该contents占底层空间大小是16*5=80字节。

三、整数集合升级

1、升级过程

当要将一个新元素添加到contents里面,而该元素的类型比contents现有的元素长时,则redis会对contents进行升级(upgrade)。升级过程如下:

1)根据新元素的类型,扩展contents底层空间大小,并为新元素分配空间(但还没将元素添加进数组)。

2)将底层现有元素都转换成新类型,转换后继续放在原位置上,保持大小顺序不变。

3)将新元素添加到底层数组,并且将intset的length值加1,修改encoding的值为新的数据类型。

由于新元素加入后,导致类型需要扩充,说明这个新元素,要么比现有最大的元素大,要么比现有最小的元素小,即新元素的索引要么是0,要么是length-1。

因此,底层数组元素转换后,迁移位置的过程是:

1)如果新元素最大,则转换过程是将现有最大的元素转换到最后新增的位置前面的位置(最后的位置留给新元素),然后次大的数据转换,以此类推。

2)如果新元素最小,则转换过程是将现有最大的元素转换到最后新增的位置,然后次大的转换,直到原contents最小的元素转换后,第一个位置留给新元素。

2、升级的优势

升级的主要优势是提升灵活性、节约内存。

1)灵活性

C语言是静态语言,redis由C语言实现,因此为了避免错误,不会将不同的类型放到一个数据结构里面。因此,redis的自动升级,使得可以放置不同类型的整数,而不会报错。

2)节约内存

当有需要的时候才升级,而不是默认都用int64_t类型,则节约了内存。

3、不支持降级

redis不支持降级,因此一旦升级后,即使后来大类型的元素被删除,仍会保持原来的状态。例如已经升级到int64_t,后面集合的所有int64_t的元素都被删除,只剩下int32_t的元素,contents的编码仍将采用int64_t。

——written by linhxx 2017.08.30

原文发布于微信公众号 - 决胜机器学习(phpthinker)

原文发表时间:2017-08-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Crossin的编程教室

【Python 第69课】函数的参数传递(3)

今天来说说最为灵活的一种参数传递方式: func(**kargs) 上次说的 func(*args) 方式是把参数作为 tuple 传入函数内部。而 func(...

2413
来自专栏青玉伏案

iOS开发之SQLite-C语言接口规范(二) —— Prepared Your SQL Statements

  在《SQLite的C语言接口规范(一)》中介绍了如何去连接打开数据库,本篇博客就介绍如何操作数据库,本篇主要给出了如何执行数据库查询语句(Select), ...

1896
来自专栏九彩拼盘的叨叨叨

学习纲要:DOM

752
来自专栏达摩兵的技术空间

与我一起学正则

1、校验密码强度 密码的强度必须包含大小写字母和数字的组合,不能使用特殊字符,长度在8-10之间 ^(?=.\d)(?=.[a-z])(?=.*[A-Z])...

603
来自专栏夏时

C语言union关键字

1243
来自专栏个人随笔

JavaScript 网页脚本语言 由浅入深

1)基础 学习目的: 1. 客户端表单验证 2. 页面动态效果 3. jQuery的基础 什么是JavaScript? 一种描述性语言,也是一种基于对象和事件驱...

33410
来自专栏C/C++基础

C++名字空间详解

名字空间(namespace)是由标准C++引入的,是一种新的作用域级别。原来C++标识符的作用域分为三级:代码块({…}和函数体)、类域和全局作用域。如今,在...

401
来自专栏Go入门系列

Golang 入门系列(三)Go语言基础知识汇总

前面已经了 Go 环境的配置和初学Go时,容易遇到的坑,大家可以请查看前面的文章 https://www.cnblogs.com/zhangweizhong/c...

422
来自专栏互联网杂技

详解JavaScript变量、作用域及内存

基本类型值有:undefined,NUll,Boolean,Number和String,这些类型分别在内存中占有固定的大小空间,他们的值保存在栈空间,我们通过按...

3498
来自专栏星回的实验室

js重修课[二]:表达式和运算符

631

扫描关注云+社区