专栏首页决胜机器学习《Redis设计与实现》读书笔记(九) ——Redis集合和有序集合实现原理

《Redis设计与实现》读书笔记(九) ——Redis集合和有序集合实现原理

《Redis设计与实现》读书笔记(九) ——Redis集合和有序集合实现原理

(原创内容,转载请注明来源,谢谢)

一、集合

集合的编码方式有intset和hashtable两种。

1、intset

intset是整数集合,集合使用此方式时,集合内的所有对象都保存在整数集合中。如下图所示:

2、hashtable

hashtable是字典,集合使用此方式时,集合内的所有对象都保存在字典的键中,值设置成null。每个对象保存在一个键中。

如下图所示:

3、编码实现条件

由于整数集合的效率比字典高,但是整数集合有一定的要求,如下:

1)集合内所有的元素必须是整数。

2)集合内元素个数不超过512个,512个这个数字是通过redis配置文件中的set-max-intset-entries属性进行配置的,默认是512个。

不满足以上两个任意条件的集合,则采用hashtable进行编码。

原先采用intset的集合,操作期间加入非整数或者元素个数超过512个,则redis会将其转换为hashtable编码方式。

4、集合命令实现

二、有序集合

有序集合的编码有ziplist和skiplist两种。

1、ziplist

ziplist是压缩列表,有序集合的每个集合元素使用两个连续的节点保存,前者保存节点具体内容,后者保存节点的score。

在压缩列表内,按照分数从小到大进行排序,分值较小的靠近表头,分值大的靠近表尾。

总体结构如下图所示:

压缩列表内部如下图所示:

2、skiplist

skiplist是跳跃表,redis中该结构专门为有序集合设计的,其他数据类型没有使用到该数据结构。

有序集合使用skiplist时,同时使用到字典。结构如下:

typedef structzset{
zskiplist *zsl;
dict *dict;
}zset;

总结构图如下:

1)跳跃表zsl

有序集合中,zsl按照分值从小到大保存集合所有元素,每个跳跃表节点都保存一个集合的元素:跳跃表节点的object属性保存了有序集合的成员,而score属性保存了有序集合的score。

通过zsl,可以对有序集合进行一些范围操作,包括zrank、zrange等命令就是基于跳跃表的api实现。

2)字典dict

除此之外,dict为有序集合创建了一个从成员到分值的映射,字典里面每个键值对都保存一个集合元素,键保存有序集合的成员,值保存有序集合的score。

通过dict,可以用O(1)的时间复杂度,通过成员找到分值。zscore和其他很多有序集合命令,都是通过集合的api实现。

内部编码结构如下图:

上图中值和分数写了两遍,是为了便于展示。实际上值和分数在skiplist和hashtable都是共享的,通过指针指向,而不是两个值。

3、有序集合skiplist+hashtable编码综述

有序集合每个成员是字符串对象,而分值是浮点数。

虽然有序集合同时使用了跳跃表和字典,但是这两个结构会通过指针的方式,共享有序集合的成员和分值,因此并不会浪费太多的内存空间。

虽然skiplist和hashtable都可以表示有序集合,但是结合在一起使用效率更高。hashtable的特性使得通过成员查找分值的速度极快,O(1);skiplist的特性使得有序集合的成员可以按照顺序排列,在执行范围型操作(如zrange、zrank等)时速度更快。

4、编码使用条件

当元素较少、长度较短时,使用ziplist效率显然更高,而且结构更简单。但是当元素太多、长度太长,使用ziplist的效率就不够高。使用ziplist,需要同时满足以下条件:

1)有序集合元素个数小于128个,通过配置文件的zset-max-ziplist-entries属性配置,默认是128个。

2)有序集合中的所有元素成员长度都小于64字节,通过配置文件的zset-max-ziplist-value属性配置,默认是64字节。

上述任一条件不满足,就会采用skiplist+hashtable的方式对有序集合进行编码。

5、有序集合命令的实现

——written by linhxx 2017.09.01

本文分享自微信公众号 - 决胜机器学习(phpthinker),作者:linhxx

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-09-01

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 《Redis设计与实现》读书笔记(三十三) ——Redis排序命令sort的实现

    《Redis设计与实现》读书笔记(三十三) ——Redis排序命令sort的实现 (原创内容,转载请注明来源,谢谢) 一、基本功能 redis的sort命令,可...

    用户1327360
  • 基于SpringBoot的任务管理平台v1.0正式发布

    基于 SpringBoot 任务管理系统V1.0版正式发布 (原创内容,转载请注明来源,谢谢) 一、基本内容 经过近半个月以来学习springboot,完成了...

    用户1327360
  • 机器学习(七) ——logistic回归

    机器学习(七)——logistic回归 (原创内容,转载请注明来源,谢谢) 一、概述 1、基本概念 logistic回归(logisticre...

    用户1327360
  • 4.93Python数据类型之(8)集合

    py3study
  • 教程 | Python集合与集合运算

    了解 Python 集合: 它们是什么,如何创建它们,何时使用它们,什么是内置函数,以及它们与集合论操作的关系

    昱良
  • 入门 | 一文带你了解Python集合与基本的集合运算

    了解 Python 集合: 它们是什么,如何创建它们,何时使用它们,什么是内置函数,以及它们与集合论操作的关系

    机器之心
  • 一文掌握Python集合的语法与应用

    Python语言中的集合是无序的、可变的容器类对象,所有元素放在一对大括号中,元素之间使用逗号分隔,同一个集合内的每个元素都是唯一的,不允许重复。

    Python小屋屋主
  • Java SE | 每日作业卷day15

    自定义一个学生类,给出成员变量name和age,使用HashSet集合存储自定义对象并遍历,遍历集合的时候,在控制台输出学生对象的成员变量值。要求使用两种方式进...

    剑走天涯
  • 入门 | 一文带你了解Python集合与基本的集合运算

    了解 Python 集合: 它们是什么,如何创建它们,何时使用它们,什么是内置函数,以及它们与集合论操作的关系

    CDA数据分析师
  • [ Java学习基础 ] Java的对象容器 -- 集合

    Kevin_Zhang

扫码关注云+社区

领取腾讯云代金券