前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >技术分享 | 缓存穿透 - Redis Module 之布隆过滤器

技术分享 | 缓存穿透 - Redis Module 之布隆过滤器

作者头像
爱可生开源社区
发布2022-12-21 21:43:08
3290
发布2022-12-21 21:43:08
举报
文章被收录于专栏:爱可生开源社区

作者:贲绍华

爱可生研发中心工程师,负责项目的需求与维护工作。其他身份:柯基铲屎官。

本文来源:原创投稿

*爱可生开源社区出品,原创内容未经授权不得随意使用,转载请联系小编并注明来源。


一、场景案例

假设目前有一后端接口GET /userinfo/100,实际数据库内也只有最大ID为100的用户。

对于请求参数100以内当然属于是合法请求,但对于10000这种来说明显就异常的请求一样会进入数据库中进行查询,白白消耗DB资源,这就是——缓存穿透。

二、缓存知识

为了方便阅读此处直接上脑图

2.1 缓存失效的三个场景
2.2 缓存预热

三、Redis 的内存回收策略

当 Redis 实例的内存到达上限时就会触发对应的回收策略

3.1 作为缓存使用时:
  • allkeys-lru: Keeps most recently used keys; removes least recently used (LRU) keys
  • allkeys-lfu: Keeps frequently used keys; removes least frequently used (LFU) keys
  • volatile-lru: Removes least recently used keys with the expire field set to true.
  • volatile-lfu: Removes least frequently used keys with the expire field set to true.
  • allkeys-random: Randomly removes keys to make space for the new data added.
  • volatile-random: Randomly removes keys with expire field set to true.
  • volatile-ttl: Removes keys with expire field set to true and the shortest remaining time-to-live (TTL) value.
3.2 作为数据库使用,确保数据不能丢失
  • Noeviction(默认策略)对于写请求不再提供服务,直接返回错误(DEL请求和部分特殊请求除外)

四、Redis Module - 布隆过滤器(RedisBloom)

下面回到主题场景,业务侧该如何确认流量中大于100或小于0的userID就是非法请求呢,答案就是——记下来,判断一下。

当然数据库那边也是这么做的,不过执行成本并不一样,在更靠近客户端的部分进行处理则会有更高的收益。布隆过滤器就是一个用来确认一个元素是否存在于集合内的工具。

介绍:

布隆过滤器(Bloom Filter)是1970年由布隆提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。

布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都比一般的算法要好的多,缺点是有一定的误识别率和删除困难。

特性:
  • 布隆过滤器并不是一个精确统计的东西,两个key可能会算得出同样的值。对于业务来说,当返回某个数据存在与过滤器时,这个数据可能不存在与数据库;当返回某个数据不存在时,那么这个数据一定不存在;
  • 布隆过滤器并不能删除元素(布谷鸟过滤器支持)
原理:

插入一个key,通过k次取模算出每次转换后对应的Bit map槽对应的位置,比如“小明“,通过计算后得出其值在1、7两个槽位。则小明={1,7},过滤器标记这两个槽位由0变成1,表示已存在映射。

当判断值是否存在时,如果返回的槽位有为0的,则表示数据不存在。之所以说当某个数据存在与过滤器时,这个数据可能不存在与数据库。是因为哈希会产生碰撞,加入此时”李四“也计算除了李四={1,7}。就会出现这种情况(过滤器存在,数据库不存在)

4.1 Redis Module简介:

Redis提供了一个扩展模块的入口,使用户可以根据需要额外集成一些实用功能。

官网连接:https://redis.io/resources/modules

下边列出一些常见的功能模块

4.2 RedisBloom

仓库地址:https://github.com/RedisBloom/RedisBloom

文档地址:https://redis.io/docs/stack/bloom

RedisBloom同时提供了布隆过滤器与布谷鸟过滤器,适用场景如下:

  • 布隆过滤器:插入性能、可伸缩性较好
  • 布谷鸟过滤器:查询性能较好、允许删除集合中的元素

五、案例说明

前置工作略过(下载、编译、加载、重启 Redis)

代码语言:javascript
复制
# redis-cli
# BF就是bloom filter的意思,此时有一位新用户注册了,则业务调用Redis client向过滤器内增加一个名字为userid的filter,并向它添加一个101的值
127.0.0.1:6379> BF.ADD userid 101
(integer) 1
# EXISTS命令检查是否存在:1表示存在
127.0.0.1:6379> BF.EXISTS userid 101
(integer) 1
# EXISTS命令检查是否存在:0表示不存在
127.0.0.1:6379> BF.EXISTS userid 102
(integer) 0
# 查看对应filter内的使用情况
127.0.0.1:6379> BF.INFO userid
# 预设容量
 1) Capacity
 2) (integer) 100
# 实际大小
 3) Size
 4) (integer) 296
# 过滤器个数
 5) Number of filters
 6) (integer) 1
# 过滤器内的元素个数
 7) Number of items inserted
 8) (integer) 1
# 子过滤器扩容系数(默认 2)
 9) Expansion rate
10) (integer) 2
127.0.0.1:6379>
# 更多使用命令介绍见:https://redis.io/commands/?name=bf

在布隆过滤器中没有任何数据时会导致访问全部被拒绝掉,此时需要用到在2.1提到的【缓存预热】来解决这个问题。

布隆过滤器提供了三个配置项,如下:

配置参数

是否支持动态调整

默认值

说明

ERROR_RATE

0.1

容错比例,值越低需要的空间越大

INITIAL_SIZE

100

默认容量大小

CF_MAX_EXPANSIONS

32

布谷鸟过滤器的默认最大扩展

六、总结

  • 布隆过滤器或布谷鸟过滤器可以用来解决缓存穿透的问题;
  • 需要注意数据同步(如新增用户时需要在过滤器添加用户ID)与缓存预热(空过滤器启动前需要把已有数据先写入Redis实例);
  • Redis Module还有许多非常方便使用的功能模块,可以根据需要灵活配置;

本文关键字:#Redis Module# #缓存穿透#


文章推荐:

OceanBase Proxy 无法连接 OBserver 集群

技术分享 | TiUP工具 - TiDB集群滚动升级核心流程解析

技术分享 | Xtrabackup 不备份 binlog 怎么保证一致性?


关于SQLE

爱可生开源社区的 SQLE 是一款面向数据库使用者和管理者,支持多场景审核,支持标准化上线流程,原生支持 MySQL 审核且数据库类型可扩展的 SQL 审核工具。

SQLE 获取

类型

地址

版本库

https://github.com/actiontech/sqle

文档

https://actiontech.github.io/sqle-docs-cn/

发布信息

https://github.com/actiontech/sqle/releases

数据审核插件开发文档

https://actiontech.github.io/sqle-docs-cn/3.modules/3.7_auditplugin/auditplugin_development.html

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-12-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 爱可生开源社区 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、场景案例
  • 二、缓存知识
    • 2.1 缓存失效的三个场景
      • 2.2 缓存预热
      • 三、Redis 的内存回收策略
        • 3.1 作为缓存使用时:
          • 3.2 作为数据库使用,确保数据不能丢失
          • 四、Redis Module - 布隆过滤器(RedisBloom)
            • 介绍:
              • 特性:
                • 原理:
                  • 4.1 Redis Module简介:
                    • 4.2 RedisBloom
                    • 五、案例说明
                    相关产品与服务
                    云数据库 Redis
                    腾讯云数据库 Redis(TencentDB for Redis)是腾讯云打造的兼容 Redis 协议的缓存和存储服务。丰富的数据结构能帮助您完成不同类型的业务场景开发。支持主从热备,提供自动容灾切换、数据备份、故障迁移、实例监控、在线扩容、数据回档等全套的数据库服务。
                    领券
                    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档