前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >一文搞定现网项目最新版本Redis7集群800节点实践案例总结

一文搞定现网项目最新版本Redis7集群800节点实践案例总结

作者头像
用户9421738
发布2024-08-01 12:40:12
1100
发布2024-08-01 12:40:12
举报
文章被收录于专栏:大数据从业者

概述

截至目前本人接触到的最大Redis7集群节点规模已达800+,Redis官方宣称最大集群节点规模可达1000。本文以最小规模集群为例,进行完整的项目实践总结记录。欢迎关注微信公众号:大数据从业者

Redis是一种基于内存的数据存储,已经被数百万开发人员用于缓存、向量数据库、文档数据库、流媒体引擎和消息队列等场景。Redis具有主从复制协议和不同级别的磁盘持久性机制。Redis支持复杂的数据类型(如:字符串、哈希、列表、集合、排序集合和JSON),并在这些数据类型上定义了原子操作。

Redis安装支持多种操作系统、多种安装方式,如下:

说明:RedisStack基于Redis进行扩展整合RediSearch、RedisJSON、RedisTimeSeries 和 RedisBloom等,启动脚本如下:

而RedisInsight用于可视化Redis或Redis Stack中的数据,如下图所示:

Redis官方并没有提供界面化向导安装方式,我这里使用源码编译安装。

源码安装

Redis版本选择最新的7.0.15,相关release notes,感兴趣请自行阅读:

代码语言:javascript
复制
https://raw.githubusercontent.com/redis/redis/7.0/00-RELEASENOTES

下载源码

代码语言:javascript
复制
wget https://download.redis.io/releases/redis-7.0.15.tar.gz
tar -xvf redis-7.0.15.tar.gz && redis-7.0.15

编译安装

代码语言:javascript
复制
make -j 8
make install PREFIX=/home/myHadoopCluster/redis7
代码语言:javascript
复制
cp redis.conf /home/myHadoopCluster/redis7/
ln -s /home/myHadoopCluster/redis7/bin/redis-cli /usr/bin/redis-cli
ln -s /home/myHadoopCluster/redis7/bin/redis-server /usr/bin/redis-server

集群部署

主机

felixzh

felixzh1

felixzh2

端口1

6378

6378

6378

端口2

6379

6379

6379

cp redis.conf redis6378.conf

redis6378.conf配置如下:

代码语言:javascript
复制
cluster-enabled yes
cluster-config-file /home/myHadoopCluster/redis7/nodes6378.conf
bind 0.0.0.0
protected-mode no
port 6378
daemonize yes
pidfile /var/run/redis_6378.pid
logfile /var/log/redis/redis_6378.log
dbfilename dump6378.rdb    
appendonly yes
appendfilename appendonly6378.aof

cp redis6378.conf redis6379.conf

redis6379.conf配置如下:

代码语言:javascript
复制
sed -i 's/6378/6379/' redis6379.conf                  

创建必要的目录,如mkdir /var/log/redis

分发/home/myHadoopCluster/redis7到所有集群节点

启动所有集群节点的Redis实例

代码语言:javascript
复制
[root@felixzh redis7]# redis-server redis6378.conf && redis-server redis6379.conf
[root@felixzh1 redis7]# redis-server redis6378.conf && redis-server redis6379.conf
[root@felixzh2 redis7]# redis-server redis6378.conf && redis-server redis6379.conf             

如果需要停止单节点Redis实例,如下:

代码语言:javascript
复制
ps -ef|grep redis-server|grep -v grep|awk '{print $2}' |xargs kill -9              

创建Redis集群

代码语言:javascript
复制
[root@felixzh redis7]# redis-cli --cluster create ip1:6378 ip1:6379 ip2:6378 ip2:6379 ip3:6378 ip3:6379 --cluster-replicas 1

查看集群状态

代码语言:javascript
复制
[root@felixzh redis7]# redis-cli -h felixzh -p 6378 cluster info

如上图,集群状态正常,集群实例数为6,集群节点数为3。

界面化工具

考虑到License限制,我们内部自研界面化管理平台。开源项目众多,需要的话,可以自行部署,比如RedisInsight等等。

数据备份迁移

Redis官方提供备份工具cluster backup,可以直接使用。而数据迁移可以使用redis-shake,支持离线迁移和在线迁移、同构集群和异构集群。

Redis-shake文档见:

代码语言:javascript
复制
https://tair-opensource.github.io/RedisShake/zh/guide/introduction.html

Redis-shake源码编译,如下:

代码语言:javascript
复制
git clone https://github.com/alibaba/RedisShake
cd RedisShake
sh build.sh       

实践案例如下:

1.生成测试数据

批量生成10万测试数据到redis1集群

代码语言:javascript
复制
[root@felixzh redis7]# cat batchSet.sh
#!/bin/sh
for((i=0;i<100000;i++))
do
   echo "value" |redis-cli -c -h felixzh -p 6379 -x set key$i
done

通过UI工具查看集群中Key数量为10万,如下:

2.使用cluster backup备份redis1数据

代码语言:javascript
复制
[root@felixzh redis7]# mkdir rdbback
[root@felixzh redis7]# redis-cli --cluster backup:6378 ./rdbback/

上述命令会触发所有master进行bgsave,并将相应rdb拷贝到当前节点指定目录,如下图所示:

3.离线迁移

将上述备份数据rdb迁移到新集群(redis2)

代码语言:javascript
复制
cd RedisShake/bin
cp shake.toml shake-rdb.toml

编辑shake-rdb.toml,设置rdb_reader节点和redis_writer节点

开始rdb数据迁移

代码语言:javascript
复制
./redis-shake shake-rdb.toml

由于rdb_reader节点filepath只能配置一个文件全路径,需要执行n=rdb个数次!!离线迁移完成,通过UI查看redis2集群key数量,如下:

4.在线迁移

先清空redis2集群所有数据

代码语言:javascript
复制
redis-cli --cluster call felixzh:6380 flushall
cp shake.toml shake-sync.toml

编辑shake-sync.toml,设置sync_reader节点和redis_writer节点

开始在线数据迁移

代码语言:javascript
复制
./redis-shake shake-sync.toml

在线数据迁移默认先同步全量数据(rdb)、再同步增量数据(aof),那么怎么判断同步数据的一致性呢?

方法1:上图日志可以观察到diff为0,表示没有数据同步了。

方法2:对比源端与目的端Key数量是否相等,如果相等,认为一致。

不过,如果Key带有过期时间,会导致Key数量不一致。原因:

因为过期算法限制,源端中可能存在一些 Key 已经过期但实际上没有被删除,这批 Key 在目的端可能会被删除,导致目的端 Key 数量少于源端。

源端和目的端独立运行,各自的过期算法独立运行,过期算法具有随机性,会导致源端和目的端删除的 Key 不一致,导致 Key 数量不一致。

在实践中,带有过期时间的 Key 一般认为是允许不一致的,不会影响业务,所以可以仅校验不带有过期时间的 Key 数量是否一致。如下所示,应当分别计算源端和目的端的 keys-expires 的值是否一样。

代码语言:javascript
复制
127.0.0.1:6379> info keyspace
# Keyspace
db0:keys=4463175,expires=2,avg_ttl=333486

常用命令

1.查看集群状态

代码语言:javascript
复制
redis-cli -c -h felixzh -p 6378 CLUSTER INFO

2.查看集群节点

代码语言:javascript
复制
redis-cli -c -h felixzh -p 6378 CLUSTER NODES    

3.查看key所属slot

代码语言:javascript
复制
redis-cli -c -h felixzh -p 6378 CLUSTER KEYSLOT 1    

4.查看所有keys

代码语言:javascript
复制
redis-cli --cluster call felixzh:6378  dbsize
redis-cli --cluster call felixzh:6380 keys \*       

5.查看key数据类型

代码语言:javascript
复制
redis-cli -c -h felixzh -p 6378 type key90888

6.查看key过期时间(ttl:s,pttl:ms)

代码语言:javascript
复制
redis-cli -c -h felixzh -p 6378 ttl key90888
redis-cli -c -h felixzh -p 6378 pttl key90888         

7.设置key过期时间(s)

代码语言:javascript
复制
redis-cli -c -h felixzh -p 6378 expire key90888 60

8.取消key过期设置

代码语言:javascript
复制
redis-cli -c -h felixzh -p 6378 persist key90888

9.查看key占用内存(byte)

代码语言:javascript
复制
redis-cli -c -h felixzh -p 6378 memory usage key90888

10.查看集群类型命令帮助

代码语言:javascript
复制
redis-cli --cluster help

11.创建集群

代码语言:javascript
复制
redis-cli --cluster create ip1:7001 ip1:7002 --cluster-replicas 0

12.检查集群

代码语言:javascript
复制
redis-cli --cluster check ip1:7001    

13.查看集群信息

代码语言:javascript
复制
redis-cli --cluster info ip1:7001  

14.修复集群

代码语言:javascript
复制
redis-cli --cluster fix ip1:7001
可选参数:
   --cluster-search-multiple-owners :是否修复多个拥有者的槽位。当集群中的槽位在迁移过程中,出现意外时,可使用该参数。一般情况下,默认即可。
   --cluster-fix-with-unreachable-masters :是否修复不可达的主节点上的槽位。例如,集群中某个主节点就是坏掉了,也没有故障转移成功。可以使用该参数修复槽位但是之前的数据会丢失,慎用!

15. 迁移槽位

代码语言:javascript
复制
redis-cli --cluster  reshard  host:port
       --cluster-from                #源节点node id列表,逗号分隔或all代表所有节点
       --cluster-to                  #目的节点node id,仅支持一个
       --cluster-slots                #所有源节点迁移槽位总个数
       --cluster-yes          #默认集群内部迁移计划
       --cluster-timeout                #迁移超时时间,ms
       --cluster-pipeline               #迁移key时,批次大小,默认10
       --cluster-replace           #是否直接replace到目标节点

功能:迁移一个或多个源节点上的槽位至一个目标节点上。示例如下:

代码语言:javascript
复制
redis-cli --cluster reshard felixzh:6380 --cluster-from 33359014f3ec0e634dbda6586ff43c76a5bff284,b36cb6e55905b3304b2f700987d05b985ece6fff --cluster-slots 10 --cluster-replace --cluster-to 278fd94ac15642c43484faac903d7fe9b4114292 --cluster-yes        

16.集群均衡

代码语言:javascript
复制
redis-cli --cluster rebalance host:port
    --cluster-weight      
    --cluster-use-empty-masters
    --cluster-timeout                  #超时时间,ms
    --cluster-simulate      #模拟再平衡过程而不会实际执行,方便测试评估
    --cluster-pipeline                 #迁移key批次个数,默认值10
    --cluster-threshold             
    --cluster-replace          #是否直接replace到目标节点
说明:    
--cluster-weight:node id权重(浮点型),如node1=1.0,node2=1.0,node3=2.0表示总权重为4.0,node1与node2将分配到 (16384*1/4) 个槽位,node3是(16384*2/4)个槽位。
 --cluster-threshold: 平衡触发阈值条件,默认2.00%。如node1该有4096个槽位,但是现在不够且缺少个数超过 (4096*0.02 )则会触发自平衡。 

17.集群扩容

代码语言:javascript
复制
redis-cli --cluster add-node newHost:newPort #待加入的节点
       host:port  #集群任意节点
       --cluster-salve #新节点为salve,默认随机master    
       --cluster-master-id             #不随机master,可以指定master

增加master:
redis-cli --cluster add-node 10.121.198.220:6381 10.121.198.220:6380
增加slave:
redis-cli --cluster add-node 10.121.198.220:6381 10.121.198.220:6380 --cluster-slave

18.集群缩容

代码语言:javascript
复制
redis-cli --cluster del-node host:port  #集群任意节点 node_id  #待删除节点

注意:如果删除master,需要先使用reshard将node_id上的槽位迁移到别的master

19.集群范围命令

代码语言:javascript
复制
redis-cli --cluster call host:port command arg arg .. arg   #集群所有节点执行命令集合

       --cluster-only-masters      #只master执行

       --cluster-only-replicas      #只slave执行

如:redis-cli --cluster call felixzh:6380 keys \*

20.集群超时时间

代码语言:javascript
复制
redis-cli --cluster set-timeout host:port  ms    

21.非集群Redis实例导入到集群

代码语言:javascript
复制
redis-cli --cluster import srcIP:port --cluster-from dstIP:port --cluster-copy
The source node should not be a cluster node.
不常用,建议使用redis-shake工具。

22.集群数据备份

代码语言:javascript
复制
redis-cli --cluster host:port backupPath
功能:将所有master rdb备份到当前主机的backupPath

Redis数据类型

数据类型及每种数据类型支持的命令类型,详见见官方文档:

代码语言:javascript
复制
https://redis.io/docs/latest/develop/data-types/
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-07-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据从业者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 概述
  • 源码安装
  • 集群部署
  • 界面化工具
  • 数据备份迁移
  • 常用命令
  • Redis数据类型
相关产品与服务
云数据库 Redis
腾讯云数据库 Redis(TencentDB for Redis)是腾讯云打造的兼容 Redis 协议的缓存和存储服务。丰富的数据结构能帮助您完成不同类型的业务场景开发。支持主从热备,提供自动容灾切换、数据备份、故障迁移、实例监控、在线扩容、数据回档等全套的数据库服务。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档