浅谈CAS在分布式ID生成方案上的应用 | 架构师之路

近几篇文章聊CAS被骂得较多,今天还是聊CAS,谈谈CAS在一种“分布式ID生成方案”上的应用。

所谓“分布式ID生成方案”,是指在分布式环境下,生成全局唯一ID的方法。

可以利用DB自增键(auto inc id)来生成全局唯一ID,插入一条记录,生成一个ID:

这个方案利用了数据库的单点特性,其优点为:

  • 无需写额外代码
  • 全局唯一
  • 绝对递增
  • 递增ID的步长确定

其不足为:

  • 需要做数据库HA,保证生成ID的高可用
  • 数据库中记录数较多
  • 生成ID的性能,取决于数据库插入性能

优化方案为:

  • 利用双主保证高可用
  • 定期删除数据
  • 增加一层服务,采用批量生成的方式降低数据库的写压力,提升整体性能

增加服务后,DB中只需保存当前最大的ID即可,在服务启动初始化的过程中,首先拉取当前的max-id:

select max_id from T;

然后批量获取一批ID,放到id-servcie内存里,并将max-id写回数据库:

update T set max_id=200;

这样,id-service就拿到了[100, 200]这一批ID,上游在获取ID时,不用每次都插入数据库,而是分配完100个ID后,再修改max-id的值,这样分配ID的整体性能就增加了100倍。

这个方案的优点:

  • 数据库只保存一条记录
  • 性能极大增强

其不足为:

  • 如果id-service重启,可能内存会有一段已经申请的ID没有分配出去,导致ID空洞,当然,这不是一个严重的问题
  • 服务没有做HA,无法保证高可用

优化方案为:

  • 冗余服务,做集群保证高可用

冗余了服务后,多个服务在启动过程中,进行ID批量申请时,可能由于并发导致数据不一致:

select max_id from T;

如上图所示,两个id-service在启动的过程中,同时拿到了max-id为100。

两个id-service同时对数据库的max-id进行写回:

update T set max_id=200;

写回max-id成功后,这两个id-service都以为自己拿到了[100,200]这一批ID,导致集群会生成重复的ID。

问题发生的原因,是并发写回时,没有对max-id的初始值进行比对

id-service1写回max-id=200成功的条件是,max-id必须等于100

id-service2写回max-id=200成功的条件是,max-id也必须等于100

id-service1写回时,max-id是100,理应写回成功

id-service2写回时,max-id已经被改成了200,不应该写回成功

只要实施CAS乐观锁,在写回时对max-id的初始条件进行比对,就能避免数据的不一致,写回SQL由:

update T set max_id=200;

升级为:

update T set max_id=200 where max_id=100;

这样,id-service2写回时,就会失败:

失败后,id-service2要再次查询max-id:

此时max-id已经变为200,于是id-service2获取到了[200, 300]这一批ID,并将max-id=300写回:

update t set max_id=300 where max_id=200;

写回成功。

这种方案的好处是:

  • 能够通过水平扩展的方式,达到分布式ID生成服务的无限性能
  • 使用CAS简洁的保证不会生成重复的ID

其不足为:

  • 由于有多个service,生成的ID 不是绝对递增的,而是趋势递增

本文介绍了CAS在分布式ID生成方案上的一种应用,更多的分布式ID生成方案,请参考《细聊分布式ID生成器架构》。

原文发布于微信公众号 - 架构师之路(road5858)

原文发表时间:2017-06-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏赵俊的Java专栏

Python 文件操作

29530
来自专栏LuckQI

Java多线程总结三

8520
来自专栏散尽浮华

nginx负载均衡(5种方式)、rewrite重写规则及多server反代配置梳理

Nginx除了可以用作web服务器外,他还可以用来做高性能的反向代理服务器,它能提供稳定高效的负载均衡解决方案。nginx可以用轮询、IP哈希、URL哈希等方式...

82460
来自专栏SDNLAB

ODL碳版本模块开发及流程梳理

文章主要基于ODL碳版本,进行简单插件的构建、安装、部署,以一个插件开发为例,介绍ODL新版本开发过程中的一些具体问题。 ? 一、碳版本简易开发流程 1.1 开...

55780
来自专栏程序员宝库

让你的 git 拥有不同身份

由于你没有进行过特别的设定,所以 git不管它是往 github上传还是往你公司的服务器上传,都会以一个完全相同的身份上传,这有时候会造成困扰,比如说这样: ?...

401140
来自专栏cs

python多线程知识点

Thread是线程类,有两种使用方法,直接传入要运行的方法或从Thread继承并覆盖run(): 构造方法: Thread(group=None, targ...

10920
来自专栏Golang语言社区

终于遇到goroutine死锁的BUG了

今天测试用Go语言写的角色服务器,发现在模拟大量客户端获取角色列表的时候会卡住,但是服务器程序的CPU占用率为零。分析并经过代码检查确认是goroutine死锁...

475150
来自专栏mySoul

Node.js多进程

使用子进程的执行命令,缓存子进程的输出。并将子进程的输出以回调函数参数的形式进行返回

16500
来自专栏程序员宝库

linux 常用指令

1.查看目录下有什么文件信息 ls //list查看当前目录下有什么文件 ls -l或ls ll //list -list 通过详...

32180
来自专栏Android-薛之涛

Android-多线程

        通俗的说:我们平日里打开的QQ,微信,简书,都是一个进程。进程是程序的一次动态执行过程,它需要经历从代码加载,代码执行到执行完毕的一个完整的过程...

10620

扫码关注云+社区

领取腾讯云代金券