前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据库 ID 生成方案:雪花算法

数据库 ID 生成方案:雪花算法

作者头像
happyJared
发布2019-12-02 21:39:06
1.3K0
发布2019-12-02 21:39:06
举报
文章被收录于专栏:happyJared

今天介绍的雪花算法:Snowflake,可以让负责生成分布式 ID 的每台机器在每毫秒内生成不一样的 ID。Snowflake 是 Twitter 开源的分布式 ID 生成算法,它不依赖数据库。

核心思想是:分布式 ID 固定是一个 long 型的数字,一个 long 型占8个字节,也就是64个bit,原始 Snowflake 算法中对于 bit 的分配如下图:

雪花算法

  • 第1个 bit 位是标识部分,在 java 中由于 long 的最高位是符号位,正数是0,负数是1,一般生成的 ID 为正数,所以固定为0;
  • 时间戳部分占41 bit,这个是毫秒级的时间,一般实现上不会存储当前的时间戳,而是时间戳的差值(当前时间-固定的开始时间),这样可以使产生的ID从更小值开始;41位的时间戳可以使用69年,(1L << 41) / (1000L * 60 * 60 * 24 * 365) = 69年;
  • 工作机器id占10 bit,这里比较灵活,比如,可以使用前5位作为数据中心机房标识,后5位作为单机房机器标识,算下来可以部署1024个节点;
  • 序列号部分占12 bit,支持同一毫秒内同一个节点可以生成4096个 ID

根据这个算法的逻辑,只需要将这个算法用编程语言实现出来,封装为一个工具方法,那么各个业务应用可以直接使用该工具方法来获取分布式 ID,我们只需保证每个业务应用有自己的工作机器 ID 即可,而不需要单独去搭建获取分布式 ID 的应用。

Snowflake 算法实现起来并不难,这里提供一个 Github 上的 Java 实现版本:SnowFlake

不过国内的很多大厂,其实并没有直接使用 Snowflake 原始算法,多多少少都进行了改造,因为 Snowflake 算法中最难实践的就是工作机器 Id,原始的 Snowflake 算法需要人工去为每台机器指定一个机器 Id 并配置在某个地方,从而让 Snowflake 可以从此处获取机器 Id。但是对于大厂来说,机器是很多的,这样做的人力成本太大,且容易出错,因此才会对 Snowflake 进行改造。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档