数据库专题(三) ——Mysql ID生成器

数据库专题(三)——Mysql ID生成器

(原创内容,转载请注明来源,谢谢)

注:本文是我对ID生成器的见解,如果有偏差欢迎指正。

一、需求

在数据库中,ID作为记录表每一行数据唯一性的重要元素,其重要性不言而喻。在普通网站的业务场景中,可以使用数据库的自增的方式生成id,则在新增数据的时候不需要定义id,插入数据的过程中数据库自己会生成id。

但是,当网站业务量大,并发量大,如果使用数据库自增的方式,则可能会出现多个请求需要新增数据同时发送给mysql,则会发生异常。

另外,由于数据传输过程中,可以通过fiddler等工具查看发送给后台的post,可以在url上直接看到get请求(即使浏览器加密也可以解密),如果id是订单信息等,如果此时用自增id,则其他竞争对手可以通过查看隔一天、一周或一段时间的id的差,估算出订单数。这样使得不具有保密性。

为了避免上述情况,则需要适当的ID生成器以解决问题。

二、设计方案

1、设计分析

ID生成器需要保证在高并发的情况下,仍然可以实现数据的正确插入,ID仍能保证不重复,且具有保密性。

设计ID生成器需要下列内容:

1)PHP内置函数uniqid()

         stringuniqid ([ string $prefix = "" [, bool $more_entropy = false ]] )

该函数以微秒计算,返回一个基于当前时间微秒数的唯一ID。其中第一个参数是返回结果的前缀,第二个参数如果设置成true,会在返回的字符串结尾增加额外的熵,使得唯一ID更具唯一性。

通常时间有可能存在波动,因此第二个参数要设置成true增加ID的唯一性。

2)PHP加密函数md5()

         stringmd5 ( string $str [, bool $raw_output = false ] )

该函数返回一个加密后的字符串。md5是单向加密,没有办法解密,如果需要破解需要将待测试的字符串也经过md5返回加密结果,进行比对,即只能暴力破解。当进行一系列的变动后,需要破解的成本已经很高,因此md5已经可以满足要求。

当然,也可以使用password_hash、crypt、sha1等其他加密算法。

2、设计内容

1)创建ID生成器类。

2)编写一个生成[0-9a-zA-Z!@#$%^&*()_+-=|/?]共79个字符(也可以根据需要再添加其他的字符,增加随机性)可能性的随机字符串,长度为5(可以自行设定),用于作为uniqid的前缀,进一步避免生成过程中的冲突,且使得破解ID的可能性更低。

3)将uniqid的结果,后面跟上长度为3位的随机字符串。将此值用md5的方式加密。

4)根据业务场景需求,可以将数据库的表设置成16个或更多,因为md5的结果是16进制的值,即0-9a-f,则可以根据首位(或末位、或中间固定的任一位),将结果插入到相应的表中,保证平均将数据插入到各表,以确保每个表的存储量均匀,保证删改查的速度。

5)在表的创建时,也可以采用数据库分区,将表按照id的首位(如果第四步取的是首位则选择末位)的值,分散到4个分区中,以保证删改查的速度。

3、PHP实现

         classIDGenerator{
         private$uniqidNum;//uniqid前缀长度
         private $md5Num;//md5后缀长度
         public function__construct($uniqidNum = 5, $md5Num = 3){
                   if(is_numeric($uniqidNum)){
                            $this->uniqidNum= $uniqidNum;
                   }
                   if(is_numeric($md5Num)){
                            $this->md5Num= $md5Num;
                   }                
         }
         //只能设置为数值
         public function__set($prop, $val){
                   if(property_exists('IDGenerator',$prop) && is_numeric($val) && 0 < $val){
                            $this->$prop= $val;
                   }
         }
         public function__get($prop){
                   if(property_exists('IDGenerator',$prop)){
                            $this->$prop= $val;
                   }                
         }
         //随机生成内容
         private functiongenerateRandomSting($num){
                   if(!is_numeric($num)|| 1 > $num){
                            return'';
                   }
                   $str ='0123456789qwertyuiopasdfghjklzxcvbnm!@#$%^&*()_+-=|/?';
                   $len =strlen($str);
                   $res = '';
                   for($i=0;$i<$num;$i++){
                            $randNum= mt_rand(0, $len-1);
                            $res.= $str[$randNum];
                   }
                   return $res;
         }
         //id生成
         public functiongetId(){
                   $uid = uniqid($this->generateRandomSting($this->uniqidNum),true);
                   returnmd5($uid.$this->generateRandomSting($this->md5Num));
         }
}
$idgen = new IDGenerator();
for($i=0;$i<10;$i++){
         echo$idgen->getId();
         echo '<br />';
}
//输出
c37276addc92003e7acbfbf3e283e491
f22e69f2b65f3e9ae3fe05769e8bf06d
943a5d7f05443f481a24e565a5286899
07b70aee6d661c56dc7492aa961b787d
681aec954133dbdc493f781ed8bb828d
bf104d7c937a518a66f7702d0e50dba7
9f3c7606fb083b4b5e5aa5874977801a
fee83e49f3e165a092bf2ba2c808cbf7
6200d63f91503c31ab642749d3858e0c
dca0a0811f7a7a631ad181765299367d

不断的刷新页面,输出的结果也不一样,且同时执行时也保证输出的结果不一样。因此,此ID生成器可以满足高并发下的生成id,且有保密性。

本文是我对ID生成器的见解,如果有偏差欢迎指正。

——written by linhxx 2017.07.31

原文发布于微信公众号 - 决胜机器学习(phpthinker)

原文发表时间:2017-07-31

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏枕边书

设计模式,Let's “Go”! (上)

前言 最近读了《Head First 设计模式》,每天早上看一章,学习一个设计模式,做些笔记,然后晚上抽空用刚学习的 Go 语言实现一下。半个月下来书读完了,留...

1785
来自专栏小灰灰

时序数据库InfluxDB基本概念小结

InfluxDB作为时序数据库,与传统的关系型数据库相比而言,还是有一些区别的,下面尽量以简单明了的方式介绍下相关的术语概念

1504
来自专栏Java3y

Activiti就是这么简单

Activiti介绍 什么是Activiti? Activiti5是由Alfresco软件在2010年5月17日发布的业务流程管理(BPM)框架,它是覆盖了业务...

4798
来自专栏码匠的流水账

分布式id生成方案概述

对于每个标识,都需要有一个命名空间(namespace),来保证其相对唯一性。 分布式的ID生成,以Twitter Snowflake为代表的, Flake 系...

592
来自专栏owent

protobuf-net的动态Message实现

这本来是个早就可以写的分享。因为代码几周前就迁移并准备好了。而且这也是之前项目的工具,因为可以抽离出来通用化所以单独整理出来。

811
来自专栏鸿的学习笔记

Hive使用的一些经验小结:

491
来自专栏程序员互动联盟

抓包工具Wireshark过滤规则实践第一篇

引子 现在从网上看到的一些wireshark过滤规则的介绍,都是比较老一点的,新版本的语法好像有所变化,所以在这里写一篇基于最新的1.12版本的wireshar...

3629
来自专栏ZRJ的专栏

spark 写 gp/tpg 效率优化:写入 237w 行数据耗时从 77 分钟到 34 秒

写这个文章的点主要是分享一下spark 写 gp/tpg 效率优化 ,这个过程中的一些思路历程和细节。

1.1K1
来自专栏后端之路

NoSql介绍之redis

背景 随着web2.0的兴起 大量的NoSql层出不穷。其中的佼佼者必然会包含Redis 那么对于Redis的基本使用大家还是要做到了然与心 NoSql nos...

2727
来自专栏性能与架构

Redis 新数据结构 - Streams

1. 为什么添加 Streams 数据流? Stream 数据流的使用越来越多,Redis 的作者 antirez 也在积极思考,如何让 redis 能够很好的...

3416

扫码关注云+社区