前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >对于随机数的一些分析

对于随机数的一些分析

作者头像
jeanron100
发布2018-03-22 15:03:17
7560
发布2018-03-22 15:03:17
举报

多年前我朋友圈的一个朋友公司年会抽奖出现了下面的这样一幕:CTO现场review代码。本来带着一丝娱乐精神,结果被无限放大了。所以年会中大家都会很自然想review下代码。

比如这种姿势:

然后就开始review代码。

我们就开几个脑洞,来从我的理解来说一下随机数的情况。

生成一个随机数看起来很简单,实则不易,怎么让一个确定的值得到一个不确定的值,这个想起来都有点困难,所以如果自己想实现,结果发现远比自己琢磨的要复杂的多,如果放眼程序领域,就拿Java来说,Java不同版本中对于随机算法的实现是有差别的。

比如Random的方法在JDK6中会使用System.nanoTime()的方式,而在早期的版本是使用currentTimeMillis,相比而言,nanoTime是以毫微秒为单位,而currentTimeMillis返回的是系统当前时间和1970-01-01之前间隔时间的毫秒数。

而且在随机算法的实现细节上,也有一些差别。

关于随机算法,还有一本书,这本书有400多页,涉及的面非常广。

而如果我们不写SQL行不行,肯定可以,因为对于DBA来说,SQL能做任何想做的事情。

比如要得到一个随机数,写SQL其实有很多中写法。比如限定数据的范围是7~12,可以这样写。

mysql> SELECT FLOOR(7 + (RAND() * 6));
+-------------------------+
| FLOOR(7 + (RAND() * 6)) |
+-------------------------+
|                      10 |
+-------------------------+
1 row in set

比如限定的数据范围是100以内,可以这样写。

mysql> select truncate(round(rand(),2)*100,0);
+---------------------------------+
| truncate(round(rand(),2)*100,0) |
+---------------------------------+
|                              78 |
+---------------------------------+

当然这样只是最基本的实现,还没有考虑到种子函数的影响。

我们暂且抛开实现的复杂度,来看看结合一些场景的不同实现,我临时自造了几个概念,但是意思应该是相通的。

平均随机数

这是一种看起来随机,但是数据分布又可控的方式。

比如1~100我生成10个数字,我可以每10个数字分为1组。每组做一个随机。

这样我对1~10生成一个随机序列,比如第一个随机数是2,我就从20~29里面选择一个数字,下一数字是5,则从50~59里面选出1个数字。

通过这种方式数据的分布方式决定是可控的,但是又保证了随机的特性。

一次性随机数

这类随机数就好比陕西的油泼面一样,简单快捷,一勺油即可搞定。如果我需要10个数字,那么我一次就生成10个随机数字。

看起来实现有些难,其实还好,使用rand()和limit即可。

插入8条数据。

mysql> insert into random values
(1),(2),(40),(30),(20),(9),(15),(21);
Query OK, 8 rows affected
Records: 8  Duplicates: 0  Warnings: 0

默认得到的数据是有序的。

mysql> select *from random;
+----+
| id |
+----+
|  1 |
|  2 |
| 40 |
| 30 |
| 20 |
|  9 |
| 15 |
| 21 |
+----+
8 rows in set

使用rand来得到一个随机序列。

mysql> select *from random order by rand();
+----+
| id |
+----+
|  1 |
|  2 |
| 30 |
| 20 |
| 40 |
| 21 |
| 15 |
|  9 |
+----+
8 rows in set

如果需要截取,就可以使用limit了。

mysql> select *from random order by rand() limit 4;
+----+
| id |
+----+
| 30 |
| 21 |
|  9 |
| 20 |
+----+
4 rows in set

动态随机数

这类随机数的代价最高,需要反复计算。总之不确定性要高很多,但是随机性更大。

比如对100个数中取出10个数,我们每取出一个数,就需要把它排除掉,从列表里重新再取,这样如果是连续的数字 1 2 3也是有可能的。

我们来通过SQL来简答模拟一下抽奖的过程。

初始化表数和数据。

create table lucky_money(id int primary key,money int,status smallint);

存储过程如下:

delimiter $$
create procedure  proc_init ()
begin
   declare
   init_data integer default 1;
   while init_data<=1500 do 
   insert into lucky_money values(init_data,0,0);
   set init_data = init_data +1;
   end while;
end $$
delimiter ;
call proc_init();

得到的数据是有序的。即员工号。

| 1497 |     0 |      0 |
| 1498 |     0 |      0 |
| 1499 |     0 |      0 |
| 1500 |     0 |      0 |
+------+-------+--------+
1500 rows in set

我们修改状态,随机得到一些数据的变化。

update lucky_money set money=1000,status=1  order by rand()  limit 200;
update lucky_money set money=3000,status=1  where status=0 order by rand()  limit 80;
update lucky_money set money=5000,status=1  where status=0 order by rand()  limit 20;

所以第一轮之后,平均奖金是360元。

mysql> select avg(money) from lucky_money;
+------------+
| avg(money) |
+------------+
| 360.0000   |
+------------+
1 row in set
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-02-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 杨建荣的学习笔记 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
云数据库 SQL Server
腾讯云数据库 SQL Server (TencentDB for SQL Server)是业界最常用的商用数据库之一,对基于 Windows 架构的应用程序具有完美的支持。TencentDB for SQL Server 拥有微软正版授权,可持续为用户提供最新的功能,避免未授权使用软件的风险。具有即开即用、稳定可靠、安全运行、弹性扩缩等特点。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档