专栏首页爱可生开源社区技术分享 | 使用 RAND() 函数过程中发现的诡异 Bug 分析

技术分享 | 使用 RAND() 函数过程中发现的诡异 Bug 分析

作者:Agate Li

爱可生研发团队成员,负责数据库管理平台相关项目,.Net 技术爱好者,长期潜水于技术圈。

本文来源:原创投稿

*爱可生开源社区出品,原创内容未经授权不得随意使用,转载请联系小编并注明来源。


背景

MySQL 中的 RAND() 函数是一个随机数发生器,可以返回一个 >=0<1.0 的随机浮点数。

最近在实际使用过程里遇见了一个主流版本中非常诡异的 Bug,故整理出来,以免大家踩坑。

演示

文中使用的 MySQL 版本是 5.7.25,话不多说,直接上演示:

1. 创建测试表

CREATE TABLE test (`id` INT(3) NOT NULL PRIMARY KEY AUTO_INCREMENT) ENGINE=`InnoDB`;

2. 往表里插入 10 条记录

INSERT INTO test VALUES(),(),(),(),(),(),(),(),(),();

3. 关键来了,执行几次下面这条 SQL

SELECT sub.rnd FROM (SELECT FLOOR(RAND()*10) rnd FROM test) sub WHERE sub.rnd<3;

明明指定了筛选内层 sub.rnd 小于 3 的条件,输出出来的结果却完全不对。

4. 接下来排查问题的触发条件

由于直接使用 RAND() 函数输出出来的结果是随机的,首先要做的就是指定一枚固定的种子,一是以免干扰后续排查,二是可以让大家自行精确复现。

首先将种子设定为 100,并多次查询内层的随机数

可以看到,符合预期。继续:

仍然符合预期,看起来不像是 RAND() 函数本身的问题。

5. 为第三步中的 SQL 指定种子:

SELECT sub.rnd FROM (SELECT FLOOR(RAND(100)*10) rnd FROM test) sub WHERE sub.rnd<3;

熟悉的味道出现了,刺激的感觉回来了…… EXPLAIN 一波

6. 去掉第三步中的 test 表再试

SELECT sub.rnd FROM (SELECT FLOOR(RAND(100)*10) rnd) sub WHERE sub.rnd<3;

哈?并没有问题?再 EXPLAIN 一波

到这里就有了个怀疑,是不是跟派生表物化相关?

7. 再改改第三步中的 SQL

SELECT sub.rnd FROM (SELECT FLOOR(RAND(100)*10) rnd FROM test LIMIT 10000) sub WHERE sub.rnd<3;

再再 EXPLAIN 一波

嗯,不出所料呢。这回结果对了。

8. 再验证一次,把第三步中的 SQL 拉平

SELECT FLOOR(RAND(100)*10) rnd FROM test HAVING rnd<3;

再再再 EXPLAIN 一波

没错,还是熟悉的味道,还是刺激的感觉。

9. 这时候可以推测,大概率是在派生表未物化的情况下 RAND() 在外层重算了……

拿着推测,去 google 一波,立刻找到了一个相关 Bug:

https://bugs.mysql.com/bug.php?id=86624

嗯,2017 年年中就有人报过的 Bug,再看看 Bug 状态,噢,“嘻嘻,我们验证了但不打算修”……

好在官方还是给出了解决方法:

  • 对于5.7,跟我们的做法一样,加上 LIMIT <一个很大的数>;
  • 对于8.0,加上 no_merge。

文末例行完结撒花。

本文分享自微信公众号 - 爱可生开源社区(ActiontechOSS),作者:Agate Li

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-03-10

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 第10期:选择合适的表空间

    MySQL 表空间可分为共享表空间和单表空间;其中共享表空间又可分为系统表空间和通用表空间。

    爱可生开源社区
  • 第03问:磁盘 IO 报警,MySQL 读写哪个文件慢了?

    想观察 IO 相关的行为,需启用 performance_schema 的 instrument(生产者)和 consumer(消费者)。

    爱可生开源社区
  • 技术分享 | 常见索引问题处理

    数据库技术爱好者,爱可生 DBA 团队成员,负责 MySQL 日常问题处理以及数据库运维平台的问题排查,擅长 MySQL 主从复制及优化,喜欢钻研技术问题,还有...

    爱可生开源社区
  • 微服务框架saf-2:容器化部署allinone-demo

    (6).容器化部署saf-boot-starter-sample-allinone-service

    千里行走
  • 怎样从优秀教师变成超级主播?本文全都告诉你

    ? 为了控制疫情,全国各大中小学都推迟了开学时间。教育部门希望各个学校根据自身情况,开展停课不停学的工作。可是,许多在讲台上经验丰富的老师,变成主播之后瞬间各...

    鹅老师
  • 你听说过Epistasis吗?

    和单基因孟德尔遗传疾病的研究相比,复杂疾病的研究虽然取得了一定成效,但还远远谈不上成功,因为影响复杂疾病的因素实在是太多了,比如疾病性状相关的基因座数量很多,等...

    生信修炼手册
  • Automl框架katib浅析

    | 导语   AutoML是一种能将机器学习模型中特征工程、模型选择、超参选择等问题自动化解决的一种方案,使得机器学习模型无需人工干预即可被应用。而katib...

    腾讯大讲堂
  • 千万别以为自动化测试多容易,看看这五个灵魂拷问,是你你也懵

    说起自动化测试,在这个软件吞噬世界的时代里,早不是什么高端技术了。从基本的单元测试,到复杂的系统测试,几乎都可以使用自动化测试来代替原本的手动测试。

    博文视点Broadview
  • GSEA分析结果详细解读

    在解读传统的富集分析结果时,经常会有这样的疑问,一个富集到的通路下,既有上调差异基因,也有下调差异基因,那么这条通路总体的表现形式究竟是怎样呢,是被抑制还是激活...

    生信修炼手册
  • Linux系统磁盘格式化以及手动增加swap分区

    cat /etc/filesystems 查看Centos 7可支持的文件格式。

    砸漏

扫码关注云+社区

领取腾讯云代金券