前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【黄啊码】使用union实现join的功能(MySQL性能优化篇)

【黄啊码】使用union实现join的功能(MySQL性能优化篇)

作者头像
黄啊码
发布2022-01-10 14:28:21
6580
发布2022-01-10 14:28:21
举报
文章被收录于专栏:黄啊码【CSDN同名】

由于分库分表的原因,和开发规定了不能使用表表JOIN 语句。因此,我们要将 JOIN 语句的转化成使用 IN 来做。如现在有 表 A(a_id, c_a)c_a有普通索引,表 B(b_id, c_a) 这两个表要关联, 应该转化为以下步骤处理:

  • 先查询B中的 a_id
代码语言:javascript
复制
SELECT c_a FROM B WHERE xxx;
  • 使用 IN 查询 A 表
代码语言:javascript
复制
SELECT a_id, ... FROM A WHERE c_a IN(在 1 中查出来的 c_a)

场景

现在表的数据量有 800万。

一般的使用语句是:

代码语言:javascript
复制
SELECT * FROM A WHERE c_a IN(955555, 955556, 955557, 955558, 955559);

上面语句会执行的很快,知道使用 explain 的都明白这样一般都是会使用索引的,并且是所有范围扫描。

MySQL不会从 1 开始 扫描 800万,而是从555555 扫描到 555559(只要扫描5行数据)。

在一般情况下是没有什么问题的。但是如果 IN 里面的数据是不连续的就有很大问题了。

创建表结构语句

代码语言:javascript
复制
CREATE TABLE t(     id INT unsigned NOT NULL AUTO_INCREMENT,     cid INT unsigned NOT NULL DEFAULT 0,     c1 VARCHAR(50) NOT NULL DEFAULT '',     c2 VARCHAR(50) NOT NULL DEFAULT '',     c3 VARCHAR(50) NOT NULL DEFAULT '',     c4 VARCHAR(50) NOT NULL DEFAULT '',     c5 VARCHAR(50) NOT NULL DEFAULT '',     c6 VARCHAR(50) NOT NULL DEFAULT '',     PRIMARY KEY(id),     INDEX idx$cid(cid) ); INSERT INTO t VALUES(     NULL,     FLOOR(RAND() * 1000000),     REPEAT('a', 50),     REPEAT('a', 50),     REPEAT('a', 50),     REPEAT('a', 50),     REPEAT('a', 50),     REPEAT('a', 50) ); -- 重复执行 INSERT INTO t SELECT NULL,     FLOOR(RAND() * 1000000),     c1,     c2,     c3,     c4,     c5,     c6 FROM t;

下面是具体的实验过程

  • 使用IN查询连续的数
代码语言:javascript
复制
SELECT * FROM t WHERE cid IN(955555, 955556, 955557, 955558, 955559); +---------+--------+----------------------------------- | id      | cid    | c1                               +---------+--------+----------------------------------- |  319330 | 955555 | aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa | 1885293 | 955555 | aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa | ...... | 8733757 | 955559 | aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa | 8796305 | 955559 | aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa +---------+--------+----------------------------------- 41 rows in set (0.15 sec)
  • 使用IN查询不连续的数
代码语言:javascript
复制
SELECT * FROM t WHERE cid IN(1, 5000, 50000, 500000, 955559); +---------+--------+----------------------------------- | id      | cid    | c1                               +---------+--------+----------------------------------- |      1 |  341702 |      1 | aaaaaaaaaaaaaaaaaaaaaaaaa |      1 | 1045176 |      1 | aaaaaaaaaaaaaaaaaaaaaaaaa ...... | 955559 | 8733757 | 955559 | aaaaaaaaaaaaaaaaaaaaaaaaa | 955559 | 8796305 | 955559 | aaaaaaaaaaaaaaaaaaaaaaaaa +--------+---------+--------+-------------------------- 41 rows in set (4.34 sec)
  • 使用UNION优化
代码语言:javascript
复制
SELECT * FROM (     SELECT 1 AS cid UNION ALL     SELECT 5000 UNION ALL     SELECT 50000 UNION ALL     SELECT 500000 UNION ALL     SELECT 955559 ) AS tmp, t WHERE tmp.cid = t.cid; +---------+--------+----------------------------------- | id      | cid    | c1                               +---------+--------+----------------------------------- |      1 |  341702 |      1 | aaaaaaaaaaaaaaaaaaaaaaaaa |      1 | 1045176 |      1 | aaaaaaaaaaaaaaaaaaaaaaaaa ...... | 955559 | 8733757 | 955559 | aaaaaaaaaaaaaaaaaaaaaaaaa | 955559 | 8796305 | 955559 | aaaaaaaaaaaaaaaaaaaaaaaaa +--------+---------+--------+-------------------------- 41 rows in set (0.01 sec)

从上面可以看出上面使用UNION的方法生成一个临时表作为关联的主表。

拓展

要是MySQL有只带的一个行转列的函数那就完美了。这样我们就可以不用使用UNION了。

代码语言:javascript
复制
SELECT 1, 5000, 50000, 500000, 955559; +---+------+-------+--------+--------+ | 1 | 5000 | 50000 | 500000 | 955559 | +---+------+-------+--------+--------+ | 1 | 5000 | 50000 | 500000 | 955559 | +---+------+-------+--------+--------+ 1 row in set (0.00 sec)      变成以下 SELECT row_to_col(1, 5000, 50000, 500000, 955559); +--------+ |     id | +--------+ |      1 | |   5000 | |  50000 | | 500000 | | 955559 | +--------+

要是能像上面就太棒了简直。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2021/11/10 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 场景
  • 创建表结构语句
  • 下面是具体的实验过程
  • 拓展
相关产品与服务
云数据库 SQL Server
腾讯云数据库 SQL Server (TencentDB for SQL Server)是业界最常用的商用数据库之一,对基于 Windows 架构的应用程序具有完美的支持。TencentDB for SQL Server 拥有微软正版授权,可持续为用户提供最新的功能,避免未授权使用软件的风险。具有即开即用、稳定可靠、安全运行、弹性扩缩等特点。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档