前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >MYSQL group by 怎么能快一点,之别一根筋

MYSQL group by 怎么能快一点,之别一根筋

作者头像
AustinDatabases
发布2019-10-24 16:38:50
2.1K0
发布2019-10-24 16:38:50
举报
文章被收录于专栏:AustinDatabasesAustinDatabases

一般来都有这样一个说法,MYSQL 表的数据超过500万行就不行了,而在这个说法之后就是MYSQL 的group by 的性能奇差无比。

如果要用一句话来说,你把MYSQL 当其他数据库用了(PG, SQL SERVER ,ORACLE),所招致的结果。

select last_name,count(*) from employees where hire_date between '1990-01-01' and '2000-01-01' group by last_name limit 10;

上面是一个查询语句

下面是有索引,没索引,不同索引的查询时间

三种情况,最后将索引落在分组字段的情况下,查询的时间是最短的。

因为group by实际上执行相同的排序操作,所以group by基本上只是排序后的分组操作,这样,我们就可以一组一组地扫描数据,并动态地执行组。所以在有where 后的条件的索引和GROUP BY 的字段的索引,这样的情况大概率的可能性选择的是分组的索引来进行相关的查询。

当然我们也可以通过,一些参数来强制系统查询的预期结果,例如 SQL_SMALL_RESULT , SQL_BIG_RESULT , SQL_BUFFER_RESULT

我们可以看到三种强制的预期,

1 我们的group by 或 distinct 操作的数据结果集是比较大的,则使用big_result,MYSQL会在磁盘创建临时表,并且很可能走全表扫描的方式

2 如果我们的预设的结果集比较小,则结果集会在内存中进行存储,大家可以看到连中国香港的 file sort 都不在存在

3 如果希望更快的解锁查询的表,可以选择buffer_result, 将尽快的将表解锁并且将结果存储在本地机,而不是 直接 send data

下面我们来看一个稍微复杂的查询

select d.dept_no,count(s.salary) as count_salary from employees as e

-> left join salaries as s on e.emp_no = s.emp_no

-> left join dept_emp as d on d.emp_no = e.emp_no

-> where e.gender = 'M'

-> group by d.dept_no;

查询的主要目的查询是男性的每个部门的总的工资消耗

可以看到基本上查询在不到6秒的时间,如何优化这样的查询在MYSQL中。

首先查询的时间过长是一个问题,有的时候我们的想法一般是怎么让这个语句更快的出结果,而加各种的索引,而实际中语句的优化的另一种想法是怎么能让锁表的时间更短,看上去这两者不矛盾,但实际当然其实可能是两种截然不同的思路。

例如上面的语句我这样操作,首先获得所有的部门分组信息的dept_no

将其保存在程序的缓存中,然后

通过下面的语句将每个部门的工资总和获取后,在进行累加的计算(这使用程序来做不是一件困难的事情),最后获得总体的和上面语句一样的结果,而经过实际的操作,整体的查询九个部门的工资最长的不过0.34秒,最短的仅仅0.02秒。整体的查询9次累加的耗时都不超过1 秒。

select d.dept_no,count(s.salary) as count_salary from employees as e left join salaries as s on e.emp_no = s.emp_no left join dept_emp as d on d.emp_no = e.emp_no where e.gender = 'M' and d.dept_no = 'd009';

通过这样的查询方法,总比死在怎么整体优化一条SQL 要好的多,语句优化,一定要灵活,不要一根筋。当然遇到类似的情况也要分析,如果遇到GROUP BY 就用这样的方法,其实还是一根筋。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-10-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AustinDatabases 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
云数据库 SQL Server
腾讯云数据库 SQL Server (TencentDB for SQL Server)是业界最常用的商用数据库之一,对基于 Windows 架构的应用程序具有完美的支持。TencentDB for SQL Server 拥有微软正版授权,可持续为用户提供最新的功能,避免未授权使用软件的风险。具有即开即用、稳定可靠、安全运行、弹性扩缩等特点。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档