首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

group by 慢查询优化

一、问题背景 现网出现慢查询,在500万数量级的情况下,单表查询速度在30多秒,需要对sql进行优化,sql如下: 我在测试环境构造了500万条数据,模拟了这个慢查询。...二、看执行计划 可以看到,group by字段上我是加了索引的,也用到了。 三、优化 说实话,我是不知道该怎么优化的,这玩意还能怎么优化啊!先说下,下面的思路都是没用的。...思路二: where条件太复杂,没索引,导致查询慢,但我给where条件的所有字段加上了组合索引,也还是没用 思路三: 既然group by慢,换distinct试试??...(这里就是本篇博客里说的神奇的地方了) 卧槽???!!!这是什么情况,瞬间这么快了??!!! 虽然知道group by和distinct有很小的性能差距,但是真没想到,差距居然这么大!!!...那就是sqlyog的问题了,现在也不清楚sqlyog是不是做什么优化了,这个慢查询的问题还在解决中(我觉得问题可能是出在mysql自身的参数上吧)。

85220

性能优化-group by的优化

4、group by的优化 最好使用同一表中的列, 需求:每个演员所参演影片的数量-(影片表和演员表) explain select actor.first_name,actor.last_name,...优化后的SQL: explain select actor.first_name,actor.last_name,c.cnt from sakila.actor inner join ( select...说明:从上面的执行计划来看,这种优化后的方式没有使用临时文件和文件排序的方式了,取而代之的是使用了索引。查询效率老高了。...这个时候我们表中的数据比较大,会大量的占用IO操作,优化了sql执行的效率,节省了服务器的资源,因此我们就需要优化。...注意: 1、mysql 中using关键词的作用:也就是说要使用using,那么表a和表b必须要有相同的列。 2、在用Join进行多表联合查询时,我们通常使用On来建立两个表的关系。

1.8K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    记一次神奇的sql查询经历,group by慢查询优化

    一、问题背景 现网出现慢查询,在500万数量级的情况下,单表查询速度在30多秒,需要对sql进行优化,sql如下: ? 我在测试环境构造了500万条数据,模拟了这个慢查询。...简单来说,就是查询一定条件下,都有哪些用户的。很简单的sql,可以看到,查询耗时为37秒。...可以看到,group by字段上我是加了索引的,也用到了。 三、优化 说实话,我是不知道该怎么优化的,这玩意还能怎么优化啊!先说下,下面的思路都是没用的。...思路二: where条件太复杂,没索引,导致查询慢,但其实哪怕where条件不动,只要把group by去掉,就非常快。所以应该也不是where条件的问题。 ?...那就是sqlyog的问题了,现在也不清楚sqlyog是不是做什么优化了,这个慢查询的问题还在解决中(我觉得问题可能是出在mysql自身的参数上吧)。

    1.4K20

    记一次神奇的SQL查询经历,group by慢查询优化

    作者:dijia478 链接:https://www.cnblogs.com/dijia478 一、问题背景 现网出现慢查询,在500万数量级的情况下,单表查询速度在30多秒,需要对sql进行优化,sql...可以看到,group by字段上我是加了索引的,也用到了。 三、优化 说实话,我是不知道该怎么优化的,这玩意还能怎么优化啊!先说下,下面的思路都是没用的。...思路二: where条件太复杂,没索引,导致查询慢,但我给where条件的所有字段加上了组合索引,也还是没用 ? ? 思路三: 既然group by慢,换distinct试试??...(这里就是本篇博客里说的神奇的地方了) ? 卧槽???!!!这是什么情况,瞬间这么快了??!!! 虽然知道group by和distinct有很小的性能差距,但是真没想到,差距居然这么大!!!...那就是sqlyog的问题了,现在也不清楚sqlyog是不是做什么优化了,这个慢查询的问题还在解决中(我觉得问题可能是出在mysql自身的参数上吧)。

    1.2K20

    记一次详细的的SQL查询经历,group by慢查询优化

    一、问题背景 现网出现慢查询,在500万数量级的情况下,单表查询速度在30多秒,需要对sql进行优化,sql如下: ? 这里测试环境构造了500万条数据,模拟了这个慢查询。...可以看到,group by字段上是加了索引的,也用到了。...思路二: where条件太复杂,没索引,导致查询慢,但给where条件的所有字段加上了组合索引,没起作用。 ? ? 思路三: 既然group by慢,换distinct试试 ? 瞬间就加快了。...虽然知道group by和distinct有很小的性能差距,但是没想到,差距居然这么大。 四、你以为这就结束了吗 ---- 这个bug转给测试后,测试一测,居然还是30多秒。...那就是sqlyog的问题了,现在也不清楚sqlyog是不是做什么优化了,这个慢查询的问题还在解决中(问题可能是出在mysql自身的参数上)。

    1.9K10

    MySQL查询优化-基于EXPLAIN

    使用 EXPLAIN 分析查询语句,解析每一项的含义,并给出优化建议。 MySQL 版本:10.5.5-MariaDB MariaDB Server。...const:使用唯一索引或者主键,返回记录一定是 1 行记录的等值 where 条件时。 const、system:当MySQL对查询某部分进行优化,并转换为一个常量时,使用这些类型访问。...因此基于 icp 的概念,在我们使用组合索引的场景不是很明确时,最好可以分别建立索引。...二、优化经验 要对经常进行搜索,排序,分组的列创建索引。 考虑列基数(同一个列中的不重复的值的数量),列基数越大,效果越好,即区分度越高。...temporary 创建一个临时表来存储数据,一般出现在对非索引的列集进行 group by 时 (需要添加合适的索引) using where 通常是对全表/全索引进行扫描之后,再用 where

    1.6K20

    基于代价的慢查询优化建议

    所以采用基于代价的推荐来解决该问题会更加普适,因为基于代价的方法使用了和数据库优化器相同的方式,去量化评估所有的可能性,选出的是执行SQL耗费代价最小的索引。...2 基于代价的优化器介绍 2.1 SQL执行与优化器 一条SQL在MySQL服务器中执行流程主要包含:SQL解析、基于语法树的准备工作、优化器的逻辑变化、优化器的代价准备工作、基于代价模型的优化、进行额外的优化和运行执行计划等部分...2.4 基于代价的索引推荐思路 如果想借助MySQL优化器给慢查询计算出最佳索引,那么需要真实地在业务表上添加所有候选索引。对于线上业务来说,直接添加索引的时间空间成本太高,是不可接受的。...我们对SQL进行语法树解析,在树节点的where、join、order by、group by、聚合函数中提取列名,作为索引的候选列。...未来我们也将不断优化和改进,实现类似基于Workload的全局优化。

    1.7K40

    干货 | 基于ClickHouse的复杂查询实现与优化

    所以我们的目标是基于ClickHouse能够高效支持复杂查询。 技术方案 对于ClickHouse复杂查询的实现,我们采用了分Stage的执行方式,来替换掉目前ClickHouse的两阶段执行方式。...通过重试能够避免一些节点短时性的高负载或者异常对查询的影响。做好监控,在出问题的时候,能快速感知,并进行排查,也能够针对性地去做优化。 优化与诊断 首先是Join的多种实现和优化。...第二阶段 agg uniqExact 算子的合并原本由coordinator单点合并,现在通过按照group by key shuffle后可以由多个节点并行完成。...事实上,优化器对复杂查询的性能提升也非常大,通过一些RBO的规则,例如常见的谓词下推、相关子查询的处理等,可以极大提升SQL的执行效率。...这里不谈论引擎执行通用的优化,比如更好的索引或者算子的优化,主要是跟复杂查询模式有关。

    3K20

    group by的工作原理和优化思路

    引入 日常开发中,我们经常会使用到group by。你是否知道group by的工作原理呢?group by和having有什么区别呢?group by的优化思路是怎样的呢?...使用group by的简单例子 group by 工作原理 group by + where 和 having的区别 group by 优化思路 group by 使用注意点 一个生产慢SQL如何优化...执行计划结果,可以发现查询条件命中了idx_age的索引,并且使用了临时表和排序 Using index condition:表示索引下推优化,根据索引尽可能的过滤数据,然后再返回给服务器层根据where...如果数据量很大,很可能这个查询需要的磁盘临时表,就会占用大量的磁盘空间。 这些都是导致慢SQL的x因素,我们一起来探讨优化方案哈。 group by的一些优化方案 从哪些方向去优化呢?...加合适的索引是优化group by最简单有效的优化方式。 order by null 不用排序 并不是所有场景都适合加索引的,如果碰上不适合创建索引的场景,我们如何优化呢?

    84520

    性能优化-Limit查询的优化

    5、Limit查询的优化 Limit常用于分页处理,时长会伴随order by从句使用,因此大多时候回使用Filesorts这样会造成大量的IO问题。...例子: 需求:查询影片id和描述信息,并根据主题进行排序,取出从序号50条开始的5条数据。...在查看一下它的执行计划: ? 对于这种操作,我们该用什么样的优化方式了?...优化步骤1: 使用有索引的列或主键进行order by操作,因为大家知道,innodb是按照主键的逻辑顺序进行排序的。可以避免很多的IO操作。...随着我们翻页越往后,IO操作会越来越大的,如果一个表有几千万行数据,翻页越后面,会越来越慢,因此我们要进一步的来优化。 优化步骤2 记录上次返回的主键, 在下次查询时使用主键过滤。

    93410

    性能优化-子查询的优化

    3、子查询的优化 子查询是我们在开发过程中经常使用的一种方式,在通常情况下,需要把子查询优化为join查询但在优化是需要注意关联键是否有一对多的关系,要注意重复数据。...我们要进行一个子查询,需求:查询t表中id在t1表中tid的所有数据; select * from t where t.id in (select t1.tid from t1); ?...通过上面结果来看,查询的结果是一致的,我们就将子查询的方式优化为join操作。...在这种情况下,如果我们使用子查询方式进行查询,返回的结果就是如下图所示: ? 如果使用join方式进行查找,如下图所示: ?...例子:查询sandra出演的所有影片: explain select title,release_year,length from film where film_id in ( select

    1.7K20

    硬核干货 | 基于Impala的网易有数BI查询优化总结

    ,将基于Impala管理服务器得到的分析结果制作成直观的图表报告。...1.Impala相关 统计信息缺失 与主流的数据库和数仓查询引擎一样,Impala也是基于代价模型进行执行计划优化(CBO)。只有获取足够的统计信息,才能支撑Impala选取较优的执行计划。...作为一个基于CBO的查询引擎,若用户不手动执行compute [incremental] stats计算统计信息,Impala的查询性能是要打折扣的。...下图所示为一张TEXT格式的100+G非分区表,该集群每日慢查询中有不小比例与该表相关。 ? 数仓治理 对于DN相关的性能问题,涉及数仓治理,目前主要依赖业务的数仓团队配合基于实际的业务场景进行优化。...目前已完成音乐Impala集群升级; 引入Alluxio作为Impala与HDFS间的缓存层; 基于历史查询信息的表统计信息自动计算功能; 基于物化视图(临时表)的SQL重写功能,通过创建预聚合表来优化查询性能

    1.4K20

    性能优化-慢查询的优化案例

    3、慢查询的优化案例 1、函数Max()的优化 用途:查询最后支付时间-优化max()函数 语句: select max(payment_date) from payment; ?...可以看到显示的执行计划,并不是很高效,可以拖慢服务器的效率,如何优化了? 创建索引 create index inx_paydate on payment(payment_date); ? ?...索引是顺序操作的,不需要扫描表,执行效率就会比较恒定, 2、函数Count()的优化 需求:在一条SQL中同时查处2006年和2007年电影的数量 错误的方式: 语句: select count(release_year...正确的编写方式: select count(release_year='2006' or null) as '06films',count(release_year='2007' or null) as...说明: Count(id)是不包含null的值 Count(*)是包含null的值

    1.1K20

    数据优化查询的意义

    索引的使用要恰到好处,其使用原则如下: ●在经常进行连接,但是没有指定为外键的列上建立索引,而不经常连接的字段则由优化器自动生成索引。...●在频繁进行排序或分组(即进行group by或order by操作)的列上建立索引。 ●在条件表达式中经常用到的不同值较多的列上建立检索,在不同值少的列上不要建立索引。...当能够利用索引自动以适当的次序产生输出时,优化器就避免了排序的步骤。...以下是一些影响因素: ●索引中不包括一个或几个待排序的列; ●group by或order by子句中列的次序与索引的次序不一样; ●排序的列来自不同的表。...比如采用顺序存取策略,一个嵌套3层的查询,如果每层都查询1000行,那么这个查询就要查询10亿行数据。避免这种情况的主要方法就是对连接的列进行索引。

    1.1K00

    数据 优化查询的目的

    索引的使用要恰到好处,其使用原则如下: ●在经常进行连接,但是没有指定为外键的列上建立索引,而不经常连接的字段则由优化器自动生成索引。...●在频繁进行排序或分组(即进行group by或order by操作)的列上建立索引。 ●在条件表达式中经常用到的不同值较多的列上建立检索,在不同值少的列上不要建立索引。...当能够利用索引自动以适当的次序产生输出时,优化器就避免了排序的步骤。...以下是一些影响因素: ●索引中不包括一个或几个待排序的列; ●group by或order by子句中列的次序与索引的次序不一样; ●排序的列来自不同的表。...比如采用顺序存取策略,一个嵌套3层的查询,如果每层都查询1000行,那么这个查询就要查询10亿行数据。避免这种情况的主要方法就是对连接的列进行索引。

    1.1K00

    MySQL的查询优化(二)

    “ 在昨天的MySQL的查询优化(一)中,我们谈到SQL常用的一些优化方式:给字段增加索引,避免索引失效,替换掉一些不合理的关键词,那么今天我们继续来看SQL如何进行查询优化” 在上一章第一条优化中我们说到在...产生临时表的原因,一般有下面几种情况: 1.如果GROUP BY 的列没有索引,产生临时表. 2.如果GROUP BY的列有索引,ORDER BY的列没索引.产生临时表. 3.如果GROUP BY或ORDER...所以Group by的字段也需要加索引。 第二种情况 ? 第三种情况 ? 如果你语句产生来临时表,就可以往以上几种情况靠拢,然后进行优化。...三.优化数据库结构 由于个人方向的问题,对于SQL语句的查询优化,自己并不是很精通,只能说遇到加载很慢的时候,我会去排除原因,如果原因出在SQL的问题上面的时候(大多数我觉得都是这上面),我回去看这个请求执行了哪些...SQL,如果开启了慢查询就去看慢查询日志,如果没有,把打印的SQL放到工具上执行一下,然后使用explain去看一下SQL的执行计划,最后再进行优化,当然最后的优化才是最重要的。

    1.7K20

    MySQL优化查询的方法

    对于MySQL数据库,优化查询的方法 1.使用索引   使用索引时,应尽量避免全表扫描,首先应考虑在 where 及 order by ,group by 涉及的列上建立索引。...2.优化SQL语句 1)分析查询语句:通过对查询语句的分析,可以了解查询语句执行情况,找出查询语句执行的瓶颈,从而优化查询语句。    ...通过explain(查询优化神器)用来查看SQL语句的执行结果,可以帮助选择更好的索引和优化查询语句,写出更好的优化语句。    ...如指定MySQL查询缓冲区的大小,指定MySQL允许的最大连接进程数等。 6.应用优化  1)使用数据库连接池  2)实用查询缓存   它的作用是存储 select 查询的文本及其相应结果。...如果随后收到一个相同的查询,服务器会从查询缓存中直接得到查询结果。查询缓存适用的对象是更新不频繁的表,当表中数据更改后,查询缓存中的相关条目就会被清空。

    1.3K10
    领券