我需要频繁地获取最近24小时的数据,并且这个查询经常运行。由于这会扫描许多行,因此频繁使用它会影响数据库性能。
MySql执行策略在created_at上选择索引,返回大约1,000,000行。这些行被逐个扫描以过滤customer_id = 10,我的最终结果是20000行。
如何优化此查询?
explain SELECT *
FROM `order`
WHERE customer_id = 10
and `created_at` >= NOW() - INTERVAL 1 DAY;
id : 1
select_type : SIMPLE
table : order
partitions : NULL
type : range
possible_keys : idx_customer_id, idx_order_created_at
key : idx_order_created_at
key_len : 5
ref : NULL
rows : 103357
filtered : 1.22
Extra : Using index condition; Using where发布于 2018-08-04 21:09:52
在( customer_id,created_at )上创建一个复合索引,而不是在ID和Created上创建两个单独的索引。这样,索引引擎就可以使用where子句的两个部分,而不是只希望得到一个子句。直接跳到客户ID,然后直接跳到所需的日期,然后给出结果。它应该非常快。
其他后续行动。我听到您关于拥有多个索引的评论,但请将它们添加到主索引中,例如
( customer_id、created_at、updated_at、completion_time )
然后,在查询中可以始终在where子句中包含一些有关索引的帮助。例如,我不知道你的具体数据。在某个给定点创建一条记录。更新和完成时间将始终在此之后。从创建到完成(最坏的情况)需要多长时间……2天,10天,90天?
where
customerID = ?
AND created_at >= date - 10 days
AND updated_at >= date -1同样,只是一个例子,但是如果一个人有1000个订单,并且周转时间相对较短,您可以跳到最近的订单,然后找到在该时间段内更新的订单。同样,只有一个选项作为单个索引与3个、4个或更多索引。
发布于 2018-08-04 21:14:33
我要做的第一个优化是对表的访问:
create index ix1 on `order` (customer_id, created_at);然后,如果查询仍然很慢,我会尝试将您选择的列附加到索引中。例如,如果要选择列order_id、amount和status
create index ix1 on `order` (customer_id, created_at,
order_id, amount, status);第二种策略可能是有益的,但您需要对其进行测试,以找出它在您的特定情况下所带来的性能改进。
第二种策略的最大改进是它只遍历辅助索引,避免遍历回表的主要聚集索引(这可能会耗费时间)。
发布于 2018-08-04 21:38:18
看起来你正在处理一个增长非常快的表,我应该考虑将这个频繁的查询转移到一个冷表或副本。
还有一点是,您是否考虑过按customer_id分区。我不太理解查询customer_id = 10背后的业务逻辑。如果是多租户应用程序,可以尝试partition。
https://stackoverflow.com/questions/51685834
复制相似问题