首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >优化SQL以获取1天的数据

优化SQL以获取1天的数据
EN

Stack Overflow用户
提问于 2018-08-04 20:59:32
回答 5查看 189关注 0票数 0

我需要频繁地获取最近24小时的数据,并且这个查询经常运行。由于这会扫描许多行,因此频繁使用它会影响数据库性能。

MySql执行策略在created_at上选择索引,返回大约1,000,000行。这些行被逐个扫描以过滤customer_id = 10,我的最终结果是20000行。

如何优化此查询?

代码语言:javascript
运行
复制
explain SELECT  *
FROM    `order`
WHERE    customer_id = 10
and `created_at` >= NOW() - INTERVAL 1 DAY;

id : 1
select_type : SIMPLE
table : order
partitions : NULL
type : range
possible_keys : idx_customer_id, idx_order_created_at
key : idx_order_created_at
key_len : 5
ref : NULL
rows : 103357
filtered : 1.22
Extra : Using index condition; Using where
EN

回答 5

Stack Overflow用户

发布于 2018-08-04 21:09:52

在( customer_id,created_at )上创建一个复合索引,而不是在ID和Created上创建两个单独的索引。这样,索引引擎就可以使用where子句的两个部分,而不是只希望得到一个子句。直接跳到客户ID,然后直接跳到所需的日期,然后给出结果。它应该非常快。

其他后续行动。我听到您关于拥有多个索引的评论,但请将它们添加到主索引中,例如

( customer_id、created_at、updated_at、completion_time )

然后,在查询中可以始终在where子句中包含一些有关索引的帮助。例如,我不知道你的具体数据。在某个给定点创建一条记录。更新和完成时间将始终在此之后。从创建到完成(最坏的情况)需要多长时间……2天,10天,90天?

代码语言:javascript
运行
复制
where
       customerID = ?
   AND created_at >= date - 10 days
   AND updated_at >= date -1

同样,只是一个例子,但是如果一个人有1000个订单,并且周转时间相对较短,您可以跳到最近的订单,然后找到在该时间段内更新的订单。同样,只有一个选项作为单个索引与3个、4个或更多索引。

票数 1
EN

Stack Overflow用户

发布于 2018-08-04 21:14:33

我要做的第一个优化是对表的访问:

代码语言:javascript
运行
复制
create index ix1 on `order` (customer_id, created_at);

然后,如果查询仍然很慢,我会尝试将您选择的列附加到索引中。例如,如果要选择列order_idamountstatus

代码语言:javascript
运行
复制
create index ix1 on `order` (customer_id, created_at, 
  order_id, amount, status);

第二种策略可能是有益的,但您需要对其进行测试,以找出它在您的特定情况下所带来的性能改进。

第二种策略的最大改进是它只遍历辅助索引,避免遍历回表的主要聚集索引(这可能会耗费时间)。

票数 1
EN

Stack Overflow用户

发布于 2018-08-04 21:38:18

看起来你正在处理一个增长非常快的表,我应该考虑将这个频繁的查询转移到一个冷表或副本。

还有一点是,您是否考虑过按customer_id分区。我不太理解查询customer_id = 10背后的业务逻辑。如果是多租户应用程序,可以尝试partition。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51685834

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档