文章/答案/技术大牛

发布

社区首页 >问答首页 >SQL -避免额外的GROUP BY (并提高查询性能)

问SQL -避免额外的GROUP BY (并提高查询性能)
EN

Stack Overflow用户

提问于 2013-02-20 17:38:50

回答 1查看 552关注 0票数 0

我被困在解决这个问题上，听到新的想法应该很好:)

我有一个表，上面有数十亿条这样的记录

TAB_IX (int) (PK)
TAB_ID (int) (PK)
PR_ID (int) (PK)
SP_ID (int) (PK)(IX)
....

以前我是这样检索数据的

SELECT TAB_ID, COUNT (SP_ID) as HITS FROM table t
INNER JOIN table_sp s on t.SP_ID = s.ID
WHERE TAB_IX = @tab_inx 
AND PR_ID IN (SELECT PR_ID FROM @pr_id)
AND s.NAME IN (SELECT DISTINCT NAME FROM @sp_names)  
GROUP BY TAB_ID

table_sp是一个包含10k记录的小表(ID (int) (PK)，NAME (varchar) (IX))

@pr_id和@sp_names是具有一列的表变量

查询非常快(大约2-3秒)；现在我不想区分具有不同PR_ID和相同TAB_IX、TAB_ID、SP_ID的记录

例如像这样的记录

TAB_IX - TAB_ID - PR_ID - SP_ID
1      - 700    - 1     - 100
1      - 700    - 2     - 100

应该被视为一体。

唯一的方法似乎是做一个额外的GROUP BY

像这样

SELECT TAB_ID, COUNT(SP_ID) as HITS FROM (
SELECT TAB_ID, SP_ID, COUNT (PR_ID) FROM table 
WHERE TAB_IX = @tab_inx 
AND PR_ID in (select PR_ID from @pr_id)
AND s.NAME IN (SELECT DISTINCT NAME FROM @sp_names)
GROUP BY TAB_ID, SP_ID) AS DUMMY
GROUP BY TAB_ID

问题在于性能，因为添加这个额外的GROUP BY操作看起来非常痛苦。

你有任何改进查询的想法吗？

提前感谢:)

sql

sql-server

group-by

sql-tuning

回答 1

Stack Overflow用户

发布于 2013-02-20 17:45:05

我认为，在原始查询中指定要计算DISTINCT SP_ID的数量将会起到作用

SELECT TAB_ID, COUNT (DISTINCT SP_ID) as HITS FROM table t
INNER JOIN table_sp s on t.SP_ID = s.ID
WHERE TAB_IX = @tab_inx 
AND PR_ID IN (SELECT PR_ID FROM @pr_id)
AND s.NAME IN (SELECT DISTINCT NAME FROM @sp_names)  
GROUP BY TAB_ID

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/14976567

复制

相似问题

问SQL -避免额外的GROUP BY (并提高查询性能)
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问SQL -避免额外的GROUP BY (并提高查询性能)EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问SQL -避免额外的GROUP BY (并提高查询性能)
EN