我有一个表(MainTable
),其中有超过600,000条记录。它通过父/子类型关系中的第二个表(JoinTable
)连接到自己:
SELECT Child.ID, Parent.ID
FROM MainTable
AS Child
JOIN JoinTable
ON Child.ID = JoinTable.ID
JOIN MainTable
AS Parent
ON Parent.ID = JoinTable.ParentID
AND Parent.SomeOtherData = Child.SomeOtherData
我知道每个子记录都有一个父记录,并且JoinTable中的数据是精确的。
当我运行这个查询时,它确实需要几分钟才能运行。但是,如果我使用Left join连接到父节点,则运行时间不到1秒:
SELECT Child.ID, Parent.ID
FROM MainTable
AS Child
JOIN JoinTable
ON Child.ID = JoinTable.ID
LEFT JOIN MainTable
AS Parent
ON Parent.ID = JoinTable.ParentID
AND Parent.SomeOtherData = Child.SomeOtherData
WHERE ...[some info to make sure we don't select parent records in the child dataset]...
我理解INNER JOIN
和LEFT JOIN
在结果上的区别。在这种情况下,它返回的结果完全相同,因为每个子级都有一个父级。如果我让这两个查询运行,我可以比较数据集,它们是完全相同的。
为什么LEFT JOIN
比INNER JOIN
快这么多?
UPDATE检查了查询计划,当使用内部联接时,它从父数据集开始。当执行左连接时,它从子数据集开始。
它使用的索引都是相同的。
我可以强制它总是从孩子开始吗?使用左连接是可行的,只是感觉不对劲。
这里以前也问过类似的问题,但似乎没有人回答我的问题。
例如,在INNER JOIN vs LEFT JOIN performance in SQL Server中选择的答案是左连接总是比内连接慢。这个论点是有道理的,但这不是我所看到的。
发布于 2013-06-14 12:29:49
试试这个吧。同样的结果,不同的方法:
SELECT c.ID, p.ID
FROM
(SELECT Child.ID, JoinTable.ParentID
FROM MainTable
AS Child
JOIN JoinTable
ON Child.ID = JoinTable.ID) AS c
INNER JOIN
(SELECT Parent.ID, JoinTable.ID
FROM MainTable
AS Parent
JOIN JoinTable
ON Parent.ID = JoinTable.ParentID
AND Parent.SomeOtherData = Child.SomeOtherData) AS p
ON c.ParentID = p.ID
如果没有帮助,可以使用cte:
;WITH cte AS
(SELECT Child.ID, JoinTable.ParentID
FROM MainTable
AS Child
JOIN JoinTable
ON Child.ID = JoinTable.ID)
SELECT cte.ID, Parent.ID
FROM cte INNER JOIN
MainTable
AS Parent
ON Parent.ID = cte.ParentID
AND Parent.SomeOtherData = cte.SomeOtherData
https://stackoverflow.com/questions/17100819
复制相似问题