【T-SQL基础】02.联接查询

概述:

本系列【T-SQL基础】主要是针对T-SQL基础的总结。

本篇主要是对多表查询基础的总结。

查询语句的FROM字句在逻辑上是第一条要处理的字句,在FROM字句内可以用表运算符对输入的表进行操作。

SQL Server 2008支持四中表运算符:JOIN/APPLY/PIVOT/UNPIVOT

一、交叉联接

1.什么是交叉联接

(1)对输入的两个表进行操作,把它们联接起来,生成二者的笛卡儿积。

(2)将一个输入表的每行与另一个表的所有行进行匹配。

(3)如果一个表有m行,而另一个表有n行,将得到m*n的结果集。

2.语法

先创建两张表A,C,如下图所示

(1)ANSI SQL-92语法

下面的查询是对A表和C表进行交叉联接查询

SELECT A.a,C.c FROM A

CROSS JOIN C

因为A表有4行,C表有5行,所以这个查询会生成一个包含4*5=20行的数据的结果集。

使用ANSI SQL-92语法,需要在参与联接的两个表之间使用“Cross JOIN”关键字

(2)ANSI SQL-89语法

在FROM的表名之间加个逗号

SELECT A.a,C.c FROM A,C

这两种语法在逻辑上和性能上都没有区别。

3.自交叉联接

对同一个表进行联接,就是自联接。交叉联接、内联接、外联接都支持自联接。

SELECT A1.a,A2.a FROM A AS A1
CROSS JOIN A AS A2

A表有4行,查询会生成一个包含4*4=16行的数据的结果集

在自联接中,必须为表起别名。如果不为表指定别名,联接结果中的列名就会有歧义。

比如在本例中,别名为A1,A2。

二、内联接

1.什么是内联接

对两个输入表进行笛卡尔积,然后根据指定的谓词对结果行进行过滤。

2.语法

(1)ANSI SQL-92语法

  a.在两个表名之间指定INNER JOIN关键字

  b.INNER关键字可选,因为内联接是默认的联接方式

  c.对行进行过滤的谓词是在一个称为ON字句中指定的,该谓词也称为联接条件

例如查询A表和C表执行内联接运算,根据谓词条件A.id=C.id对表A和表B进行匹配:

SELECT  A.id ,
        A.a ,
        C.id ,
        C.c
FROM    dbo.A
        INNER JOIN C ON C.id = A.id

怎么理解内联接:

  理解内联接最容易的方法是认为A表中每一行同C表中的所有行进行比较,如果A表中的id和C表中的id相等,则匹配成功。

  另外一种更正式的方法是在关系代数的基础上来考虑内联接,联接运算首先对两个表求笛卡尔积(4行A记录*5行C记录=20行记录),然后根据条件C.id=A.id对行进行过滤,最终返回16行。

注意:

  ON字句与WHERE和HAVING字句类似,ON字句也只返回令谓词结果为TRUE的行,而不会返回令为此计算结果为FALSE或UNKNOW的行。

(2)ANSI SQL-89语法

和交叉联接类似,内联接可以在表名之间用“,”来表示联接,然后用WHERE字句中定义联接条件。

SELECT  A.id ,
        A.a ,
        C.id ,
        C.c

FROM    dbo.A ,
        dbo.C
WHERE   A.id = C.id

内联接的这两种语法执行结果和性能是一样的,但是推荐是用ANSI SQL-92语法。因为ANSI SQL-92语法更安全。

原因有两点:

  a.因为如果用内联接查询,但是忘了写ON条件,则语法分析器会报错,执行无效;

  b.使用ANSI SQL-89标准,有可能忘了WHERE字句中的联接,但是语法分析器不会报错,且执行成功。

对于交叉联接来说,也是推荐使用ANSI SQL-92语法。

原因有两点:

  a.保持一致,统一使用ANSI SQL-92语法

  b.如果开发人员本来是想用ANSI SQL-89语法来写一个内联接查询,却又忘了写WHERE字句中的联接条件,则这段SQL的联接类型和交叉联接是一样的。另外的开发人员再来看的时候并不能判断前面的开发人员到底是想内联接查询还是交叉联接。

3.特殊的联接实例

(1)组合联接

组合联接就是联接条件涉及联接两边的多个列的查询。当需要根据主键-外键关系来联接两个表而且主外键关系是组合的(即关系基于多个列)时,通常使用组合联接。

如B表定义了一个外键(id1,id2),引用了D表的id1,id2列,现在要写一个主外键关系来联接两个表的查询。

SELECT  *
FROM    B
INNER JOIN D
ON D.id1 = B.id1
AND D.id2 = B.id2

(2)不等联接

联接条件只包含等号运算符,叫做等值联接,联接条件包含除等号以外的其他运算符,叫做不等联接。

SELECT    *
FROM      A
INNER JOIN C
ON dbo.A.id < dbo.C.id

如果使用交叉联接,得到的结果中将包含自偶对(例如,1和1),以及镜像对(例如,1和2、2和1).使用内联接,并在联接条件中指定左边的键值要小于右边的键值,就可以消除这两种没有用的情况。

(3)多表联接

当FROM子句中包含多个表运算符时,表运算符在逻辑上是按从左到右的顺序处理的。

表A和表B进行JOIN关联,得到结果集AB,AB将作为第二个表运算符JOIN的输入,与表C进行JOIN关联,得到结果ABC,以此类推。

所以如果FROM字句包含多个连接,逻辑上只有第一个联接对两个基础表进行操作,而其他联接则将前一个联接的结果作为其左边的输入。

三、外联接

1.什么是外联接

对两张表进行笛卡尔积,ON过滤,添加外部行

2.语法

只有ANSI SQL-92语法

表名之间用

LEFT OUTER JOIN 或

RIGHT OUTER JOIN 或

FULL OUTER JOIN 或

在ON字句中进行过滤

3.外联接基础

(1)LEFT关键字标识左边表的行驶保留的,RIGHT关键字表示右边的行是保留的,FULL关键字则表示左右两边表的行都是保留的。

(2)外联接的第三个逻辑查询处理步骤就是要识别保留表中按照ON条件在另一个表找不到与之匹配的那些行,再把这些行添加到联接的前两个步骤生成的结果表中。

(3)对于来自联接的非保留表的那些列,追加的外部行中的这些列则用NULL作为占位符。

集合A包含两个集合,集合A1和集合A2,集合B包含两个集合,集合B1和集合B2。A和B的交集是A2和B2

A和B进行LEFT OUTER JOIN后,A1和A2都保留,因A1在B中找不到对应的数据,则A1对应的行需要保留,添加到联接的前两个步骤生成的结果表中,而对于非保留表的列,在外部行中则用NULL作为占位符。

例子:

客户的ID和订单的客户ID对Customer表和Orders表进行关联,并返回客户和他们的订单信息。

Customer包含两部分:有订单的客户,没有订单的客户,用左外联接,查询结果返回有订单的客户和没有订单的客户:

SELECT  Cus.custid ,
        o.orderid
FROM    Sales.Customers AS Cus
        LEFT OUTER JOIN Sales.Orders AS O 
        ON Cus.custid = O.custid

我们可以通过下面的查询,查询出没有订单的客户

SELECT  Cus.custid ,
        O.orderid ,
        O.custid ,
        O.orderdate ,
        O.requireddate ,
        O.shippeddate
FROM    Sales.Customers AS Cus
        LEFT OUTER JOIN Sales.Orders AS O ON Cus.custid = O.custid
WHERE   o.custid IS NULL

1.他们的ID分别为22和57。查询结果中这两个客户在Order表中的列都为NULL。

2.从逻辑上说,这两个客户相关的数据行在联接的第二步(基于ON谓词条件的过滤)就被过滤了,而在第三部又把这些行作为外部行添加了进来。

3.如果使用内联接,结果将不会返回这两行。添加这两行后,就可以在结果中保留左边表的所有行。

4.外联接结果可以看作两种,内不行和外部行,内部行是ON字句的条件能在另一边找到匹配的那些行;外部行则是找不到那些行。内联接只返回内不行,而外联接返回内部行和外部行。

5.ON字句中的条件不能最终决定保留表中部分行是否会在结果中出现,当决定哪些行可以匹配非保留表,就在ON字句中指定联接条件。当在生成外部行以后,要应用外部行以后,要应用过滤器,而且希望过滤条件是最终的。就应该在WHERE字句中指定条件。

4.在多表联接中使用外联接

1.对外联接的处理顺序进行调整,可能会得到不同的输出结果,所以不能随意调整它们的顺序。

2.对于任何外联接(左外联接欸、右外联接、和全外联接),如果后面紧跟着一个内联接或右外联接,都会抵消外联接的外部行。前提是,联接条件对来自联接左边的NULL值和联接右边的某些值进行了比较。

四、多表查询-几道SQL查询题

表间关系图

在做下面的题目之前,我们可以先把环境准备好,以下的SQL脚本可以帮助大家创建数据库,创建表,插入数据。

下载脚本文件:TSQLFundamentals2008.zip

1.返回来自美国的客户,并为每个客户返回订单总数和商品交易总数量。

本题是一道外联接查询,需要查询出所有客户(有订单的客户和没有订单的客户)对应的订单总数,然后再与订单详情关联,查询出每个客户对应的所有订单上的所有的商品的交易总数量。

然后筛选出country = 'USA'。为了得到每个客户的订单总数,需要用COUNT(DISTINCT O.orderid)进行统计。

SELECT  C.custid ,
        COUNT(DISTINCT O.orderid) AS numorders ,
        SUM(CASE WHEN qty IS NULL THEN 0 ELSE qty END) AS totalqty

FROM    Sales.Customers AS C
        LEFT OUTER JOIN Sales.Orders AS O ON O.custid = C.custid
        LEFT OUTER JOIN Sales.OrderDetails D ON D.orderid = O.orderid
WHERE   country = 'USA'
GROUP BY C.custid

2.返回客户及其订单信息,包括没有下过任何订单的客户。

SELECT  C.custid ,
        C.companyname ,
        O.orderid ,
        O.orderdate
FROM    Sales.Customers AS C
        LEFT OUTER JOIN Sales.Orders AS O 
        ON O.custid = C.custid

3.返回在2007年2月12日下过订单的客户,以及他们的订单。同时也返回在2007年2月12日没有下过订单的客户。

这题主要考察在联接查询中,ON和WHERE的用法。

(1)订单日期的过滤过滤条件必须出现在ON字句,而不是WHERE字句中。WHERE过滤条件是在外部行被添加以后才被应用的,而且是最终的。

(2)订单的日期的过滤条件只是用于决定是否匹配,但不是决定客户行的最终条件。

SELECT  C.custid ,
        C.companyname ,
        O.orderid ,
        O.orderdate
FROM    Sales.Customers AS C
        LEFT OUTER JOIN Sales.Orders AS O
        ON O.custid = C.custid
        AND O.orderdate = '20070212'

参考资料:

《SQL2008技术内幕:T-SQL语言基础》

作  者: Jackson0714 出  处:http://www.cnblogs.com/jackson0714/ 关于作者:专注于微软平台的项目开发。如有问题或建议,请多多赐教! 版权声明:本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文链接。 特此声明:所有评论和私信都会在第一时间回复。也欢迎园子的大大们指正错误,共同进步。或者直接私信我 声援博主:您的鼓励是作者坚持原创和持续写作的最大动力!

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏简书专栏

mysql必知必会2

语法:delete from {1} where {2} 第一对大括号替换为表名,第二对大括号替换为查询条件。 注意:删除语句一定要写删除条件,否则整张表删...

13820
来自专栏熊二哥

那些年我们写过的T-SQL(上篇)

在当今这个多种不同数据库混用,各种不同语言不同框架融合的年代(一切为了降低成本并高效的提供服务),知识点多如牛毛。虽然大部分SQL脚本可以使用标准SQL来写,但...

216100
来自专栏后端技术探索

分表查询统计的一个具体案例

问题描述 mysql数据库在数据量较大的情况下,对数据表进行水平分表,按照年份,如下:

12310
来自专栏Jackson0714

【T-SQL基础】01.单表查询-几道sql查询题

36490
来自专栏AhDung

【SQL】分配函数一枚[AllotToTable]

像这种分配法我估计在多种场景都有在用,它应该有个名堂的,只是我不知道,还请知道的猿友告知,谢谢。

13810
来自专栏一个爱吃西瓜的程序员

学习SQL【10】-SQL高级处理

所谓高级处理,从用户的角度来讲,就是那些对数值进行排序,计算销售总额等我们熟悉的处理;从SQL的角度来讲,就是近几年才添加的新功能,这些新功能使得SQL的工作范...

40050
来自专栏后端技术探索

分表查询统计的一个具体案例

问题描述 mysql数据库在数据量较大的情况下,对数据表进行水平分表,按照年份,如下:

16110
来自专栏程序猿

使用联接和子查询来查询数据

--Chapter 3 使用联接和子查询来查询数据 --内容提要 go /* (一)、使用联接查询数据 1. 内联接 2. 外联接 3...

30560
来自专栏绿巨人专栏

TypeScript: Week Reflection

15630
来自专栏深度学习

利用RNN和LSTM生成小说题记

一、选取素材 本文选取的小说素材来自17k小说网的一篇小说《两只橙与遠太郎》,手工复制小说中的题记。 小说网址:http://www.17k.com/list/...

56370

扫码关注云+社区

领取腾讯云代金券