数据库：相关子查询的含义是啥？这道题很困惑，不知为啥要这么写，这是为啥啊？

羽毛球技术 | 体育赛事 | 英文歌曲 | 住宅风水 | 用户界面设计师 | 六爻 | 书籍改编电影 | 德国足球甲级联赛 | 欧美明星 | PLC | 中国足球 | aj1 | 国家队 | 拜仁慕尼黑足球俱乐部 | 小说创作 | 配音 | iOS应用 | NBA 2K | 古典音乐 | 面相 | 火影忍者 | 武汉大学 | 土拨鼠 | 营销策划 | 秦时明月之天行九歌 | 设计师 | 巴塞罗那足球俱乐部 | 尤文图斯 | 实况足球（游戏） | 少帅 | 罗玉凤 | 比利时 | 跑鞋 | 冷知识 | 肖战 | 李元胜 | 古琴 | 按键精灵 | 罗兰 | 徐波 | 激光手术 | 角色扮演 | 关晓彤 | 微电影 | safari | 北京国安 | 古汉语 | 曼彻斯特联 | 玄幻小说 | 科幻小说 | 双眼皮手术 | 主题曲 | 年会 | 检测仪 | 徒步 | 互联网公司 | 百度输入法 | 镜头 | 宜昌市 | 自拍 | 金蝶 | 电子烟 | 网站建设 | 广播体操 | 文身 | nba篮球 | 索尼(sony) | 天体物理学 | 痛风 | 象棋 | 牛皮癣 | 皮肤护理 | 周星驰（人物） | 试管婴儿 | 亚足联亚洲杯（AFC Asian Cup） | 健美 | 美术生 | 迅雷（软件） | 战斗机 | 穿越小说 | 张璐 | 姓氏 | 诸葛亮 | 后宫·甄嬛传（书籍） | 虎牙直播 | snh48 | 阿迪达斯 | 投影仪 | 组装机 | 微信群 | 阿迪达斯(adidas) | 网球王子 | 分子生物学 | 耽美 | 武磊 | 婚礼 | 表演 | 中国武术 | 动画电影 | Air Jordan | 张子枫 | 免费软件 | 相声演员 | 摩羯座 | 宿舍 | ansys | 法国足球甲级联赛 | 户外 | 剧场版 | 杨凡 | 科幻电影 | galgame | 融资 | 关节炎 | NBA季后赛 | 神话 | 王力宏（人物） | 建模 | 计算机病毒 | 广州恒大淘宝足球俱乐部 | 北京奥运会 | 电脑电源 | 百度翻译 | 字幕 | 讯飞输入法 | 海关 | 易烊千玺 | 深度学习 | 编辑器 | 澳门特别行政区 | 直播 | 流氓软件 | 事故 | 大片 | 李景亮 | 郭富城 | 日语歌曲 | 卡牌游戏 | 小品 | 东京 | 花卉 | 音乐剧 | 互联网创业 | 占卜 | 羽毛球拍 | 婆媳关系 | 日本动画 | 巴黎 | 拳击比赛 | 东南亚 | 足球经理（FM）（游戏） | youtube | 胡歌（演员） | 地铁跑酷 | 植发 | 张继科 | 三国 | 用户界面 | 演技 | 百度竞价 | 青梅竹马 | 移动硬盘 | 韩晓鹏 | 马龙 | 瘦腿 | 宠物医疗 | 巨蟹座 | 徐峥 | 天蝎座 | 胸肌 | 赵丽颖（演员） | adidas阿迪达斯 | 低音炮 | 星际争霸（游戏） | 豆瓣电影 | 微信开放平台 | 手绘 | 吉他学习 | 江苏卫视 | 模特 | 创意 | 团队管理 | 奢侈品 | 王源 | TANK | 笛子 | 偶像 | 莱斯特城 | 维生素 | 新百伦 | 国际物流 | 前女友 | 李小龙 | 华语流行音乐 | 猎头公司 | crm | 搏击项目 | 网站运营 | 鼻炎 | 篮球游戏 |

你的位置：网站首页 >> 频道首页 >>电脑网络 >>数据库：相关子查询的含义是啥？这道题很困惑，不知为啥要这么写，这是为啥啊？

数据库：相关子查询的含义是啥？这道题很困惑，不知为啥要这么写，这是为啥啊？

来源：蜘蛛抓取(WebSpider) 时间：2016-01-15 04:08 标签：

前面我们的几篇文章介绍了一系列关于运算符的介绍，以及各个运算符的优化方式和技巧。其中涵盖：查看执行计划的方式、几种数据集常用的连接方式、联合运算符方式、并行运算符等一系列的我们常见的运算符。有兴趣的童鞋可以点击查看。
本篇我们介绍关于子查询语句的一系列内容，子查询一般是我们形成复杂查询的一些基础性操作，所以关于子查询的应用方式就非常重要。
废话少说，开始本篇的正题。
数据库版本为SQL Server2008R2，利用微软的一个更简洁的案例库（Northwind）进行分析。
一、独立的子查询方式
所谓的独立的子查询方式，就是说子查询和主查询没有相关性，这样带来的好处就是子查询不依赖于外部查询，所以可以独立外部查询而被评估，形成自己的执行计划执行。
SELECT O1.OrderID,O1.Freight
FROM Orders O1
WHERE O1.Freight&
SELECT AVG(O2.Freight)
FROM Orders O2
这句SQL执行的目标是查询订单中运费大于平均运费数的订单。
这里提取平均运费的子句就是一个完全独立的子查询，完全不依赖主查询而独立执行。同时这里我们这里利用利用一个标量计算（AVG），因此正好返回一行。
查看一下该语句的查询计划：
这个查询计划没啥好介绍的，关于子查询的执行计划形成可以参照我的第二篇：
不过这里需要提示一下就是，关于流聚合和计算标量形成的结果值（AVG）只包含一个结果值，所以该语句能正常的执行。
我们再来看另外一种情况
SELECT O.OrderID
FROM Orders O
WHERE O.CustomerID=
SELECT C.CustomerID
FROM Customers C
WHERE C.ContactName=N'Maria Anders'
该语句的也是获取名字为'Maria Anders'的顾客有多少订单。这句T-SQL语句能否执行的前提是在顾客表里存不存在同名的&'Maria Anders'&顾客，如果存在同名情况，该语句就不能正确执行，而如果恰巧只有一名顾客为'Maria Anders'，则能正常执行。
我们来分析一下对于这种执行的时候才能判断能否正确执行的SQL Server如何判断的
在这里出现了一个新的运算符，名字是：断言。我们用文本执行计划来查看一下，这个运算符的主要功能是什么
经过上面的分析，我们已经分析出了上面的&断言&运算符的作用，因为我们的子查询语句不能保证返回的结果为一行，所以，这里引入了一个断言运算符来做判断。
所以，断言的作用就是根据下文的条件，判断子查询句的查询结果是否满足主语句的查询要求。
如果，断言发现子语句不满足，就会直接报错，比如上面的Expr1005&1
并且，断言运算符还经常用来检测其它条件是否满足，比如：约束条件、参数类型、值长度等。
其实，这里断言要解决的问题就是判断我们的筛选条件中ContactName中的值是否存在重复值的，对于这种判断相对性能消耗还是比较小的，有时候对于别的复杂的断言操作需要消耗大量资源，所以我们就可以根据适当情况情况避免断言操作。
比如，上面的语句我们可以明确的告诉SQL Server在表Customers中ContactName列就不存在重复值，它就不需要断言了。我们在上面建立一个：唯一、非聚集索引实现
CREATE UNIQUE INDEX ContactNameIndex ON Customers(ContactName)
SELECT O.OrderID
FROM Orders O
WHERE O.CustomerID=
SELECT C.CustomerID
FROM Customers C
WHERE C.ContactName=N'Maria Anders'
drop index Customers.ContactNameIndex
经过我们唯一非聚集索引的提示，SQL Server已经明确的知道我们的子查询语句不会返回多行的情况，所以就去掉了断言操作。
二、相关的子查询方式
相比上面的独立子查询方式，这里的相关的子查询方式相对复杂点，就是我们的子查询依赖于主查询的的结果，对于这种子查询就不能单独执行。
我们来看个这样的子查询例子
SELECT O1.OrderID
FROM Orders O1
WHERE O1.Freight&
SELECT AVG(O2.Freight)
FROM Orders O2
WHERE O2.OrderDate&O1.OrderDate
这个语句就是返回之前订单中运费量大于平均值的顶点编号。
语句很简单的逻辑，但是这里面的子查询就依赖于主查询的结果项，筛选条件中&WHERE O2.OrderDate&O1.OrderDate，所以这个子查询就不能独立运行。
我们来看一下这个语句的执行计划
这里的查询计划有出现了一个新的运算符：索引假脱机。
其实，关于索引假脱机的作用主要是用于子查询的独立运行，因为我们知道这里的子查询的查询条件是依赖于主查询的，所以，这里想运行的话就的先提前获取出主查询的结果项，而这里获取的主查询的结果项需要一个中间表来暂存，这里暂存的工具就是：(索引池)Index Spool，而对这个索引池的操作，比如：新建、增加等操作就是上面我们所标示的&索引假脱机&了。
索引假脱机分为两种：Eager Spool和Lazy Spool，其实简单点讲就是需不需要立刻将结果存入Index Spool里面，还是通过延迟操作。
而这里形成的索引池（Index Spool）是存放于系统的临时库Tempdb中。
我们通过文本查询计划，来分析下两个索引假脱机里面的值是什么
经过上面的分析，我们已经看到了，里面的Eager Spool是和主查询比较形成的结果值，因为这个必须要及时的形成，以便于子查询的进行，所以它的类型为Eager Spool，
而子查询外面的那个Index Spool为Lazy Spool，这个结果项的保存不需要那么及时了，这个保存的就是子查询的形成的结果项了，就是相对每个订单运费的平均值。
我上面的分析，希望各位看官能看懂了。
其实，关于这个Index Spool的设计的目的，完全为了就是提升性能，因为我们知道上面的查询语句每个子查询的进行，都必须回调主查询的结果，所以为了避免每次都回调，就采用了Index Spool进行暂存，而这个Index Spool存储的位置就是Tempdb，所以Tempdb运行的快慢直接关乎这种查询语句的性能。
这也是我们为什么强调大并发的数据库搭建，建议将Tempdb库单独存放于高性能的硬件环境中。
晒晒联机丛书中关于假脱机数据运算符官方介绍：
Index Spool&物理运算符在&Argument&列中包含 SEEK:() 谓词。Index Spool&运算符扫描其输入行，将每行的副本放置在隐藏的假脱机文件（存储在&tempdb&数据库中且只在查询的生存期内存在）中，并为这些行创建非聚集索引。这样可以使用索引的查找功能来仅输出那些满足 SEEK:() 谓词的行。
如果重绕该运算符（例如通过&Nested Loops&运算符重绕），但不需要任何重新绑定，则将使用假脱机数据，而不用重新扫描输入。
跟索引脱机类似的还有一个相似的运算符：表脱机，其功能类似，表脱机存储的应该是键值列，而表脱机则是存储的是多列数据了。
SELECT O1.OrderID,O1.Freight
FROM Orders O1
WHERE O1.Freight&
SELECT AVG(O2.Freight)
FROM Orders O2
WHERE O2.CustomerID=O1.CustomerID
这个查询和上面的类似，只不过是查询的同一个客户加入的超过所有订单运费平均值的订单。
此语句同样不是独立的子查询语句，每个子查询的结果的形成都需要依赖主查询的结果项，为了加快速度，提升性能，SQL Server会将主表查询的的结果项暂存到一张临时表中，这个表就被称为表脱机
我们来看这句话的执行计划：
这里就用到了一个表脱机的运算符，这个运算符的作用就是用来暂存后面扫描获取的结果集合，用于下面的子查询的应用
这个表脱机形成的结果项也是存储到临时库Tempdb中，所以它的应用和前面提到的索引脱机类似。
上面的执行计划中，还提到了一个新的运算符：段（Segment）
这个运算符的解释是：Segment&既是一个物理运算符，也是一个逻辑运算符。它基于一个或多个列的值将输入集划分成多个段。这些列显示为&Segment&运算符中的参数。然后运算符每次输出一个段。
其实作用就是将结果进行汇总整理，将相同值汇聚到一起，跟排序一样，只不过这里可以对多列值进行汇聚。
我们再来看一个例子，加深一下关于段运算的作用
SELECT CustomerID,O1.OrderID,O1.Freight
FROM Orders O1
WHERE O1.Freight=
SELECT MAX(O2.Freight)
FROM Orders O2
WHERE O2.CustomerID=O1.CustomerID
这个语句查询的是：每个顾客所产生的最大运费的订单数据。
以上语句，如果理解起来有难度，我们可以变通以下的相同逻辑的T-SQL语句，相同的逻辑
SELECT O1.CustomerID,O1.OrderID,O1.Freight
FROM Orders O1
INNER JOIN
SELECT CustomerID,max(Freight) Freight
FROM Orders
GROUP BY CustomerID
ON O1.CustomerID=O2.CustomerID
AND O1.Freight=O2.Freight
先根据客户编号分组，然后获取出最大的运费项，再关联主表获取订单信息。
以上两种语句生成的相同的查询计划：
这里我们来解释一下，SQL Server的强大之处，也是段运算符使用的最佳方式。
本来这句话要实现，按照逻辑需要有一个嵌套循环连接，参照上面的方式，使用表脱机的方式进行数据的获取。
但是，我们这句话获取的结果项是每个顾客的最大运费的订单明细项，而且CustomerID列作为输出项，所以这里采用了，先按照运费列（Freight）排序，
然后采用段运算符进行将每个顾客相同的数据汇聚到一起，然后再输出每个顾客的前一列（TOP 1）获取的就是最每个顾客的运费最大的订单项。
省去了任何的表假脱机、索引假脱机、关联连接等一系列复杂的操作。
SQL Server看来这种智能化的操作还是挺强的。
我们再来分析SQL Server关于子查询这块的智能特性，因为经过上面的分析通过对比，相关的子查询语句在运行时需要更多的消耗：
1、有时候需要通过索引假脱机（Index Spool）、表脱机（Table Spool）进行中间结果项的暂存，而这一过程的中间项需要创建、增加、删除、销毁等操作都需要消耗大量的内存和CPU
2、关于相关子查询中以上提到的中间项的形成都是位于Tempdb临时库中，有时候会增大Tempdb的空间，增加Tempdb库的消耗、页争用等问题。
所以，要避免上面的问题，最好的方式是避免使用相关子查询，尽量使用独立子查询进行操作。
当然，SQL Server同样提供了自动转换的功能，智能的去分析语句，避免相关的子查询操作进行：
来看一个稍差的写法：
SELECT o.OrderID
FROM Orders O
WHERE EXISTS
SELECT c.CustomerID
Customers C
WHERE C.City=N'Londom' AND C.CustomerID=O.CustomerID
上面的语句，我们写的是相关的子查询操作，但是在执行计划中形成的确实独立的子查询，这样从而避免相关的子查询所带来的性能消耗。
其实上面语句，相对好的写法是如下
SELECT o.OrderID
FROM Orders O
WHERE O.CustomerID IN
SELECT c.CustomerID
Customers C
WHERE C.City=N'Londom'
这样所形成的就是完全独立的子查询，这也是SQL Server要执行的意图。所以这个语句形成的查询计划是和上面的查询计划一样。
这里的优化全部得益于SQL Server的智能化。
但是我们在写语句的时候，需要自己了解，掌握好，这样才能写出高效的T-SQL语句。
微软联机丛书
参照书籍《SQL.Server.2005.技术内幕》系列
本篇篇幅有点长，但是介绍的子查询内容也还不是很全，后续慢慢的补充上，我们写的SQL语句中很多都涉及到子查询，所以这块应用还是挺普遍的。到本篇文章关于日常调优的T-SQL中的查询语句经常用到的一些运算符基本介绍全了，当然，还有一些别的增删改一系列的运算符，这些日常生活中我们一般不采用查询计划调优，后续我们的文章会将这些运算符也添加上，以供参考之用。
在完成本系列关于查询计划相关的调优之后，我打算将数据库有关统计信息这块也做一个详细的分析介绍。因为统计信息是支撑SQL Server评估最优执行计划的最重要的决策点，
所以统计信息的重要性不言而喻。有兴趣的童鞋可以提前关注。
关于SQL Server性能调优的内容涉及面很广，后续文章中依次展开分析。
有问题可以留言或者私信，随时恭候有兴趣的童鞋加入SQL SERVER的深入研究。共同学习，一起进步。
文章最后给出上几篇的连接，看来有必要整理一篇目录了.....
如果您看了本篇博客,觉得对您有所收获，请不要吝啬您的&推荐&。
阅读(...) 评论()期末复习题里面碰到了SQL查询有关相关子查询的内容，经过网上各种资料各种看，下面整理于此。
我们先看下面一道题。
建表格如下：
查询：给出被所有学生借阅过的图书类别（类别，catname），注意类别为c1的显示为“计算机”，其它类别显示“其他”。
select case catid when 'c1' then '计算机' else '其它' end as 类别,catname from category where not exists(
select stuid from student where not exists(
select stuid from borrow,book
where borrow.bookid=book.bookid and book.catid=category.catid
and student.stuid=borrow.stuid
要理解这个查询语句，我们考察以下几个问题：
&&&&&& 1. exists子查询的逻辑：
&&&&&&&& 各种文字版网上到处都有，这里就简单拿高级语言伪代码整理一下：
SELECT COLUMN
FROM TABLE
WHERE EXISTS(CONDITION);
IF(CONDITION != NULL)
THEN ANSWER += COLUMN
ELSE CONTINUE;
即，当EXISTS子查询结果非空，则当前COLUMN被选择出来，否则不选中。NOT EXISTS反之。
&&&&&& 2. 相关子查询：相关子查询的执行依赖于外部查询。多数情况下是子查询的WHERE子句中引用了外部查询表。执行过程：
（1）从外层查询中取出一个元组，将元组相关的列值传给内层查询。
（2）执行内层查询，得到子查询操作的值。
（3）外查询根据子查询返回的结果或结果集得到满足条件的行
（4）然后外层查询取出下一个元组重复做步骤1-3，直到外层的元组全部处理完毕。
&&&&&&&& 以上面的查询语句为例。我们知道，在select catid的过程中要遍历所有catid，看哪个是符合条件的，才将其输出，因此我们可以将这个过程看作一个循环，每一个循环catid分别等于c1. c2. c3. c4。由于在子查询中，category表格是在父查询中引入的（这叫做相关子查询），因此子查询中的catid与父查询中catid的值是一致的，即在第一次循环，子查询变为：
select stuid from student where not exists(
select stuid from borrow,book
where borrow.bookid=book.bookid and book.catid=‘&strong&&span style=&color:#ff0000;&&c1&/span&&/strong&’
and student.stuid=borrow.stuid
同理，在这个查询的子查询中，student.stuid也随上层的stuid变化，即最内层查询在一开始实际上是：
select stuid from borrow,book
where borrow.bookid=book.bookid and book.catid=‘&strong&&span style=&color:#ff0000;&&c1&/span&&/strong&’
&span style=&white-space:pre&& &/span&and &strong&&span style=&color:#ff0000;&&&/span&&/strong&=borrow.stuid
下面我们分析这个答案的运行过程。
&&&&&&&& 首先最内层子查询固定category.catid= ‘c1’，然后连接四个表格，分别判断每个学生是否在表格中。如果在表格中，说明该学生借阅了c1类书籍，该子查询非空，否则为空。
&&&&&&&& 接下来看次内层子查询，当最内层子查询为空，该学生没有借阅当前类别图书，则次内层子查询将当前学生学好号stuid加入答案集中，即没有借阅当前类别图书的学生集合。
&&&&&&&& 最后是外层查询，当次内层查询为空，即不存在没有借阅当前类别图书的学生时，也就是当前图书类别被所有学生借阅过，那么这个类别就被加入结果集中。
好了上面这道题分析完成后我们换一道题试试正向的解决思路：
PASCAL语言
查询选修了全部课程的学生姓名？
解决思路如下
select Sname
from Student
where(选修了全部课程)
select Sname
from Student
where not exists
select Cno
from Course
where(学生没有选修该门课程)
即此处最内层查询需要判断该学生是否选修该门课程。考虑到not exists的逻辑，我们可以将内层循环这么写：
select Sname
from Student
where not exists
select Cno
from Course
where not exists
select Cno
o = o and SC.Sno = Student.Sno
&span style=&white-space:pre&& &/span&)
练习：至少选修了学生选修的全部课程的学生号码？
* 以上用户言论只代表其个人观点，不代表CSDN网站的观点或立场
访问：226次
排名：千里之外大学计算机数据库练习题_百度文库
两大类热门资源免费畅读
续费一年阅读会员，立省24元！
大学计算机数据库练习题
上传于||暂无简介
阅读已结束，如果下载本文需要使用
想免费下载本文？
你可能喜欢您所在位置： &
&nbsp&&nbsp&nbsp&&nbsp
图数据库中的子查询算法研.pdf177页
本文档一共被下载：
次 ,您可全文免费在线阅读后下载本文档。
文档加载中...广告还剩秒
需要金币：280 &&
图数据库中的子查询算法研
你可能关注的文档：
··········
··········
正在加载中，请稍后...

数据库：相关子查询的含义是啥？这道题很困惑，不知为啥要这么写，这是为啥啊？

我要回帖

随机推荐