关于SQL中CTE（公用表表达式）（Common Table Expression）的总结

一．with as的含义

with as短语，也叫做子查询部分（subquery factoring），可以让你做很多事情，定义一个sql片断，该sql片断会被整个sql语句所用到。有的时候，是为了让sql语句的可读性更高些，也有可能是在union all的不同部分，作为提供数据的部分。

特别对于union all比较有用。因为union all的每个部分可能相同，但是如果每个部分都去执行一遍的话，则成本太高，所以可以使用with as短语，则只要执行一遍即可。如果with as短语所定义的表名被调用两次以上，则优化器会自动将with as短语所获取的数据放入一个temp表里，如果只是被调用一次，则不会。而提示materialize则是强制将with as短语里的数据放入一个全局临时表里。很多查询通过这种方法都可以提高速度。

二．使用方法

先看下面一个嵌套的查询语句：

复制代码代码如下:

select * from person.stateprovince where countryregioncode in

(select countryregioncode from person.countryregion where name like ‘c%’)

上面的查询语句使用了一个子查询。虽然这条sql语句并不复杂，但如果嵌套的层次过多，会使sql语句非常难以阅读和维护。因此，也可以使用表变量的方式来解决这个问题，sql语句如下：

复制代码代码如下:

declare @t table(countryregioncode nvarchar(3))

insert into @t(countryregioncode) (select countryregioncode from person.countryregion where name like ‘c%’)

select * from person.stateprovince where countryregioncode

in (select * from @t)

虽然上面的sql语句要比第一种方式更复杂，但却将子查询放在了表变量@t中，这样做将使sql语句更容易维护，但又会带来另一个问题，就是性能的损失。由于表变量实际上使用了临时表，从而增加了额外的i/o开销，因此，表变量的方式并不太适合数据量大且频繁查询的情况。为此，在sql server 2005中提供了另外一种解决方案，这就是公用表表达式（cte），使用cte，可以使sql语句的可维护性，同时，cte要比表变量的效率高得多。

下面是cte的语法：

复制代码代码如下:

[ with <common_table_expression> [ ,n ] ]

<common_table_expression>::=

expression_name [ ( column_name [ ,n ] ) ]

as

( cte_query_definition )

现在使用cte来解决上面的问题，sql语句如下：

复制代码代码如下:

with

cr as

(

select countryregioncode from person.countryregion where name like ‘c%’

)

select * from person.stateprovince where countryregioncode in (select * from cr)

其中cr是一个公用表表达式，该表达式在使用上与表变量类似，只是sql server 2005在处理公用表表达式的方式上有所不同。

在使用cte时应注意如下几点：

1. cte后面必须直接跟使用cte的sql语句（如select、insert、update等），否则，cte将失效。如下面的sql语句将无法正常使用cte：

复制代码代码如下:

with

cr as

(

select countryregioncode from person.countryregion where name like ‘c%’

)

select * from person.countryregion — 应将这条sql语句去掉

— 使用cte的sql语句应紧跟在相关的cte后面 —

select * from person.stateprovince where countryregioncode in (select * from cr)

2. cte后面也可以跟其他的cte，但只能使用一个with，多个cte中间用逗号（,）分隔，如下面的sql语句所示：

复制代码代码如下:

with

cte1 as

(

select * from table1 where name like ‘abc%’

),

cte2 as

(

select * from table2 where id > 20

),

cte3 as

(

select * from table3 where price < 100

)

select a.* from cte1 a, cte2 b, cte3 c where a.id = b.id and a.id = c.id

3. 如果cte的表达式名称与某个数据表或视图重名，则紧跟在该cte后面的sql语句使用的仍然是cte，当然，后面的sql语句使用的就是数据表或视图了，如下面的sql语句所示：

复制代码代码如下:

— table1是一个实际存在的表

with

table1 as

(

select * from persons where age < 30

)

select * from table1 — 使用了名为table1的公共表表达式

select * from table1 — 使用了名为table1的数据表

4. cte 可以引用自身，也可以引用在同一 with 子句中预先定义的 cte。不允许前向引用。

5. 不能在 cte_query_definition 中使用以下子句：

（1）compute 或 compute by

（2）order by（除非指定了 top 子句）

（3）into

（4）带有查询提示的 option 子句

（5）for xml

（6）for browse

6. 如果将 cte 用在属于批处理的一部分的语句中，那么在它之前的语句必须以分号结尾，如下面的sql所示：

复制代码代码如下:

declare @s nvarchar(3)

set @s = ‘c%’

; — 必须加分号

with

t_tree as

(

select countryregioncode from person.countryregion where name like @s

)

select * from person.stateprovince where countryregioncode in (select * from t_tree)

cte除了可以简化嵌套sql语句外，还可以进行递归调用。

微软从sql2005起引入了cte(common table expression)以强化t-sql。这是一个类似于非持久视图的好东东。

按照msdn介绍

1、公用表表达式 (cte) 可以认为是在单个 select、insert、update、delete 或 create view 语句的执行范围内定义的临时结果集。cte 与派生表类似，具体表现在不存储为对象，并且只在查询期间有效。与派生表的不同之处在于，cte 可自引用，还可在同一查询中引用多次。

cte 可用于：

创建递归查询。有关详细信息，请参阅使用公用表表达式的递归查询。

在不需要常规使用视图时替换视图，也就是说，不必将定义存储在元数据中。

启用按从标量嵌套 select 语句派生的列进行分组，或者按不确定性函数或有外部访问的函数进行分组。

在同一语句中多次引用生成的表。

使用 cte 可以获得提高可读性和轻松维护复杂查询的优点。查询可以分为单独块、简单块、逻辑生成块。之后，这些简单块可用于生成更复杂的临时 cte，直到生成最终结果集。可以在用户定义的例程（如函数、存储过程、触发器或视图）中定义 cte。

2、公用表表达式 (cte) 具有一个重要的优点，那就是能够引用其自身，从而创建递归 cte。递归 cte 是一个重复执行初始 cte 以返回数据子集直到获取完整结果集的公用表表达式。当某个查询引用递归 cte 时，它即被称为递归查询。递归查询通常用于返回分层数据，例如：显示某个组织图中的雇员或物料清单方案（其中父级产品有一个或多个组件，而那些组件可能还有子组件，或者是其他父级产品的组件）中的数据。

递归 cte 可以极大地简化在 select、insert、update、delete 或 create view 语句中运行递归查询所需的代码。在 sql server 的早期版本中，递归查询通常需要使用临时表、游标和逻辑来控制递归步骤流。有关公用表表达式的详细信息，请参阅使用公用表表达式。

这里举例说明如下：

为了描述方便，邀月特地列举了一个常见的自关联table

表结构如下：

表结构

复制代码代码如下:

create table [dbo].[categoryself](

[pkid] [int] identity(1,1) not null,

[c_name] [nvarchar](50) not null,

[c_level] [int] not null,

[c_code] [nvarchar](255) null,

[c_parent] [int] not null,

[inserttime] [datetime] not null,

[insertuser] [nvarchar](50) null,

[updatetime] [datetime] not null,

[updateuser] [nvarchar](50) null,

[sortlevel] [int] not null,

[currstate] [smallint] not null,

[f1] [int] not null,

[f2] [nvarchar](255) null

constraint [pk_objectcategoryself] primary key clustered

(

[pkid] asc

)with (pad_index = off, statistics_norecompute = off, ignore_dup_key = off, allow_row_locks = on, allow_page_locks = on) on [primary]

) on [primary]

再插入一些测试数据

复制代码代码如下:

insert

insert into [categoryself]([c_name],[c_level] ,[c_code],[c_parent] ,[inserttime] ,[insertuser] ,[updatetime] ,[updateuser] ,[sortlevel] ,[currstate] ,[f1] ,[f2])

select ‘分类1′,1,’0′,0,getdate(),’testuser’,dateadd(dd,1,getdate()),’crackuser’,13,0,1,’邀月备注’ union all

select ‘分类2′,1,’0′,0,getdate(),’testuser’,dateadd(dd,78,getdate()),’crackuser’,12,0,1,’邀月备注’ union all

select ‘分类3′,1,’0′,0,getdate(),’testuser’,dateadd(dd,6,getdate()),’crackuser’,10,0,1,’邀月备注’ union all

select ‘分类4′,2,’1′,1,getdate(),’testuser’,dateadd(dd,75,getdate()),’crackuser’,19,0,1,’邀月备注’ union all

select ‘分类5′,2,’2′,2,getdate(),’testuser’,dateadd(dd,3,getdate()),’crackuser’,17,0,1,’邀月备注’ union all

select ‘分类6′,3,’1/4′,4,getdate(),’testuser’,dateadd(dd,4,getdate()),’crackuser’,16,0,1,’邀月备注’ union all

select ‘分类7′,3,’1/4′,4,getdate(),’testuser’,dateadd(dd,5,getdate()),’crackuser’,4,0,1,’邀月备注’ union all

select ‘分类8′,3,’2/5′,5,getdate(),’testuser’,dateadd(dd,6,getdate()),’crackuser’,3,0,1,’邀月备注’ union all

select ‘分类9′,4,’1/4/6′,6,getdate(),’testuser’,dateadd(dd,7,getdate()),’crackuser’,5,0,1,’邀月备注’ union all

select ‘分类10′,4,’1/4/6′,6,getdate(),’testuser’,dateadd(dd,7,getdate()),’crackuser’,63,0,1,’邀月备注’ union all

select ‘分类11′,4,’1/4/6′,6,getdate(),’testuser’,dateadd(dd,8,getdate()),’crackuser’,83,0,1,’邀月备注’ union all

select ‘分类12′,4,’2/5/8′,8,getdate(),’testuser’,dateadd(dd,10,getdate()),’crackuser’,3,0,1,’邀月备注’ union all

select ‘分类13′,4,’2/5/8′,8,getdate(),’testuser’,dateadd(dd,15,getdate()),’crackuser’,1,0,1,’邀月备注’

一个典型的应用场景是：在这个自关联的表中，查询以pkid为2的分类包含所有子分类。也许很多情况下，我们不得不用临时表/表变量/游标等。现在我们有了cte，就简单多了

复制代码代码如下:

ctedemo1

with simplerecursive(c_name, pkid, c_code,c_parent)

as

(select c_name, pkid, c_code,c_parent from categoryself where pkid = 2

union all

select p.c_name, p.pkid, p.c_code,p.c_parent

from categoryself p inner join

simplerecursive a on a.pkid = p.c_parent

)

select sr.c_name as c_name, c.c_name as c_parentname,sr.c_code as c_parentcode

from simplerecursive sr inner join categoryself c

on sr.c_parent=c.pkid

查询结果如下：c_name c_parentname c_parentcode

分类5 分类2 2

分类8 分类5 2/5

分类12 分类8 2/5/8

分类13 分类8 2/5/8

感觉怎么样？如果我只想查询第二层，而不是默认的无限查询下去，

可以在上面的sql后加一个选项 option(maxrecursion 5)，注意5表示到第5层就不往下找了。如果只想找第二层，但实际结果有三层，此时会出错，

msg 530, level 16, state 1, line 1

the statement terminated. the maximum recursion 1 has been exhausted before statement completion.

此时可以通过where条件来解决，而保证不出错，看如下sql语句：

ctedemo2

复制代码代码如下:

with simplerecursive(c_name, pkid, c_code,c_parent,sublevel)

as

(select c_name, pkid, c_code,c_parent,0 from categoryself where pkid = 2

union all

select p.c_name, p.pkid, p.c_code,p.c_parent,sublevel+1

from categoryself p inner join

simplerecursive a on a.pkid = p.c_parent

)

select sr.c_name as c_name, c.c_name as c_parentname,sr.c_code as c_parentcode

from simplerecursive sr inner join categoryself c

on sr.c_parent=c.pkid

where sublevel<=2

查询结果：

c_name c_parentname c_parentcode

分类5 分类2 2

分类8 分类5 2/5

当然，我们不是说cte就是万能的。通过好的表设计也可以某种程度上解决特定的问题。下面用常规的sql实现上面这个需求。

注意：上面表中有一个字段很重要，就是c_code，编码 ,格式如”1/2″，“2/5/8″表示该分类的上级分类是1/2,2/5/8

这样，我们查询就简单多，查询以pkid为2的分类包含所有子分类：

复制代码代码如下:

select c_name as c_name, (select top 1 c_name from categoryself s where c.c_parent=s.pkid) as c_parentname,c_code as c_parentcode

from categoryself c where c_code like ‘2/%’

查询以pkid为2的分类包含所有子分类，且级别不大于3

复制代码代码如下:

select c_name as c_name, (select top 1 c_name from categoryself s where c.c_parent=s.pkid) as c_parentname,c_code as c_parentcode

from categoryself c where c_code like ‘2/%’ and c_level<=3

查询结果同上，略去。这里我们看出，有时候，好的表结构设计相当重要。

邀月于2009.10.23 1:36 完成分享。

有人很关心性能问题。目前没有测试过。稍后会附上百万级测试报告。不过，有两点理解邀月忘了补充：

一、cte其实是面向对象的，运行的基础是clr。一个很好的说明是with查询语句中是区分字段的大小写的。即”c_code”和”c_code”是不一样的，后者会报错。这与普通的sql语句不同。

二、这个应用示例重在简化业务逻辑，即便是性能不佳，但对临时表/表变量/游标等传统处理方式是一种业务层次上的简化或者说是优化。

公用表表达式 (cte) 可以认为是在单个 select、insert、update、delete 或 create view 语句的执行范围内定义的临时结果集。cte 与派生表类似，具体表现在不存储为对象，并且只在查询期间有效。与派生表的不同之处在于，cte 可自引用，还可在同一查询中引用多次。

cte 可用于：

创建递归查询。

在不需要常规使用视图时替换视图，也就是说，不必将定义存储在元数据中。

启用按从标量嵌套 select 语句派生的列进行分组，或者按不确定性函数或有外部访问的函数进行分组。

在同一语句中多次引用生成的表。

使用 cte 可以获得提高可读性和轻松维护复杂查询的优点。查询可以分为单独块、简单块、逻辑生成块。之后，这些简单块可用于生成更复杂的临时 cte，直到生成最终结果集。

可以在用户定义的例程（如函数、存储过程、触发器或视图）中定义 cte。

cte 的结构

cte 由表示 cte 的表达式名称、可选列列表和定义 cte 的查询组成。定义 cte 后，可以在 select、insert、update 或 delete 语句中对其进行引用，就像引用表或视图一样。cte 也可用于 create view 语句，作为定义 select 语句的一部分。

cte 的基本语法结构如下：

with expression_name [ ( column_name [,…n] ) ]

as

( cte_query_definition )

只有在查询定义中为所有结果列都提供了不同的名称时，列名称列表才是可选的。

运行 cte 的语句为：

select <column_list>

from expression_name

示例:

复制代码代码如下:

with s_name as

(

select s.name, sc.c,sc.grade from sql server student as s,sc

where s.s#=sc.s#

)

select * from s_name

在使用cte时应注意如下几点：

1. cte后面必须直接跟使用cte的sql语句（如select、insert、update等），否则，cte将失效。

2. cte后面也可以跟其他的cte，但只能使用一个with，多个cte中间用逗号（,）分隔。

3. 如果cte的表达式名称与某个数据表或视图重名，则紧跟在该cte后面的sql语句使用的仍然是cte，当然，后面的sql语句使用的就是数据表或视图了。

4. cte 可以引用自身（递归查询），也可以引用在同一 with 子句中预先定义的 cte。不允许前向引用。

5. 不能在 cte_query_definition 中使用以下子句：

（1）compute 或 compute by

（2）order by（除非指定了 top 子句）

（3）into

（4）带有查询提示的 option 子句

（5）for xml

（6）for browse

6. 如果将 cte 用在属于批处理的一部分的语句中，那么在它之前的语句必须以分号结尾。

关于SQL中CTE（公用表表达式）（Common Table Expression）的总结

相关推荐