SQL Server 索引基础知识(7)----Indexing for AND-alen88-ChinaUnix博客

Alenalen.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

alen88

博客访问： 1285706
博文数量： 510
博客积分： 20296
博客等级：上将
技术积分： 4680
用户组：普通用户
注册时间： 2007-10-30 03:58

文章分类

全部博文（510）

ORACLE（4）
数据库（113）

16.表变量和临时（1）

15.SQL 索引（0）

14.SQL 优化（1）

13.数据类型（1）

12.SQLCMD（1）

11.TEMPDB数据库（6）

10.表变量和临时（2）

9.学习笔记（2）

8.SQL字符串（1）

7.SQL存储过程（1）

6.SQL函数（9）

5.数据库书籍（0）

4.SQL CASE 用法（3）

3.SQL基础（76）

2.数据库面试题（8）

1.数据库分类目录（1）
文章阅读（2）

1.程序员（2）
C/C++面试题目（4）
C/C++（0）
GCC（4）
C程序设计（22）

关键字详解（2）

结构体（8）

sizeof运算符（6）

运算符（0）

取随机数（2）

数组和指针（0）

内存管理（2）

内存调试（2）
未分配的博文（361）

文章存档

2011年（13）

2010年（92）

2009年（242）

2008年（163）

我的朋友

相关博文

SQL Server 索引基础知识(7)----Indexing for AND

分类：数据库开发技术

2009-01-31 00:13:35

我们通过一个实例来看有And 操作符时候的最常见的一种情况。我们有下面一个表，

CREATE TABLE [dbo].[member](
	[member_no] [dbo].[numeric_id] IDENTITY(1,1) NOT NULL,
	[lastname] [dbo].[shortstring] NOT NULL,
	[firstname] [dbo].[shortstring] NOT NULL,
	[middleinitial] [dbo].[letter] NULL,
	[street] [dbo].[shortstring] NOT NULL,
	[city] [dbo].[shortstring] NOT NULL,
	[state_prov] [dbo].[statecode] NOT NULL,
	[country] [dbo].[countrycode] NOT NULL,
	[mail_code] [dbo].[mailcode] NOT NULL,
	[phone_no] [dbo].[phonenumber] NULL,
	[photograph] [image] NULL,
	[issue_dt] [datetime] NOT NULL   DEFAULT (getdate()),
	[expr_dt] [datetime] NOT NULL  DEFAULT (dateadd(year,1,getdate())),
	[region_no] [dbo].[numeric_id] NOT NULL,
	[corp_no] [dbo].[numeric_id] NULL,
	[prev_balance] [money] NULL   DEFAULT (0),
	[curr_balance] [money] NULL  DEFAULT (0),
	[member_code] [dbo].[status_code] NOT NULL   DEFAULT ('  ')
)

这个表具备下面的四个索引：

索引名	细节	索引的列
member_corporation_link	nonclustered located on PRIMARY	corp_no
member_ident	clustered, unique, primary key located on PRIMARY	member_no
member_region_link	nonclustered located on PRIMARY	region_no
MemberFirstName	nonclustered located on PRIMARY	firstname

当我们执行下面的SQL查询时候，

SELECT m.Member_No, m.FirstName, m.Region_No
FROM dbo.Member AS m
WHERE m.FirstName LIKE 'K%'	
        AND m.Region_No > 6	
        AND m.Member_No < 5000
go

SQL Server 会根据索引方式，优化成下面方式来执行。

select a.Member_No,a.FirstName,b.Region_No
from
(select m.Member_No, m.FirstName from dbo.Member AS m 
where m.FirstName LIKE 'K%' and m.Member_No < 5000) a , 
-- 这个查询可以直接使用 MemberFirstName 非聚集索引，而且这个非聚集索引覆盖了所有查询列
-- 实际执行时，只需要 逻辑读取 3 次

(SELECT m.Member_No, m.Region_No from dbo.Member AS m
where m.Region_No > 6) b

-- 这个查询可以直接使用 member_region_link 非聚集索引，而且这个非聚集索引覆盖了所有查询列
-- 实际执行时，只需要 逻辑读取 10 次

where a.Member_No = b.Member_No

不信，你可以看这两个SQL 的执行计划，以及逻辑读信息，都是一样的。

其实上面的SQL，如果优化成下面的方式，实际的逻辑读消耗也是一样的。为何SQL Server 不会优化成下面的方式。是因为 and 操作符优化的另外一个原则。

1/26 的数据和 1/6 的数据找交集的速度要比 1/52 的数据和 1/3 的数据找交集速度要慢。


select a.Member_No,a.FirstName,b.Region_No
from
(select m.Member_No, m.FirstName from dbo.Member AS m
where m.FirstName LIKE 'K%'    
-- 1/26 数据
) a,

(SELECT m.Member_No, m.Region_No from dbo.Member AS m
where m.Region_No > 6 and m.Member_No < 5000
-- 1/3 * 1/ 2 数据
) b
where a.Member_No = b.Member_No

当然，我们要学习SQL 如何优化的话，就会用到查询语句中的一个功能，指定查询使用哪个索引来进行。

比如下面的查询语句

SELECT m.Member_No, m.FirstName, m.Region_No
FROM dbo.Member AS m WITH (INDEX (0))
WHERE m.FirstName LIKE 'K%'		
        AND m.Region_No > 6		
        AND m.Member_No < 5000
go

SELECT m.Member_No, m.FirstName, m.Region_No
FROM dbo.Member AS m WITH (INDEX (1))
WHERE m.FirstName LIKE 'K%'		
        AND m.Region_No > 6		
        AND m.Member_No < 5000
go
SELECT m.Member_No, m.FirstName, m.Region_No
FROM dbo.Member AS m WITH (INDEX (MemberCovering3))
WHERE m.FirstName LIKE 'K%'		
        AND m.Region_No > 6		
        AND m.Member_No < 5000
go
SELECT m.Member_No, m.FirstName, m.Region_No
FROM dbo.Member AS m WITH (INDEX (MemberFirstName, member_region_link))
WHERE m.FirstName LIKE 'K%'		
        AND m.Region_No > 6		
        AND m.Member_No < 5000
go

这里 Index 计算符可以是 0 ，1，指定的一个或者多个索引名字。对于 0 ，1 的意义如下：

如果存在聚集索引，则 INDEX(0) 强制执行聚集索引扫描，INDEX(1) 强制执行聚集索引扫描或查找（使用性能最高的一种）。
如果不存在聚集索引，则 INDEX(0) 强制执行表扫描，INDEX(1) 被解释为错误。

总结知识点：

简单来说，我们可以这么理解：SQL Server 对于每一条查询语句。会根据实际索引情况（sysindexes 系统表中存储这些信息），分析每种组合可能的成本。然后选择它认为成本最小的一种。作为它实际执行的计划。
成本代价计算的一个主要组成部分是逻辑I/O的数量，特别是对于单表的查询。
AND 操作要满足所有条件，这样，经常会要求对几个数据集作交集。数据集越小，数据集的交集计算越节省成本。

参考资料

本文演示代码下载地址：

阅读(601) | 评论(0) | 转发(0) |

上一篇：SQL Server 索引基础知识(7)----Indexing for AND

下一篇：SQL Server 索引基础知识(8)--- 数据基本格式补充

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6