首页　| 　博文目录　| 　关于我

博客访问： 31085862
博文数量： 2065
博客积分： 10377
博客等级：上将
技术积分： 21525
用户组：普通用户
注册时间： 2008-11-04 17:50

文章分类

全部博文（2065）

创业天下（1）

技术论坛（0）

方案选择（1）
Android开发（0）
开源项目（12）

puppet配置文件管（0）

开源XEN管理工具（0）

在线图片处理（1）

日志分析工具（1）

计费系统（1）

python统计PY源码（2）

JAVA服务提供器（1）

网络工具（1）

Java版杀进程工具（1）

网络爬虫（2）

论坛发帖机设计（1）
Ruby区（3）

CODE（0）

相关资讯（0）

基础教程（3）
面向服务（1）

rest（0）

xml-rpc（1）
运维与开发（8）

应用服务（1）

网上学习笔记（1）

程序员杂志（1）

投稿（0）

架构方面（0）

网络方面（0）

系统管理OS（1）

开发方面（0）

虚拟化方面（0）

存储方面（0）

数据库方面（3）
互联网（33）

天涯论坛（0）

淘宝开放平台（0）

开放平台开发（0）

朱敬（1）

俞强华（1）

盛大（1）

VC（1）

webgame（0）

其它（1）

云计算（1）

移动互联网（1）

CU（1）

互联网产品设计（1）

InfoQ（2）

技术方向（0）

产品设计（1）

关注腾讯（2）

马化腾（0）

腾讯（1）

从技术解读互联网（2）

网店乐（0）

80后粉丝网（1）

点评网（0）

网站盈利（1）

国内一流互联网公（1）

网站运营（2）

技术动态（2）

搜房网（0）

案例公司（0）

新技术探讨（4）

新闻杂谈（1）

马云（1）

人物（0）

反思（0）

行业动态（2）
Window（10）

基本配置（1）

OS安全配置（1）
Flash（14）

应用篇（0）

中级篇（0）

基础篇（14）

flex学习（0）
DOS命令（7）
虚拟技术（3）

开发（0）

学习笔记（0）

XEN（0）

虚拟软件（0）

虚拟化技术（1）

相关知识（1）

相关技术动态（1）

虚拟动态（0）
linux（177）

源码学习（0）

YUM包（2）

相关专题（0）

RedHat认证（0）

shell杂（1）

Linux内核（1）

网络命令（2）

安全（1）

linux工具（2）

bash（0）

工具代码（3）

linux系统学习教（9）

LVS篇（1）

源码整理（11）

装机（5）

linux小技巧（8）

常用配置文件（2）

Ubuntu（1）

系统管理（4）

linux杂（9）

linux学习（13）

linux调优（2）

VI篇（4）

SED与AWK（6）

linux常用命令（43）

防火墙（6）

SHELL学习（10）

脚本学习（1）

鸟哥私房菜专集（6）

DNS学习（7）
其他内容（416）

混迹社会（0）

2011计划（1）

自己的项目（1）

未来之约（1）

工作日志（4）

日记（4）

职场生涯（4）

区域城市（3）

linux认证（0）

CCNA认证（0）

下一代网站（1）

投资自己（1）

当站长（2）

新闻日记（31）

创业专栏（9）

实战（0）

技术（0）

淘宝易货（0）

编码（1）

读书（3）

新浪财经（0）

程序设计（1）

学习（4）

股票软件（1）

读书笔记（3）

积淀（1）

工作（0）

酒文化（0）

茶文化（0）

搜狐财经（0）

第二职业（1）

压力篇（3）

项目进展（2）

木材（0）

家居（0）

传统产业分析（0）

可行性市场分析（1）

寻找市场（1）

互联网创业（2）

时间管理（2）

要做的平台产品（1）

人际交往（1）

项目学习法（3）

营养（5）

IT认证考试（0）

论坛精华（8）

职业规划（16）

创业篇（2）

年计划（0）

年计划（19）

汽车平台（0）

关注地产（0）

平台（0）

外包项目（2）

求职面试（14）

创业立志（5）

股票学习（0）

美食（1）

学习基金理财（2）

我的基金（2）

面试（0）

反省过去（1）

CTO相关资讯（0）

心情日记（28）

工作（4）

专题一（1）

财务（1）

大项目（3）

互联网盈利（8）

整理电子商务站（1）

男人与石头（1）

金融证券（0）

银行基金（11）

未来计划（13）

架构师（6）

社会经验（10）

工作室（11）

职业规划（8）

理财大全（1）

赚钱计划（10）

我的小说（3）

经典励志（24）

学习计划（2）

健康之道（4）

旁征博引（36）

学习心得（17）

编程心得（19）
java框架（55）

数据导入工具（1）

项目学习记录（0）

WEB框架理论（1）

常见异常错误（1）

整理代码（0）

笔记（0）

常用代码（3）

配置（6）

2010学习笔记（7）

专题（0）

Hibernate（0）

dom4j（2）

xsocket框架（1）

Ant开源学习（2）

Spring框架（0）

structs2.0（30）
php学习（198）

认证项目CI（0）

PHP自定义函数（0）

PHP整理笔记（1）

PHP面向对象（1）

UC专题（3）

wordpress（0）

php专题篇（9）

基于CI开源项目（0）

框架学习（1）

PHP缓存（0）

php整理备战（0）

php常用的代码（1）

PHP整理网站（0）

PHP看开源代码（3）

实战经验（2）

PHP制作公司CMS（3）

看实例学习整理（8）

PHP相关资料整理（18）

整理CU文章（23）

CodeIgniter框架（5）

Smarty学习整理（8）

帝国CMS学习区（3）

PHP168学习区（0）

PHP制作网站总结（51）

PHP常用函数整理（30）

PHP实例教程（7）

PHP入门资料（19）
Javascript（86）

ajax代码库（0）

ajax专题（1）

javascript理论（1）

JQuery应用（8）

javascript基础（3）

DEMO（4）

Javascript专题（7）

JQuery插件专题（6）

js常用代码集合（7）

JQuery框架学习（11）

JS解决跨域（0）

JavaScript小项目（1）

JavaScript整理（12）

Prototype框架（0）

ajax学习（14）
安全红客（7）

CODING（4）

网络安全（3）
敏捷开发（0）

技术准备（0）
奋斗领域（12）

分布式操作系统（0）

嵌入式操作系统（0）

Kernel（0）

Linux方向（0）

Linux内核研究（0）

C学习（2）

C代码库（1）

工具函数（0）

专题篇（3）

2010年专题产品篇（0）

UNIX环境高级编程（2）

网络编程相关（0）

数据结构与算法（0）

服务器性能编程（0）

HTTP编程（0）

网络编程（0）

C实现服务器（2）
J2ME学习（2）
WAP开发（0）
软件测试（3）

相关（1）

单元测试（0）

功能测试（0）

性能测试（1）
数据库学习（218）

故障排查经验（1）

2010数据库大会资（2）

相关资料整理（0）

mysql杂（2）

Mysql基础教程（6）

工作经验（1）

架构瓶颈（1）

系统管理员（1）

数据库技术（4）

基础（0）

索引理论（0）

SQL语句理论（2）

理论（2）

架构设计（0）

SQL编程（0）

MSSQL问题解决（2）

MySQLDBA篇（38）

数据库基础理论（8）

常用系统管理（12）

架构之数据库设计（2）

MySQL编程篇（15）

MySQL架构第一步（6）

MYSQL主从软件（6）

MYSQL查询优化篇（36）

MySQL中的文件（9）

MySQL主从配置（6）

MSSQL2000（12）

数据库加程序（2）

MYSQL（34）
兴趣研究（0）

全文检索（0）
IT运维体系（38）

翻译（2）

转载资料（2）

puppet（4）

ZABBIX（0）

mantis-bug管理系（0）

职业（2）

游戏运维（0）

Rsync（3）

rrd（1）

mrtg（0）

certmaster（0）

Func（1）

Cfengine（1）

cacti（2）

nagios（1）

ITIL（0）

规范流程（0）

Remedy（0）

kettle（0）

jpivot（0）

mondrian（0）

开源框架（1）

实践内容（1）

运维经验整理（2）

网上眼界（10）

新技术（0）

相关理论（4）
Erlang（4）

资料整理（4）
开源学习（6）

开源产品使用（1）

其他开源（1）

Memoranda（0）

Drupal专题学习笔（0）

php开源（0）

python开源代码（2）

C开源代码（0）

Shell开源（0）

JAVA开源（1）
Jython学习（0）

Jython入门学习（0）
理论知识（69）

gfs（1）

mfs（0）

分布式文件系统（1）

SNMP（4）

VPN教程（1）

网络教程（1）

存储教程（3）

存储产品（1）

漫谈存储（3）

存储开发（0）

存储技术（1）

存储理论（2）

存储相关（0）

存储（0）

操作系统（0）

软件工程（0）

其它相关（0）

算法（0）

计算机知识（3）

网上资料（8）

CCNA教程（9）

计算机硬件（4）

FastDFS专题（1）

架构之开源篇（0）

架构之硬件（9）

架构之系统（2）

架构之存储篇（3）

架构之网络篇（7）

计算机网络（2）

正则表达式（3）
服务器配置（105）

nginx源码研究（0）

实际案例分享（1）

nginx开发（2）

apache学习笔记（4）

资料介绍（1）

资料使用（0）

CDN（2）

LVS（0）

服务器安全（1）

haproxy（1）

Varnish（0）

squid（1）

编程篇（0）

memcached（2）

nginx整理学习（15）

nginx实战经验（5）

nginx官网资料（4）

FTP服务器（1）

lighttpd（3）

版本控制管理（8）

负载均衡（1）

nginx服务器（8）

服务器集群（1）

IIS服务器（12）

resin服务器（16）

Apache服务器（13）

Tomcat服务器（3）
JSP学习（57）

JSP开发经验之谈（2）

JSP架构设计（1）

JSP基础（1）

JSP专题（3）

J2EE体系（0）

JSP缓存整理（2）

JSP配置文件（3）

JSP实践编程（2）

JSP自定义标签（10）

JSP文本操作（2）

JSP扩展话题（1）

JAVABEAN学习（5）

Servlets学习（12）
XML学习（15）

YAML（0）

SOAP专题（2）

XML基础篇（7）

WebService（0）

JSON（6）
ASP学习（89）

ASP专题整理（5）

vbs教程（4）

JMail整理版（1）

ASP其他（2）

ASP建站整理（9）

ASP整理归档版（22）

ASP工具整理（14）
专题讨论（99）

LDAP（0）

LINUX密码管理（0）

代码优化JOB（2）

CI框架公司培训（1）

理论学习（0）

JSP（1）

内存DB（1）

代码库（1）

HTTP隧道（0）

破解验证码（2）

研究专题（1）

JQuery培训（0）

MySQL架构（3）

培训专题（0）

GAE专题（0）

不懂就学专题（1）

Google APP Engin（0）

ROR框架整理（0）

Hibernate整理（1）

Django培训专题（0）

编程思想篇（1）

8月份研究模拟Htt（1）

HttpClient学习（2）

Java开源版商城（0）

JAVA实现下载器（2）

学习项目制作（0）

PHP（10）

文档编写（1）

WEB服务器（1）

网页爬虫（9）

网络处理老师（1）

好的网站大全（2）

JavaScript代码（6）

CSS样式（0）

Java（17）

Python（24）

ASP（8）
编程工具（13）
JAVA学习（160）

数据库编程（11）

JAVA短信（0）

Java面试题（1）

JAVA日常工具（3）

JAVA新技术（2）

开发思想JAVA版（1）

JAVA小品（1）

SCJP考证（1）

java基础教程（5）

JAVA网络编程（10）

JAVA岗位招聘（5）

JAVA性能监控（3）

JAVA与设计模式（0）

java.lang（1）

系统学习（2）

java.util（7）

Java代码之美（2）

基础学习整理（6）

JAVA高级工程师（11）

高性能架构（2）

专题研究（8）

java.io（1）

SUN官网资料（2）

JAVA缓存（0）

JAVA正则（1）

RMI（1）

JAVA基础（20）

面向接口编程（1）

JAVA编程思想（3）

JAVA操作流文件（9）

JAVAMail专题（2）

JAVA中数据结构（12）

JMS学习（1）
WEB开发（79）

原创架构（1）

架构大讲堂（8）

CSS框架（0）

百度UED团队（2）

前端开发（0）

架构整理（3）

DIV+CSS实例整理（0）

DIV学习笔记（2）

前台学习资料（1）

HTTP理论（19）

COOKIE详细分析（5）

SVG学习篇（10）

WEB页面分析（0）

程序方面（0）

CSS框架（3）

SEO优化（0）

页面编码（2）

HTML学习（18）

div+css（5）
未分配的博文（65）

文章存档

2012年（2）

2011年（19）

2010年（1160）

2009年（969）

2008年（153）

我的朋友

相关博文

聚集索引和非聚集索引[转]

分类：数据库开发技术

2010-02-22 13:38:26

聚集索引的区别

　　聚集索引:物理存储按照索引排序

　　非聚集索引:物理存储不按照索引排序

优势与缺点

聚集索引：插入数据时速度要慢（时间花费在“物理存储的排序”上，也就是首先要找到位置然后插入）,查询数据比非聚集数据的速度快

索引是通过二叉树的数据结构来描述的，我们可以这么理解聚簇索引：索引的叶节点就是数据节点。而非聚簇索引的叶节点仍然是索引节点，只不过有一个指针指向对应的数据块。如下图：

非聚集索引

聚集索引

一、索引块与数据块的区别

大家都知道，索引可以提高检索效率，因为它的二叉树结构以及占用空间小，所以访问速度块。让我们来算一道数学题：如果表中的一条记录在磁盘上占用1000 字节的话，我们对其中10字节的一个字段建立索引，那么该记录对应的索引块的大小只有10字节。我们知道，SQL Server的最小空间分配单元是“页（Page）”，一个页在磁盘上占用8K空间，那么这一个页可以存储上述记录8条，但可以存储索引800条。现在我们要从一个有8000条记录的表中检索符合某个条件的记录，如果没有索引的话，我们可能需要遍历8000条×1000字节/8K字节=1000个页面才能够找到结果。如果在检索字段上有上述索引的话，那么我们可以在8000条×10字节/8K字节=10个页面中就检索到满足条件的索引块，然后根据索引块上的指针逐一找到结果数据块，这样IO访问量要少的多。

二、索引优化技术

是不是有索引就一定检索的快呢？答案是否。有些时候用索引还不如不用索引快。比如说我们要检索上述表中的所有记录，如果不用索引，需要访问8000条 ×1000 字节/8K字节=1000个页面，如果使用索引的话，首先检索索引，访问8000条×10字节/8K字节=10个页面得到索引检索结果，再根据索引检索结果去对应数据页面，由于是检索所有数据，所以需要再访问8000条×1000字节/8K字节=1000个页面将全部数据读取出来，一共访问了1010个页面，这显然不如不用索引快。

SQL Server内部有一套完整的数据检索优化技术，在上述情况下，SQL Server的查询计划（Search Plan）会自动使用表扫描的方式检索数据而不会使用任何索引。那么SQL Server是怎么知道什么时候用索引，什么时候不用索引的呢？SQL Server除了日常维护数据信息外，还维护着数据统计信息，下图是数据库属性页面的一个截图：

聚簇索引与非聚簇索引的本质区别到底是什么？什么时候用聚簇索引，什么时候用非聚簇索引？

这是一个很复杂的问题，很难用三言两语说清楚。我在这里从SQL Server索引优化查询的角度简单谈谈(如果对这方面感兴趣的话，可以读一读微软出版的《Microsoft SQL Server 2000数据库编程》第3单元的数据结构引论以及第6、13、14单元)。
从图中我们可以看到，SQL Server自动维护统计信息，这些统计信息包括数据密度信息以及数据分布信息，这些信息帮助SQL Server决定如何制定查询计划以及查询是是否使用索引以及使用什么样的索引（这里就不再解释它们到底如何帮助SQL Server建立查询计划的了）。我们还是来做个实验。建立一张表：tabTest(ID, unqValue，intValue)，其中ID是整形自动编号主索引，unqValue是uniqueidentifier类型，在上面建立普通索引，intValue 是整形，不建立索引。之所以挂上一个没有索引的intValue字段，就是防止SQL Server使用索引覆盖查询优化技术，这样实验就起不到作用了。向表中录入10000条随机记录，代码如下：

Code

CREATE TABLE [dbo].[tabTest] (

[ID] [int] IDENTITY (1, 1) NOT NULL ,

[unqValue] [uniqueidentifier] NOT NULL ,

[intValue] [int] NOT NULL

) ON [PRIMARY]

GO



ALTER TABLE [dbo].[tabTest] WITH NOCHECK ADD

CONSTRAINT [PK_tabTest] PRIMARY KEY  CLUSTERED

(

[ID]

)  ON [PRIMARY]

GO



ALTER TABLE [dbo].[tabTest] ADD

CONSTRAINT [DF_tabTest_unqValue] DEFAULT (newid()) FOR [unqValue]

GO



CREATE  INDEX [IX_tabTest_unqValue] ON [dbo].[tabTest]([unqValue]) ON [PRIMARY]

GO



declare @i int

declare @v int



set @i=0

while @i<10000

begin

set @v=rand()*1000    

insert into tabTest ([intValue]) values (@v)

set @i=@i+1

end

然后我们执行两个查询并查看执行计划，如图：（在查询分析器的查询菜单中可以打开查询计划，同时图上第一个查询的GUID是我从数据库中找的，大家做实验的时候可以根据自己数据库中的值来定）：

从图中可以看出，在第一个查询中，SQL Server使用了IX_tabTest_unqValue索引，根据箭头方向，计算机先在索引范围内找，找到后，使用Bookmark Lookup将索引节点映射到数据节点上，最后给出SELECT结果。在第二个查询中，系统直接遍历表给出结果，不过它使用了聚簇索引，为什么呢？不要忘了，聚簇索引的页节点就是数据节点！这样使用聚簇索引会更快一些（不受数据删除、更新留下的存储空洞的影响，直接遍历数据是要跳过这些空洞的）。

下面，我们在SQL Server中将ID字段的聚簇索引更改为非聚簇索引，然后再执行select * from tabTest，这回我们看到的执行计划变成了：

SQL Server没有使用任何索引，而是直接执行了Table Scan，因为只有这样，检索效率才是最高的。

三、聚簇索引与非聚簇索引的本质区别

现在可以讨论聚簇索引与非聚簇索引的本质区别了。正如本文最前面的两个图所示，聚簇索引的叶节点就是数据节点，而非聚簇索引的页节点仍然是索引检点，并保留一个链接指向对应数据块。

还是通过一道数学题来看看它们的区别吧：假设有一8000条记录的表，表中每条记录在磁盘上占用1000字节，如果在一个10字节长的字段上建立非聚簇索引主键，需要二叉树节点16000个（这16000个节点中有8000个叶节点，每个页节点都指向一个数据记录），这样数据将占用8000条×1000字节 /8K字节=1000个页面；索引将占用16000个节点×10字节/8K字节=20个页面，共计1020个页面。

同样一张表，如果我们在对应字段上建立聚簇索引主键，由于聚簇索引的页节点就是数据节点，所以索引节点仅有8000个，占用10个页面，数据仍然占有1000个页面。

下面我们看看在执行插入操作时，非聚簇索引的主键为什么比聚簇索引主键要快。主键约束要求主键不能出现重复，那么SQL Server是怎么知道不出现重复的呢？唯一的方法就是检索。对于非聚簇索引，只需要检索20个页面中的16000个节点就知道是否有重复，因为所有主键键值在这16000个索引节点中都包含了。但对于聚簇索引，索引节点仅仅包含了8000个中间节点，至于会不会出现重复必须检索另外8000个页数据节点才知道，那么相当于检索10+1000=1010个页面才知道是否有重复。所以聚簇索引主键的插入速度要比非聚簇索引主键的插入速度慢很多。

让我们再来看看数据检索的效率，如果对上述两表进行检索，在使用索引的情况下（有些时候SQL Server执行计划会选择不使用索引，不过我们这里姑且假设一定使用索引），对于聚簇索引检索，我们可能会访问10个索引页面外加1000个数据页面得到结果（实际情况要比这个好），而对于非聚簇索引，系统会从20个页面中找到符合条件的节点，再映射到1000个数据页面上（这也是最糟糕的情况），比较一下，一个访问了1010个页面而另一个访问了1020个页面，可见检索效率差异并不是很大。所以不管非聚簇索引也好还是聚簇索引也好，都适合排序，聚簇索引仅仅比非聚簇索引快一点。

结语

关于聚簇索引与非聚簇索引效率问题的实验就不做了，感兴趣的话可以自己使用查询分析器对查询计划进行分析。SQL Server是一个很复杂的系统，尤其是索引以及查询优化技术，Oracle就更复杂了。了解索引以及查询背后的事情不是什么坏事，它可以帮助我们更为深刻的了解我们的系统。

-------------------------------------

非聚簇对于更新肯定是有优势的
而它在检索的性能损失也不会太大

所以能不用聚簇当然是最好的了
但是如果使用\order by的话　
聚簇的优势也应该是很明显的

-------------------------------------

索引有两种类型：聚簇索引和非聚簇索引。

在聚簇索引中，索引树的叶级页包含实际的数据：记录的索引顺序与物理顺序相同。
在非聚簇索引中，叶级页指向表中的记录：记录的物理顺序与逻辑顺序没有必然的联系。

聚簇索引非常象目录表，目录表的顺序与实际的页码顺序是一致的。非聚簇索引则更象书的标准索引表，索引表中的顺序通常与实际的页码顺序是不一致的。一本书也许有多个索引。例如，它也许同时有主题索引和作者索引。同样，一个表可以有多个非聚簇索引。

通常情况下，你使用的是聚簇索引，但是你应该对两种类型索引的优缺点都有所理解。

每个表只能有一个聚簇索引，因为一个表中的记录只能以一种物理顺序存放。通常你要对一个表按照标识字段建立聚簇索引。但是，你也可以对其它类型的字段建立聚簇索引，如字符型，数值型和日期时间型字段。
从建立了聚簇索引的表中取出数据要比建立了非聚簇索引的表快。当你需要取出一定范围内的数据时，用聚簇索引也比用非聚簇索引好。例如，假设你用一个表来记录访问者在你网点上的活动。如果你想取出在一定时间段内的登录信息，你应该对这个表的DATETIME型字段建立聚簇索引。
对聚簇索引的主要限制是每个表只能建立一个聚簇索引。但是，一个表可以有不止一个非聚簇索引。实际上，对每个表你最多可以建立249个非聚簇索引。你也可以对一个表同时建立聚簇索引和非聚簇索引。
假如你不仅想根据日期，而且想根据用户名从你的网点活动日志中取数据。在这种情况下，同时建立一个聚簇索引和非聚簇索引是有效的。你可以对日期时间字段建立聚簇索引，对用户名字段建立非聚簇索引。如果你发现你需要更多的索引方式，你可以增加更多的非聚簇索引。
非聚簇索引需要大量的硬盘空间和内存。另外，虽然非聚簇索引可以提高从表中取数据的速度，它也会降低向表中插入和更新数据的速度。每当你改变了一个建立了非聚簇索引的表中的数据时，必须同时更新索引。因此你对一个表建立非聚簇索引时要慎重考虑。如果你预计一个表需要频繁地更新数据，那么不要对它建立太多非聚簇索引。另外，如果硬盘和内存空间有限，也应该限制使用非聚簇索引的数量。

索引属性

这两种类型的索引都有两个重要属性：
你可以用两者中任一种类型同时对多个字段建立索引（复合索引）；
两种类型的索引都可以指定为唯一索引。
你可以对多个字段建立一个复合索引，甚至是复合的聚簇索引。假如有一个表记录了你的网点访问者的姓和名字。如果你希望根据完整姓名从表中取数据，你需要建立一个同时对姓字段和名字字段进行的索引。这和分别对两个字段建立单独的索引是不同的。当你希望同时对不止一个字段进行查询时，你应该建立一个对多个字段的索引。如果你希望对各个字段进行分别查询，你应该对各字段建立独立的索引。
两种类型的索引都可以被指定为唯一索引。如果对一个字段建立了唯一索引，你将不能向这个字段输入重复的值。一个标识字段会自动成为唯一值字段，但你也可以对其它类型的字段建立唯一索引。假设你用一个表来保存你的网点的用户密码，你当然不希望两个用户有相同的密码。通过强制一个字段成为唯一值字段，你可以防止这种情况的发生。

http://hi.baidu.com/guobeilei/blog/item/51f55afbda311e116c22eb0e.html

聚集索引基于数据行的键值在表内排序和存储这些数据行。每个表只能有一个聚集索引，因为数据行本身只能按一个顺序存储。有关聚集索引体系结构的详细信息，请参阅聚集索引结构。

每个表几乎都对列定义聚集索引来实现下列功能：

可用于经常使用的查询。

提供高度唯一性。

注意：
创建 PRIMARY KEY 约束时，将在列上自动创建唯一索引。默认情况下，此索引是聚集索引，但是在创建约束时，可以指定创建非聚集索引。

可用于范围查询。

如果未使用 UNIQUE 属性创建聚集索引，数据库引擎将向表自动添加一个 4 字节的 uniqueifier 列。必要时，数据库引擎将向行自动添加一个 uniqueifier 值以使每个键唯一。此列和列值供内部使用，用户不能查看或访问。

查询注意事项

在创建聚集索引之前，应先了解数据是如何被访问的。考虑对具有以下特点的查询使用聚集索引：

使用运算符（如 BETWEEN、>、>=、< 和 <=）返回一系列值。

使用聚集索引找到包含第一个值的行后，便可以确保包含后续索引值的行物理相邻。例如，如果某个查询在一系列销售订单号间检索记录，SalesOrderNumber 列的聚集索引可快速定位包含起始销售订单号的行，然后检索表中所有连续的行，直到检索到最后的销售订单号。
返回大型结果集。
使用 JOIN 子句；一般情况下，使用该子句的是外键列。
使用 ORDER BY 或 GROUP BY 子句。

在 ORDER BY 或 GROUP BY 子句中指定的列的索引，可以使数据库引擎不必对数据进行排序，因为这些行已经排序。这样可以提高查询性能。

列注意事项

一般情况下，定义聚集索引键时使用的列越少越好。考虑具有下列一个或多个属性的列：

唯一或包含许多不重复的值

例如，雇员 ID 唯一地标识雇员。EmployeeID 列的聚集索引或 PRIMARY KEY 约束将改善基于雇员 ID 号搜索雇员信息的查询的性能。另外，可对 LastName、FirstName、MiddleName 列创建聚集索引，因为经常以这种方式分组和查询雇员记录，而且这些列的组合还可提供高区分度。
按顺序被访问

例如，产品 ID 唯一地标识 AdventureWorks 数据库的 Production.Product 表中的产品。在其中指定顺序搜索的查询（如 WHERE ProductID BETWEEN 980 and 999）将从 ProductID 的聚集索引受益。这是因为行将按该键列的排序顺序存储。
由于保证了列在表中是唯一的，所以定义为 IDENTITY。
经常用于对表中检索到的数据进行排序。

按该列对表进行聚集（即物理排序）是一个好方法，它可以在每次查询该列时节省排序操作的成本。

聚集索引不适用于具有下列属性的列：

频繁更改的列

这将导致整行移动，因为数据库引擎必须按物理顺序保留行中的数据值。这一点要特别注意，因为在大容量事务处理系统中数据通常是可变的。
宽键

宽键是若干列或若干大型列的组合。所有非聚集索引将聚集索引中的键值用作查找键。为同一表定义的任何非聚集索引都将增大许多，这是因为非聚集索引项包含聚集键，同时也包含为此非聚集索引定义的键列。

索引选项

创建聚集索引时，可指定若干索引选项。因为聚集索引通常都很大，所以应特别注意下列选项：

SORT_IN_TEMPDB
DROP_EXISTING
FILLFACTOR
ONLINE

有待整理验证，制作成专题！

阅读(1228) | 评论(3) | 转发(0) |

上一篇：成功的人生至少需要一张跳板[转]

下一篇：文件系统维护

给主人留下些什么吧！~~

chinaunix网友2010-07-22 16:29:48

http://blog.ftofficer.com/tag/python/ 收藏下

回复 | 举报

chinaunix网友2010-07-22 14:23:19

http://www.zgjtjy.cn/ 参考下这个网站

回复 | 举报

hkebao2010-03-04 08:26:04

相关内容补充： InnoDB表会包含一个聚集索引（数据表的物理存储顺序和表的逻辑存储顺序一致）一般是按照下面的规则来设定聚集索引的： 1，假如表包含PRIMARY KEY，InnoDB使用它作为聚集索引 2，假如表没有定义PRIMARY KEY，InnoDB将第一个只包含NOT NULL属性列的UNIQUE index作为主键并且将它设置为聚集索引 3，前两者都不满足的时候，mysql就增加一个隐藏的autocreament

回复 | 举报

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6