概述

生产库中sqlserver怎么也占了三分之一，所以今天主要聊聊怎么在sqlserver数据库上去建索引。

1、索引概述

创建索引一般有以下两个目的：维护被索引列的唯一性和提供快速访问表中数据的策略。

大型数据库有两种索引即簇索引和非簇索引:

1)非簇索引的表是按堆结构存储数据，所有的数据均添加在表的尾部；

2)簇索引的表，其数据在物理上会按照簇索引键的顺序存储，一个表只允许有一个簇索引。

因此，根据B树结构，可以理解添加任何一种索引均能提高按索引列查询的速度，但会降低插入、更新、删除操作的性能，尤其是当填充因子（Fill Factor）较大时。所以对索引较多的表进行频繁的插入、更新、删除操作，建表和索引时因设置较小的填充因子，以便在各数据页中留下较多的自由空间，减少页分割及重新组织的工作。

索引是从数据库中获取数据的最高效方式之一。95% 的数据库性能问题都可以采用索引技术得到解决。作为一条规则，我通常对逻辑主键使用唯一的成组索引，对系统键（作为存储过程）采用唯一的非成组索引，对任何外键列[字段]采用非成组索引。不过，索引就象是盐，太多了菜就咸了。你得考虑数据库的空间有多大，表如何进行访问，还有这些访问是否主要用作读写，（即：在实际使用当中，应该充分考虑到索引的开销，包括磁盘空间的开销及处理开销（如资源竞争和加锁）。如果数据频繁的更新或删加，就不宜建立索引）

实际上，可以把索引理解为一种特殊的目录。微软的SQL SERVER提供了两种索引：聚集索引（clustered index，也称聚类索引、簇集索引）和非聚集索引（nonclustered index，也称非聚类索引、非簇集索引）。

2、聚集索引结构

在 SQL Server 中，索引是按 B 树结构进行组织的。

聚集索引单个分区中的结构:

基于SQLSERVER数据库建立高效的索引

聚集索引（Clustered Index）特点：

聚集索引的叶节点就是实际的数据页
聚集索引中的排序顺序仅仅表示数据页链在逻辑上是有序的。而不是按照顺序物理的存储在磁盘上
行的物理位置和行在索引中的位置是相同的
每个表只能有一个聚集索引
聚集索引的平均大小大约为表大小的5%左右

3、非聚集索引结构

非聚集索引与聚集索引具有相同的 B 树结构，它们之间的显著差别在于以下两点：

1. 基础表的数据行不按非聚集键的顺序排序和存储。
2. 非聚集索引的叶层是由索引页而不是由数据页组成。

下图示意了单个分区中的非聚集索引结构：

基于SQLSERVER数据库建立高效的索引

非聚集索引（Unclustered Index）特点：

非聚集索引的页，不是数据，而是指向数据页的页。
若未指定索引类型，则默认为非聚集索引。
叶节点页的次序和表的物理存储次序不同
每个表最多可以有249个非聚集索引
在非聚集索引创建之前创建聚集索引（否则会引发索引重建）

4、聚集索引和非聚集索引的区别

其实，我们的汉语字典的正文本身就是一个聚集索引。比如，我们要查“安”字，就会很自然地翻开字典的前几页，因为“安”的拼音是“an”，而按照拼音排序汉字的字典是以英文字母“a”开头并以“z”结尾的，那么“安”字就自然地排在字典的前部。如果你翻完了所有以“a”开头的部分仍然找不到这个字，那么就说明你的字典中没有这个字；同样的，如果查“张”字，那你也会将你的字典翻到最后部分，因为“张”的拼音是“zhang”。也就是说，字典的正文部分本身就是一个目录，你不需要再去查其他目录来找到你需要找的内容。
我们把这种正文内容本身就是一种按照一定规则排列的目录称为“聚集索引”。
如果你认识某个字，你可以快速地从自动中查到这个字。但你也可能会遇到你不认识的字，不知道它的发音，这时候，你就不能按照刚才的方法找到你要查的字，而需要去根据“偏旁部首”查到你要找的字，然后根据这个字后的页码直接翻到某页来找到你要找的字。但你结合“部首目录”和“检字表”而查到的字的排序并不是真正的正文的排序方法，比如你查“张”字，我们可以看到在查部首之后的检字表中“张”的页码是672页，检字表中“张”的上面是“驰”字，但页码却是63页，“张”的下面是“弩”字，页面是390页。很显然，这些字并不是真正的分别位于“张”字的上下方，现在你看到的连续的“驰、张、弩”三字实际上就是他们在非聚集索引中的排序，是字典正文中的字在非聚集索引中的映射。我们可以通过这种方式来找到你所需要的字，但它需要两个过程，先找到目录中的结果，然后再翻到你所需要的页码。
我们把这种目录纯粹是目录，正文纯粹是正文的排序方式称为“非聚集索引”。
进一步引申一下，我们可以很容易的理解：每个表只能有一个聚集索引，因为目录只能按照一种方法进行排序。

两者的存储特点：

聚集索引。表数据按照索引的顺序来存储的，也就是说索引项的顺序与表中记录的物理顺序一致。对于聚集索引，叶子结点即存储了真实的数据行，不再有另外单独的数据页。在一张表上最多只能创建一个聚集索引，因为真实数据的物理顺序只能有一种。
非聚集索引。表数据存储顺序与索引顺序无关。对于非聚集索引，叶结点包含索引字段值及指向数据页数据行的逻辑指针，其行数量与数据表行数据量一致。

总之，聚集索引是一种稀疏索引，数据页上一级的索引页存储的是页指针，而不是行指针。而对于非聚集索引，则是密集索引，在数据页的上一级索引页它为每一个数据行存储一条索引记录。

5、使用聚集索引或非聚集索引的场景

下面的表总结了何时使用聚集索引或非聚集索引：

基于SQLSERVER数据库建立高效的索引

总结

“水可载舟，亦可覆舟”，索引也一样。索引有助于提高检索性能，但过多或不当的索引也会导致系统低效。因为用户在表中每加进一个索引，数据库就要做更多的工作。过多的索引甚至会导致索引碎片。
所以说，我们要建立一个“适当”的索引体系，特别是对聚合索引的创建，更应精益求精，以使数据库能得到高性能的发挥。

觉得有用的朋友多帮忙转发哦！后面会分享更多devops和DBA方面的内容，感兴趣的朋友可以关注下~

基于SQLSERVER数据库建立高效的索引

基于SQLSERVER数据库建立高效的索引

概述

1、索引概述

2、聚集索引结构

3、非聚集索引结构

4、聚集索引和非聚集索引的区别

5、使用 聚集索引 或 非聚集索引 的场景

总结

相关推荐

5、使用聚集索引或非聚集索引的场景