jbossllx 2019-04-05
复合索引顾名思义,区别于单列索引,是由两个或多个列一起构成的索引。其在B树上的数据结构是什么样?如下图,是一个包含两列的复合索引。
如果你观察仔细,还会发现它的叶子节点是ASC递增排序的。现根据第一个值排序,然后根据第二个值排序。查的时候也一样,先查第一个值,在查第二个值。可以想象三个列组成的复合索引数据结构该是什么样的。
在实际创建表时,一开始,只会创建一个主键id,oracle会为主键默认创建索引。随着经验的增加,开始去考虑性能,会开始研究索引,比如查询报表、订单等业务场景。这时候多多少少都会创建索引了,然后开始研究复合索引。复合索引首先带来的问题是你如何在脑海中构建一个B树上的复合索引结构?接下来就到了如何创建复合索引的问题。
索引的建立,是为了提高查询效率,但索引设计不合理,又很影响写性能,这就像CAP只能满足其中两个条件一样。所以完美的东西不存在,万物是在矛盾中前行。说白了,就是要用最少、结构最简单的索引来达到目标。
基础表:
说明:
1、a、b和c都经常要被查询,并且有经常a、b、c组合查询的可能性
2、a列区分度不大,b和c都有区分度(数值不会过多重复)
1、分别在a、b和c上分别建单列索引,即我们最终有三个索引,分别是(a)、(b)、(c)。这当然可以。但还有没有更好的?
2、在(a、b)、(b、c)、(a、c)上建复合索引。这样也可以,但维护起来开销比较大,还有没有更好的?
3、在(a、b、c)上建复合索引。这样维护起来开销也很大。并且a作为先导列,区分度不大,不是一个很好的选择。
4、最好的,应该是在(b、c)上建立复合索引,在c上建单列索引,这样(b、c)索引可以覆盖到a and b和b and c查询,c单列索引可以覆盖到a和b查询。
1、创建测试表
CREATE TABLE sunyang_test( id number, a number, b number, c number )tablespace ebiz; alter table sunyang_test add constraint pk_sunyang_test primary key (id) using index tablespace ebiz;
2、插入数据
begin for i in 1 .. 100000 loop insert into sunyang_test values(i,mod(i,2),mod(i,20000),mod(i,20000)); end loop; commit; end;
3、创建索引
create index idx_sunyang_test_bc on sunyang_test(b,c) tablespace ebiz; create index idx_sunyang_test_c on sunyang_test(c) tablespace ebiz;
4、执行下面的SQL
select * from sunyang_test where b=5000;
执行计划:
select * from sunyang_test where c=5000;
执行计划:
select * from sunyang_test where a=1 and b=5000;
执行计划:
select * from sunyang_test where a=1 and c=5000;
执行计划:
select * from sunyang_test where b=5000 and c=5000;
执行计划:
select * from sunyang_test where a=1 and b=5000 and c=5000;
执行计划:
可以看到,在a列区分度不大,且需要a、b、c单列查询或组合查询时,这样建索引将所有查询情况都覆盖到了,并且索引不复杂。
复合索引的设计,对于前导列的选择(也就是复合索引中的第一个列)非常重要,至少不应该在这里选择a作为一个复合索引的前导列,因为a的区分度太低了。有人说,不是有INDEX SKIP SCAN吗?这个确实要看a的实际值,如果a的取值很少,比如这里的两个,那么可以走INDEX SKIP SCAN,否则开销是很大的,往往Oracle直接去FULL TABLE SCAN了,也不会去INDEX SKIP SCAN,因为其涉及到索引分裂。
后面会分享更多DBA方面内容,感兴趣的朋友可以关注下!