数据库笔记 2013-08-29
在某些场合会使用非常大的表,比如人口信息统计表。如果一个表很大,就会降低查询的速度,并增加管理的难度。一旦发生磁盘损坏,可能整个表的数据就会丢失,恢复比较困难。根据这一情况,可以创建分区表,把一个大表分成几个区(小段),对数据的操作和管理都可以针对分区进行,这样就可以提高数据库的运行效率。分区可以存在于不同的表空间上,提高了数据的可用性。
相关阅读:
1.使用分区的优点:
*增强可用性:如果表的某个分区出现故障,表在其他分区的数据仍然可用;
*维护方便:如果表的某个分区出现故障,需要修复数据,只修复该分区即可;
*均衡I/O:可以把不同的分区映射到磁盘以平衡I/O,改善整个系统性能;
*改善查询性能:对分区对象的查询可以仅搜索自己关心的分区,提高检索速度
2.表分区的依据
分区的依据可以是一列或多列的值,这一列或多列称为分区关键字或分区列。所有分区的逻辑属性是一样的(列名、数据类型、约束条件等),但每个分区可以有自己的物理属性(表空间、存储参数等)。
分区有四种:范围分区、哈希分区、列表分区和组合分区。
范围分区:根据分区关键字值的范围建立分区,将记录存放到列值所在的range分区中。比如,根据时间建立分区。
为各个分区建立独立的表空间
create tablespace test_space001 datafile'd:\tbs001.dbf' size20M;
create tablespace test_space002 datafile'd:\tbs002.dbf' size20M;
create tablespace test_space003 datafile'd:\tbs003.dbf' size20M;
建立分区表:
Create table range_example(
Range_key_column date,
Dat varchar2(20),
Id integer
)
Partition by range(range_key_column)
(
Partition part01 values less than(to_date(‘2013-8-28’,’yyyy-mm-dd’)) tablespace test_space01,
Partition part02 values less than(to_date(‘2013-9-28’,’yyyy-mm-dd’)) tablespace test_space02
Partition part03 values less than(maxvalue)) tablespace test_space03
)
如果某些记录暂时无法预测范围,可以创建maxvalue分区,所有不在指定范围内的记录都会被存储到Maxvalue所在分区中
在表分区上进行查询
Select * from range_example partition(part01);
哈希分区:对于那些无法有效划分范围的表,在分区列上使用HASH算法进行分区,这样对于提高性能还是会有一定的帮助。hash分区会将表中的数据平均分配到你指定的几个分区中,列所在分区是依据分区列的hash值自动分配,因此你并不能控制也不知道哪条记录会被放到哪个分区.
create table test
(
transaction_id number primary key,
item_id number(8) not null
)
partition by hash(transaction_id)
(
partition part_01 tablespace tablespace01,
partition part_02 tablespace tablespace02,
partition part_03 tablespace tablespace03
);