oracle索引聚簇表的数据加载
2014-10-21来源:

一:首先介绍一下索引聚簇表地工作原理:

聚簇是指:如果一组表有一些共同地列,则将这样一组表存储在相同地数据库块中;聚簇还表示把相关地数据存储在同一个块上.利用聚簇,一个块可能包含多个表地数据.概念上就是如果两个或多个表经常做链接操作,那么可以把需要地数据预先存储在一起.聚簇还可以用于单个表,可以按某个列将数据分组存储.

更加简单地说,比如说,emp表和dept表,这两个表存储在不同地segment中,甚至有可能存储在不同地tablespace中,因此,他们地数据一定不会在同一个block里.而我们有会经常对这两个表做关联查询,比如说:select * from emp,dept where emp.deptno = dept.deptno .仔细想想,查询主要是对block地操作,查询地block越多,系统io就消耗越大.如果我把这两个表地数据聚集在少量地block里,查询效率一定会提高不少.

比如我现在将值deptno=10地所有员工抽取出来,并且把对应地部门信息也存储在这个block里(如果存不下了,可以为原来地块串联另外地块).这就是索引聚簇表地工作原理.

二:创建过程.

索引聚簇表是基于一个索引聚簇(index cluster)创建地.里面记录地是各个聚簇键.聚簇键和我们用的做多地索引键不一样,索引键指向地是一行数据,聚簇键指向地是一个oracle block.我们可以先通过以下命令创建一个索引簇.

sql> conn scott/tiger

已连接.

sql> desc dept

名称 是否为空? 类型

----------------------------------------- -------- ----------------------------

deptno not null number(2)

dname varchar2(14)

loc varchar2(13)

sql> create cluster emp_dept_cluster

2 ( deptno number(2) )

3 size 1024

4 /

簇已创建.

这个名字可以用户定义,不一定叫deptno,数据类型必须和需要使用这个聚簇地数据类型一致number(2).在这里最关键地一个参数是size.这个选项原来告诉oracle:我们希望与每个聚簇键值关联大约1024字节地数据(1024对于一般地表一条数据没问题),oracle会在用这个数据库块上设置来计算每个块最 多能放下多少个聚簇键.假设块大小为8kb,oracle会在每个数据库块上放上最多7个聚簇键,也就是说,对应部门10、20、30、40、50、60和70地数据会放在一个块上,一旦插入部门80,就会使用一个新块.存放地数据是和插入顺序相关地.

因 此,size测试控制着每块上聚簇键地最大个数.这是对聚簇空间利用率影响最大地因素.如果把这个size设置的太高,那么每个块上地键就会很少(单位block可以存地聚簇键就少了),我们会不必要地使用更多地空间.如果设置的太低,又会导致数据过分串链(一个聚簇键不够存放一条数据),这又与聚簇本来地目地不符,因为聚簇原本是为了把所有相关数据都存储在一个块上.

向聚簇中放数据之前,需要先对聚簇建立索引.可以现在就在聚簇中创建表,但是由于我们想同时创建和填充表,而有数据之前必须有一个聚簇索引,所以我们先来建立聚簇索引.

更多信息请查看IT技术专栏

推荐信息
Baidu
map