Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1022891
  • 博文数量: 584
  • 博客积分: 2293
  • 博客等级: 大尉
  • 技术积分: 3045
  • 用 户 组: 普通用户
  • 注册时间: 2006-03-28 11:15
文章分类

全部博文(584)

文章存档

2012年(532)

2011年(47)

2009年(5)

我的朋友

分类:

2012-03-31 20:12:34

数据块(Data Block)原理深入剖析

什么是数据块(Data Block

数据块(Oracle Data Blocks),本文简称为“块”,是Oracle最小的存储单位,Oracle数据存放在“块”中。一个块占用一定的磁盘空间。特别注意的是,这里的“块”是Oracle的“数据块”,不是操作系统的“块”。

Oracle每次请求数据的时候,都是以块为单位。也就是说,Oracle每次请求的数据是块的整数倍。如果Oracle请求的数据量不到一块,Oracle也会读取整个块。所以说,“块”是Oracle读写数据的最小单位或者最基本的单位。

块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块(Standard Block)。块的大小和标准块的大小不同的块叫非标准块Nonstandard Block)。同一中,Oracle9i及以上版本支持同一数据库中同时使用标准块和非标准块。Oracle允许指定5种非标准块(Nonstandard Block)。

操作系统每次执行I/O的时候,是以操作系统的块为单位;Oracle每次执行I/O的时候,都是以Oracle的块为单位。

Oracle数据块大小一般是操作系统块的整数倍。

 

数据块的格式(Data Block Format

块中存放表的数据和索引的数据,无论存放哪种类型的数据,块的格式都是相同的,块由块头(header/Common and Variable),表目录(Table Directory,行目录(Row Directory,空余空间(Free Space)和行数据(Row Data)五部分组成,如下图所示。

块头(header/Common and Variable):存放块的基本信息,如:块的物理地址,块所属的段的类型(是数据段还是索引段)。

表目录(Table Directory:存放表的信息,即:如果一些表的数据被存放在这个块中,那么,这些表的相关信息将被存放在“表目录”中。

行目录(Row Directory:如果块中有行数据存在,则,这些行的信息将被记录在行目录中。这些信息包括行的地址等。

行数据(Row Data:是真正存放表数据和索引数据的地方。这部分空间是已被数据行占用的空间。

空余空间(Free Space:空余空间是一个块中未使用的区域,这片区域用于新行的插入和已经存在的行的更新。

头部信息区(Overhead:我们把块头(header/Common and Variable),表目录(Table Directory,行目录(Row Directory)这三部分合称为头部信息区(Overhead)。头部信息区不存放数据,它存放的整个块的信息。头部信息区的大小是可变的。一般来说,头部信息区的大小介于84字节(bytes)到107字节(bytes)之间。

数据块中自由空间的使用

当往数据库中插入(INSERT)数据的时候,块中的自由空间会减少;当对块中已经存在的行进行修改(UPDATE)的时候(使记录长度增加),块中的自由空间也会减少。

DELETE语句和UPDATE语句会使块中的自由空间增加。当使用DELETE语句删除块中的记录或者使用UPDATE语句把列的值更改成一个更小值的时候,Oracle会释放出一部分自由空间。释放出的自由空间并不一定是连续的。通常情况下,Oracle不会对块中不连续的自由空间进行合并。因为合并数据块中不连续的自由空间会影响数据库的性能。只有当用户进行数据插入(INSERT)或者更新(UPDATE)操作,却找不到连续的自由空间的时候,Oracle才会合并数据块中不连续的自由空间。

对于块中的自由空间,Oracle提供两种方式:自动管理,手动管理

行链接和行迁移(Row Chaining and Migrating

行链接(Row Chaining:如果我们往数据库中插入(INSERT)一行数据,这行数据很大,以至于一个数据块存不下一整行,Oracle就会把一行数据分作几段存在几个数据块中,这个过程叫行链接(Row Chaining)。如下图所示:

如果一行数据是普通行,这行数据能够存放在一个数据块中;如果一行数据是链接行,这行数据存放在多个数据块中。

行迁移(Row Migrating):数据块中存在一条记录,用户执行UPDATE更新这条记录,这个UPDATE操作使这条记录变长,这时候,Oracle在这个数据块中进行查找,但是找不到能够容纳下这条记录的空间,无奈之下,Oracle只能把整行数据移到一个新的数据块。原来的数据块中保留一个“指针”,这个“指针”指向新的数据块。被移动的这条记录的ROWID保持不变。行迁移的原理如下图所示:

无论是行链接还是行迁移,都会影响数据库的性能。Oracle在读取这样的记录的时候,Oracle会扫描多个数据块,执行更多的I/O

块中自由空间的自动管理

Oracle使用位图(bitmap)来管理和跟踪数据块,这种块的空间管理方式叫“自动管理”。自动管理有下面的好处:

Ø        易于使用

Ø        更好地利用空间

Ø        可以对空间进行实时调整

块中自由空间的手动管理

用户可以通过PCTFREE, PCTUSED来调整块中空间的使用,这种管理方式叫手动管理。相对于自动管理,手动管理方式比较麻烦,不容易掌握,容易造成块中空间的浪费。

PCTFREE参数用于指定块中必须保留的最小空闲空间百分例。之所以要预留这样的空间,是因为UPDATE时,需要这些空间。如果UPDATE时,没有空余空间,Oracle就会分配一个新的块,这会产生行迁移(Row Migrating)。

PCTUSED也是用于设置一个百分比,当块中已使用的空间的比例小于这个百分比的时候,这个块才被标识为有效状态。只有有效的块才被允许插入数据。

 

行链接,行迁移的解决之道

 如果数据库中存在行链接,行迁移,将会严重影响数据库的性能。因此,我们应该想办法消除行链接和行迁移。请按照下面的步骤消除行链接和行迁移。

STEP1:创建数据字典表CHAINED_ROWS

数据字典表CHAINED_ROWS用于接收ANALYZE...LIST CHAINED ROWS的数据,数据字典表CHAINED_ROWS由脚本UTLCHAIN.SQL或者脚本UTLCHN1.SQL创建。

 

STEP2:对表进行分析

ANALYZE TABLE student_infor LIST CHAINED ROWS;

执行这个命令将会把分析的结果写入表CHAINED_ROWS

 

STEP3:查出链接行或者迁移行

      SELECT *

FROM CHAINED_ROWS

WHERE TABLE_NAME = 'student_infor';

OWNER_NAME TABLE_NAME CLUST... HEAD_ROWID TIMESTAMP

---------- ---------- -----... ------------------ ---------

TT student_infor ... AAAAluAAHAAAAA1AAA 04-MAR-2008

TT student_infor ... AAAAluAAHAAAAA1AAB 04-MAR-2008

TT student_infor ... AAAAluAAHAAAAA1AAC 04-MAR-2008

从数据字典表中CHAINED_ROWS查询出链接行或者迁移行。该语句将列出表student_infor中存在的链接行或者迁移行。如果表中存在链接行或者迁移行,请执行下面的步骤;如果该语句没有任何输出,说明该表不存在链接行或者迁移行。

 

STEP4:创建中间表

      CREATE TABLE int_student_infor

AS SELECT *

FROM student_infor

WHERE ROWID IN

(SELECT HEAD_ROWID

FROM CHAINED_ROWS

WHERE TABLE_NAME = 'student_infor');

中间表int_student_infor用于临时存放链接行或者迁移行。该表的结构必须和表student_infor(本例中的表)的结构完全相同。执行完上面的命令,链接行或者迁移行已经被插入到中间表int_student_infor中。

 

STEP5:从已经存在的表student_infor中删除链接行和迁移行

      DELETE FROM student_infor

WHERE ROWID IN

(SELECT HEAD_ROWID

FROM CHAINED_ROWS

WHERE TABLE_NAME = 'student_infor');

 

STEP6:把中间表中的数据插入已经存在的表student_infor

      INSERT INTO student_infor

SELECT *

FROM int_student_infor;

      这一步使原来的数据行被重新插入,从而消除行迁移。

 

STEP7:链接行的消除

如果CHAINED_ROWS中存在链接行,只能通过提高数据块(Data Block)的大小,使一行数据能够被容纳在一个数据块中。但是,如果列的类型是LONG,或者是宽度比较大的CHARVARCHAR2,行链接将无法避免的。

 

数据块大小(Data Block Size)的选择

通常数据库块的大小都是8K,但是对于不通的应用(OLTPDSS)应该选择不通的块大小。数据库块大小的遵循如下的原则。

下面的情况可以选择小尺寸数据块:

*        行的宽度很小,并伴有大量的随机访问(Random Access

*        减少块竞争

注:选择小尺寸数据块会浪费大量的存储空间,

 

下面的情况可以选择大尺寸数据块:

*        行的宽度很大,或者含有LOB字段

*        应用中存在大量的顺序读(Sequential Access

*        节省I/O,一次可以读入更多的数据量

*        节省存储空间

 

阅读(231) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~