Clustering table 存储结构深入分析-zxszcaijin-ChinaUnix博客

每个人都是设计师

首页　| 　博文目录　| 　关于我

zxszcaijin

博客访问： 674864
博文数量： 66
博客积分： 15
博客等级：民兵
技术积分： 2204
用户组：普通用户
注册时间： 2010-10-26 21:43

个人简介

曾就职于阿里巴巴担任Oracle DBA，MySQL DBA，目前在新美大担任SRE。[是普罗米修斯还是一块石头，你自己选择！] 欢迎关注微信公众号 “自己的设计师”，不定期有原创运维文章推送。

文章分类

全部博文（66）

随笔（2）
CPU（1）
销售（1）
心理学（1）
诗集（1）
道学（3）
Linux（0）
其他宗教（0）
佛学（1）
文学（0）
法律（0）
JAVA（0）
C/C++（0）
存储和硬件（1）
NoSql（1）
ORACLE分析（20）
Mysql（34）
未分配的博文（0）

文章存档

2017年（2）

2016年（3）

2015年（7）

2014年（12）

2013年（42）

我的朋友

相关博文

Clustering table 存储结构深入分析

分类： Oracle

2013-12-05 17:59:50

Clustering table 存储结构深入分析

首先创建cluster ：
CREATE CLUSTER personnel
( department_number  NUMBER(2) ) ;

创建表emp:
CREATE TABLE emp
(empno    NUMBER       PRIMARY KEY,
   ename    VARCHAR2(10)  NOT NULL
                           CHECK (ename = UPPER(ename)),
   job    VARCHAR2(9),
   mgr    NUMBER ,
   hiredate  DATE
      CHECK (hiredate < TO_DATE ('08-14-1998', 'MM-DD-YYYY')),
   sal    NUMBER(10,2)  CHECK (sal > 500),
   comm    NUMBER(9,0) DEFAULT NULL,
   deptno NUMBER(2)    NOT NULL )
   CLUSTER personnel (deptno);

创建表dept：
CREATE TABLE dept
(deptno  NUMBER(2),
   dname VARCHAR2(9),
   loc    VARCHAR2(9))
   CLUSTER personnel (deptno);

然后执行:
Insert into emp select * from scott.emp;
Insert into dept select * from scott.dept;

接下来dump相应而cluster，分析其存储结构:

Dump 文件如下:
Block header dump:  0x01000223
Object id on Block? Y
seg/obj: 0x11746  csc: 0x00.11d4bd  itc: 2  flg: E  typ: 1 - DATA
   brn: 0  bdba: 0x1000220 ver: 0x01 opc: 0
   inc: 0  exflg: 0

Itl          Xid                Uba       Flag  Lck       Scn/Fsc
0x01 0x0003.005.00000302  0x00c0081a.00ae.20  C--- 0  scn 0x0000.0011d49a
0x02 0x0003.007.00000302  0x00c0081a.00ae.25  --U- 1  fsc 0x0000.0011d4c0    表示该ITL 事务已经提交，但是提交的SCN是oracle 在数据有效性的基础上“猜”出来的，可能并不是真实的 commit  scn ，这个SCN就是 scn/fsc

bdba: 0x01000223
data_block_dump,data header at 0x8407264
===============
tsiz: 0x1f98          total area size =8088 byte
hsiz: 0x24          header area size=36 byte
pbl: 0x08407264    pointer to the buffer hold  the block
   76543210
flag=--------
ntab=3          numbert of  table (>1,所以此block为cluster的block) 分别为:cluster personnel emp dept
nrow=5          number of  rows (有5行).
frre=-1
fsbo=0x24
fseo=0x1efd
avsp=0x1ed9
tosp=0x1ed9
0xe: pti[0]       nrow=1       offs=0
0x12: pti[1]       nrow=3       offs=1
0x16: pti[2]       nrow=1       offs=4
0x1a: pri[0]       offs=0x1f82
0x1c: pri[1]       offs=0x1f5c
0x1e: pri[2]       offs=0x1f39
0x20: pri[3]       offs=0x1f15
0x22: pri[4]       offs=0x1efd
block_row_dump:
tab 0, row 0, @0x1f82
tl: 22 fb: K-H-FL-- lb: 0x0  cc: 1 -----------fb:K-H-FL—表示这是一个cluster key,且此row包含row header,row first piece,row last piece,即没有发生分片.
curc: 4 comc: 4 pk: 0x01000223.0 nk: 0x01000223.0 ---------curc,comc这个怎么解释?
col  0: [ 2]  c1 0b    -----------------表示的deptno 为10
tab 1, row 0, @0x1f5c
tl: 38 fb: -CH-FL-- lb: 0x0  cc: 6 cki: 0    ---------- fb中的c表示cluster member table
col  0: [ 3]  c2 4e 53                   ---------- col 0:7782
col  1: [ 5]  43 4c 41 52 4b             -------------col 1:CLARK
col  2: [ 7]  4d 41 4e 41 47 45 52 col 2: MANAGER
col  3: [ 3]  c2 4f 28             col 3: 7839
col  4: [ 7]  77 b5 06 09 01 01 01 col 4:表示date类型,可以经过如下转换
77(hex)=119(decimal) centry=119-100=19
B5(hex)=181(decimal) year=181-100=81
06(hex)=06(decimal) month=06
09(hex)=09(decimal)    day=09
01(hex)=01(decimal)    hour=1-1=0
01(hex)=01(decimal) minute=1-1=0
01(hex)=01(decimal) seconds=1-1=0
col  5: [ 3]  c2 19 33 col 5表示值为: 2450 col 6由于为null,所以没有存储，由此可见对于every row最后为null的列可以省略，节省了存储空间。
tab 1, row 1, @0x1f39
tl: 35 fb: -CH-FL-- lb: 0x0  cc: 6 cki: 0 -----------fb:K-H-FL—表示这是一个cluster key,且此row包含row header,row first piece,row last piece,即没有发生分片.
col  0: [ 3]  c2 4f 28    col 0:  7839
col  1: [ 4]  4b 49 4e 47 col 1: KING
col  2: [ 9]  50 52 45 53 49 44 45 4e 54 col 2: PRESIDENT
col  3: *NULL*       col3 :NULL  NULL并没有实际的存储，只是在此显示而已，因为tl:为35，而row header占用了10byte，而数据占用了25byte，所以NULL并没有占用空间。
col  4: [ 7]  77 b5 0b 11 01 01 01  col 4:表示date类型,可以经过如下转换
77(hex)=119(decimal) centry=119-100=19
B5(hex)=181(decimal) year=181-100=81
0b(hex)=11(decimal) month=11
11(hex)=17(decimal)    day=17
01(hex)=01(decimal)    hour=1-1=0
01(hex)=01(decimal) minute=1-1=0
01(hex)=01(decimal) seconds=1-1=0

col  5: [ 2]  c2 33 col5为: 5000 col 6由于为null,所以没有存储，由此可见对于every row最后为null的列可以省略，节省了存储空间。
tab 1, row 2, @0x1f15
tl: 36 fb: -CH-FL-- lb: 0x0  cc: 6 cki: 0    -----------fb:K-H-FL—表示这是一个cluster key,且此row包含row header,row first piece,row last piece,即没有发生分片.
col  0: [ 3]  c2 50 23    ------------------col 0: 7934
col  1: [ 6]  4d 49 4c 4c 45 52    -------------------col 1: MILLER
col  2: [ 5]  43 4c 45 52 4b       ------------------col 2: CLERK
col  3: [ 3]  c2 4e 53                -----------------------col 3: 7782
col  4: [ 7]  77 b6 01 17 01 01 01 col 4:表示date类型,可以经过如下转换
77(hex)=119(decimal) centry=119-100=19
B6(hex)=182(decimal) year=182-100=82
01(hex)=01(decimal) month=01
17(hex)=25(decimal)    day=25
01(hex)=01(decimal)    hour=1-1=0
01(hex)=01(decimal) minute=1-1=0
01(hex)=01(decimal) seconds=1-1=0

col  5: [ 2]  c2 0e col 5: 1300
tab 2, row 0, @0x1efd tab2 的行如下:
tl: 24 fb: -CH-FL-- lb: 0x2  cc: 2 cki: 0    -----------fb:K-H-FL—表示这是一个cluster key,且此row包含row header,row first piece,row last piece,即没有发生分片.
col  0: [10]  41 43 43 4f 55 4e 54 49 4e 47 ---------------- col  0: ACCOUNTING
col  1: [ 8]  4e 45 57 20 59 4f 52 4b          -------------col 1: NEW YORK
end_of_block_dump
End dump data blocks tsn: 4 file#: 4 minblk 547 maxblk 547
由上面dump内容分析可知具有相同的deptno的dept和emp表的行存储在同一个块中，如下查询清晰的验证了上面的分析(deptno为cluster key，提出来存储在第一行):
SQL> select * from emp where deptno=10;
  EMPNO ENAME    JOB             MGR HIREDATE       SAL    COMM    DEPTNO
  7782 CLARK    MANAGER       7839 09-6月 -81       2450                      10
  7839 KING       PRESIDENT             17-11月-81       5000                      10
  7934 MILLER    CLERK          7782 23-1月 -82    1300                      10

SQL> select * from dept where deptno=10;
      DEPTNO DNAME          LOC
      10    ACCOUNTING    NEW YORK

事实正如分析的那样。这样的存储方式使连接查询只需要scan少量的block就能得到想要的结果，降低了I/O，同时由于cluster key只存储一次，节省了存储了空间。然而，这些却降低了如dml或非链接查询的效率，因为每次CPU都要做额外的处理才能将数据按特定的方式进行插入，每次的非连接查询都要进行数据组装，因此合适选择使用cluster table因英勇的需求而定，如果因为大量的连接查询降低了效率，而使用cluster table带来性能提升的同时对系统的影响较小或没有影响，此时使用cluster table或许是一个不错的选择。

阅读(1296) | 评论(2) | 转发(0) |

上一篇：通过DUMP函数来转换数字

下一篇：Mysql 索引设计的要点

给主人留下些什么吧！~~

zxszcaijin2014-01-15 17:39:24

xccheese：--curc,表示该block内非聚簇键的数据有4条,comc表示该block内非聚簇键的已经commit的数据有4条.

这个是大学时候写了，3-4年了，转载过来了。转到mysql之后，就很少关注Oracle了。

回复 | 举报

xccheese2014-01-13 22:19:02

--curc,表示该block内非聚簇键的数据有4条,comc表示该block内非聚簇键的已经commit的数据有4条.

回复 | 举报

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6