CBO连接的成本计算-oracle狂热分子-ChinaUnix博客

东东堂的数据库小屋oracn.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

oracle狂热分子

博客访问： 2826242
博文数量： 389
博客积分： 4177
博客等级：上校
技术积分： 4773
用户组：普通用户
注册时间： 2008-11-16 23:29

文章分类

全部博文（389）

MongoDB（3）
12C新特性（15）
Undo/Redo（8）
ASM（7）
Enqueue/Lock（1）
Block（9）
Index（5）
Buffer Pool（7）
Shared Pool（4）
AMM/ASMM（10）
Optimizer（19）
Latch/Mutex（4）
MySQL（69）
Exadata（6）
Timesten（15）
SHELL/PERL（7）
其他（7）
LINUX（24）
DATA GUARD（14）
性能调整（12）
RAC（21）
GOLDENGATE（8）
备份与恢复（23）
问题处理（10）
EM 12C（2）
OCP（32）
数据库理论（1）
存储（3）
oracle（43）
未分配的博文（0）

推荐博文

相关博文

CBO连接的成本计算

分类： Oracle

2015-12-28 18:05:50

CBO连接的成本计算

本文讨论Nested Loop(简称NL)和Hash Join(HJ)算法的成本,以及_optimizer_cost_model参数的影响,
该参数默认为chose表示考虑cpu因素,为了实验,作者设置为IO表示只考虑io成本

SQL> alter system set "_optimizer_cost_model"='IO';

System altered

从NL的算法来看,先扫描第一表,然后根据连接条件,把一个表的连接栏位的条件,放到第二个表中去做比较,
因此可以看出NL的成本为:第一个数据的成本*(第二个数据成本的*第一个数据集的行数)

准备了如下测试数据
create table T1
(
object_id NUMBER,
object_name VARCHAR2(128)
);
create index IDX_T1 on T1 (OBJECT_ID);

create table T2
(
object_id NUMBER,
object_name VARCHAR2(128)
);

create index IDX_T2 on T2 (OBJECT_ID);

insert into t1 select * from dba_objects;
insert into t2 select * from dba_objects;

收集统计信息

首先考察了NL的连接方式成本计算.

SQL> select /*+ USE_NL(t1 t2) */ count(t1.object_name)
from t1,t2
where t1.object_id=t2.object_id 2 3 ;

COUNT(T1.OBJECT_NAME)
---------------------
90924

Execution Plan
----------------------------------------------------------
Plan hash value: 821905481

--------------------------------------------------------------
| Id | Operation     | Name   | Rows | Bytes | Cost |
--------------------------------------------------------------
|   0 | SELECT STATEMENT    |      |    1 |   35 | 90992 |
|   1 | SORT AGGREGATE     |      |    1 |   35 |      |
|   2 |   NESTED LOOPS     |      | 90924 | 3107K| 90992 |
|   3 |    TABLE ACCESS FULL| T1     | 90924 | 2663K|   68 |
|* 4 |    INDEX RANGE SCAN | IDX_T2 |    1 |    5 |    1 |

可以看到总cost=(第一个数据集的扫描成本)+((第一个数据集的行数)*1(第二个数据集成本))=69+(90924*1)=90992

而hash连接的成本等于:(第一个数据集成本+第二个数据集成本)*1.75

select count(*)
from t1,t2
where t1.object_id=t2.object_id;

COUNT(*)
----------
90924

Execution Plan
----------------------------------------------------------
Plan hash value: 3668909712

-------------------------------------------------------------------------
| Id | Operation        | Name | Rows | Bytes |TempSpc| Cost |
-------------------------------------------------------------------------
|   0 | SELECT STATEMENT       | |     1 |    10 | |   112 |
|   1 | SORT AGGREGATE        | |     1 |    10 | | |
|* 2 |   HASH JOIN        | | 90924 |   887K| 1512K|   112 |
|   3 |    INDEX FAST FULL SCAN| IDX_T1 | 90924 |   443K| |    32 |
|   4 |    INDEX FAST FULL SCAN| IDX_T2 | 90925 |   443K| |    32 |
-------------------------------------------------------------------------

可以看到cost=(第一个数据集成本+第二个数据集成)*1.75=(32+32)*1.75=112

继续填t1,
SQL> select count(*) from t1;

COUNT(*)
----------
201751

SQL>select count(*)
from t1,t2
where t1.object_id=t2.object_id

COUNT(*)
----------
201751

Execution Plan
----------------------------------------------------------
Plan hash value: 625114054

-------------------------------------------------------------------------
| Id | Operation        | Name | Rows | Bytes |TempSpc| Cost |
-------------------------------------------------------------------------
|   0 | SELECT STATEMENT       | |     1 |    10 | |   178 |
|   1 | SORT AGGREGATE        | |     1 |    10 | | |
|* 2 |   HASH JOIN        | |   199K| 1945K| 1512K|   178 |
|   3 |    INDEX FAST FULL SCAN| IDX_T2 | 90925 |   443K| |    32 |
|   4 |    INDEX FAST FULL SCAN| IDX_T1 |   201K|   985K| |    70 |
-------------------------------------------------------------------------

根据公式算成本为178.5,基本接近178

在做HJ连接的成本计算的时候,笔者没有考虑明白为什么要乘以1.75.

阅读(2367) | 评论(0) | 转发(0) |

上一篇：Oracle 12c In Memeory新特性 Storage index

下一篇：MySQL 5.7的Optimizer跟踪解析

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6