Oracle 10g R2特性之数据仓库和集成特性（2）-sdccf-ChinaUnix博客

Fosdccf.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

sdccf

博客访问： 106267079
博文数量： 19283
博客积分： 9968
博客等级：上将
技术积分： 196062
用户组：普通用户
注册时间： 2007-02-07 14:28

文章分类

全部博文（19283）

香文化（0）
CU技术专题（2443）

Linux酷软（214）

tmp（0）

PostgreSQL（93）

Solaris（383）

AIX（173）

SCOUNIX（575）

DB2（1005）
涂鸦（9）
编程开发（1573）

Shell（386）

C/C++（1187）
数据库（6458）

MySQL（1750）

Sybase（465）

Oracle（3695）

Informix（548）
操作系统（8627）

HP-UX（0）

IBM AIX（2）

Sun Solaris（0）

BSD（1）

Linux（8597）

SCO UNIX（23）
未分配的博文（173）

文章存档

2011年（1）

2009年（125）

2008年（19094）

2007年（63）

我的朋友

相关博文

Oracle 10g R2特性之数据仓库和集成特性（2）

分类： Oracle

2008-04-20 21:06:04

文章来源：

　　使用多个 MV 进行查询重写

　　Oracle8i 中引入的查询重写特性在数据仓库开发人员和 DBA 中轰动一时。从本质上而言，它将用户查询重写为从 MV 而非表中进行选择以利用现成的摘要。例如，请考虑以下一家大型连锁酒店的数据库中的三个表。

SQL> DESC HOTELS 
Name                              Null?Type 
 ----------------------------------------- -------- ------------- 
HOTEL_ID                                  NOT NULL NUMBER(10) 
CITY                                               VARCHAR2(20) 
STATE                                              CHAR(2) 
MANAGER_NAME                                       VARCHAR2(20) 
RATE_CLASS                                         CHAR(2) 

SQL> DESC RESERVATIONS 
Name                              Null?Type 
 ----------------------------------------- -------- ------------- 
RESV_ID                                   NOT NULL NUMBER(10) 
HOTEL_ID                                           NUMBER(10) 
CUST_NAME                                          VARCHAR2(20) 
START_DATE                                         DATE 
END_DATE                                           DATE 
RATE                                               NUMBER(10) 

SQL> DESC TRANS 
Name                              Null?Type 
 ----------------------------------------- -------- ------------- 
TRANS_ID                                  NOT NULL NUMBER(10) 
RESV_ID                                   NOT NULL NUMBER(10) 
TRANS_DATE                                         DATE 
ACTUAL_RATE                                        NUMBER(10)

　　表 HOTELS 保存酒店的相关信息。当顾客预订酒店时，将在表 RESERVATIONS（包含房间价格报价）中创建一个记录。当顾客在酒店结帐时，将在另一个表 TRANS 中记录现金交易。

　　但在结帐前，酒店可能决定根据订房情况、升级、优惠等因素向顾客提供不同的房价。因此，最终的房价可能与预订时的报价不同，而且可以每天都各不相同。为正确记录这些价格变化，表 TRANS 有一行专门用来保存每天的房价信息。

　　为缩短查询响应时间，您可能决定根据用户发出的不同查询构建 MV，如：

create materialized view mv_hotel_resv 
refresh complete 
enable query rewrite 
as 
select city, resv_id, cust_name 
from hotels h, reservations r 
where r.hotel_id = h.hotel_id;

　　和

create materialized view mv_actual_sales 
refresh complete 
enable query rewrite 
as 
select resv_id, sum(actual_rate) from trans group by resv_id;

　　因此，如果设置了某些参数（如 query_rewrite_enabled = true），则类似如下所示的查询

select city, cust_name 
from hotels h, reservations r 
where r.hotel_id = h.hotel_id;

　　将重写为

select city, cust_name 
from mv_hotel_resv;

　　您可以通过运行该查询并启用自动跟踪来确认 MV。

SQL> set autot traceonly explain 
SQL> select city, cust_name 
2> from hotels h, reservations r 
3> where r.hotel_id = h.hotel_id; 

Execution Plan 
---------------------------------------------------------- 
0      SELECT STATEMENT Optimizer=ALL_ROWS (Cost=3 Card=80 Bytes=2480) 
1    0   MAT_VIEW ACCESS (FULL) OF 'MV_HOTEL_RESV' (MAT_VIEW) (Cost=3 Card=80 Bytes=2480)

　　注意，查询是如何从物化视图 MV_HOTEL_RESV 而非表 HOTELS 和 RESERVATIONS 中进行选择的。这正是您所需要的。同样，当您编写一个查询来汇总每个预订编号的实际价格时，将使用物化视图 MV_ACTUAL_SALES 而非表 TRANS。

　　我们来采用一个不同的查询。如果要查明每个城市的实际销售额，则将发出

select city, sum(actual_rate) 
from hotels h, reservations r, trans t 
where t.resv_id = r.resv_id 
and r.hotel_id = h.hotel_id 
group by city;

　　注意此查询结构：从 MV_ACTUAL_SALES 中，您可以获得 RESV_ID 和预订的总销售额。从 MV_HOTEL_RESV 中，您可以获得 CITY 和 RESV_ID。

　　您能将这两个 MV 连接在一起吗？当然可以，但在 Oracle 数据库 10g 第 2 版之前，查询重写机制只使用两个 MV 中的一个（而非两个）自动重写用户查询。

　　以下是 Oracle9i 数据库中的执行计划输出。您可以看到，只使用了 MV_HOTEL_RESV 和 TRANS 的整表扫描。

Execution Plan 
---------------------------------------------------------- 
0      SELECT STATEMENT Optimizer=ALL_ROWS (Cost=8 Card=6 Bytes=120) 
1    0   SORT (GROUP BY) (Cost=8 Card=6 Bytes=120) 
2    1     HASH JOIN (Cost=7 Card=516 Bytes=10320) 
3    2       MAT_VIEW REWRITE ACCESS (FULL) OF 'MV_HOTEL_RESV' (MAT_VIEW REWRITE)  
(Cost=3 Card=80 Bytes=1040) 
4    2       TABLE ACCESS (FULL) OF 'TRANS' (TABLE)  
(Cost=3 Card=516 Bytes=3612)

　　即使 MV 可用，该方法也将生成一个非最优的执行计划。唯一的救济就是创建另一个将所有三个表连接在一起的 MV。但该方法将导致 MV 的增多，从而大大增加刷新 MV 所需的时间。

　　Oracle 数据库 10g 第 2 版解决了此问题。现在，以上查询将重写为使用两个 MV，如执行计划中所示。

Execution Plan 
---------------------------------------------------------- 
0      SELECT STATEMENT Optimizer=ALL_ROWS (Cost=8 Card=6 Bytes=120) 
1    0   SORT (GROUP BY) (Cost=8 Card=6 Bytes=120) 
2    1     HASH JOIN (Cost=7 Card=80 Bytes=1600) 
3    2       MAT_VIEW REWRITE ACCESS (FULL) OF 'MV_ACTUAL_SALES' (MAT_VIEW REWRITE)  
(Cost=3 Card=80 Bytes=560) 
4    2       MAT_VIEW REWRITE ACCESS (FULL) OF 'MV_HOTEL_RESV' (MAT_VIEW REWRITE)  
(Cost=3 Card=80 Bytes=1040)

　　注意，该执行计划是如何只使用了 MV 而未使用任何其他基表的。

　　该增强功能在数据仓库中具有显著的优点，这是因为您不必为每个可能的查询创建和刷新 MV。相反，你可以在关键地方创建几个没有太多连接和聚合的 MV，Oracle 将使用它们来重写查询。

阅读(316) | 评论(0) | 转发(0) |

上一篇：Oracle 10g R2特性之数据仓库和集成特性（1）

下一篇：Oracle 10g R2特性之数据仓库和集成特性（3）

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6