Oracle 性能诊断艺术第四章笔记-deargentle-ChinaUnix博客

行在北京terry.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

deargentle

博客访问： 1395802
博文数量： 416
博客积分： 10495
博客等级：上将
技术积分： 4258
用户组：普通用户
注册时间： 2005-04-23 22:13

文章分类

全部博文（416）

虚拟化（7）
技巧（3）
oracle（40）
工作faq（7）
跑步日志（0）
监控（8）
任正非文集（4）
疑难杂症（9）
棒喝时代（37）
励志人生（17）
大城小事（58）

胡言乱语（0）
数据灾备（26）
网络管理（44）
信息安全（28）
.NIX学习（113）
未分配的博文（15）

文章存档

2015年（7）

2014年（42）

2013年（35）

2012年（14）

2011年（17）

2010年（10）

2009年（18）

2008年（127）

2007年（72）

2006年（23）

2005年（51）

我的朋友

相关博文

Oracle 性能诊断艺术第四章笔记

分类： Oracle

2014-11-15 15:30:04

第四章 系统和对象统计信息

4.1包dbms_stats简介

从9i开始，dbms_stats代替analyze，后者仅用于对象统计信息之外的用途，例如，index structure validate，行迁移的统计。

4.2系统统计信息

I/O开销模型(I/O cost model)：执行SQL语句所需的数据块读的多少

该方法的主要缺点是认为单块读和多块读开销相当，结果，优化器更多倾向于使用多块读操作，如全表扫描，直到8i，初始化参数optimizer_index_caching和optimizer_index_cost_adj解决了这个问题。但缺省值0和100，仅适用于OLAP环境，而不是常用的OLTP环境。

到了9i，产生了一种新的CPU开销模型（CPU cost model），它除了考虑I/O的多少之外，还考虑I/O子系统的性能。必须提供系统统计信息才可以使用CPU开销模型，系统统计信息包括：

I/O子系统的性能；

CPU的性能；

9i缺省没有系统统计信息；10G缺省就有(但缺省的值不一定是合适的)，除非SQL提示中指定no_cpu_costing，否则优化器都是使用CPU开销模型。或者使用隐含初始化参数：_optimizer_cost_model值为io时，指定使用I/O开销模型。

系统统计信息包括非工作量统计信息和工作量统计信息两种，前者是人工基准测试（自动模拟工作负载），后者使用应用程序基准测试（以实际的工作负载为准）。系统统计信息存放在aux_stats$表中。通过执行dbms_stats.gather_system_stats来进行收集。

一个数据库只有一套该信息，RAC系统所有实例使用同一个系统统计。

系统统计信息的状态和时间：

select pname,pval2 from aux_stats$ where sname='SYSSTATS_INFO'

PNAME PVAL2

DSTART 10-24-2009 14:15

DSTOP 10-24-2009 14:35

FLAGS

STATUS COMPLETED

STATUS 值为Badstats表示收集过程有错，这种情况下优化器不会使用这样的统计信息。

系统统计信息的结果：

select pname,pval1 from aux_stats$ where sname='SYSSTATS_MAIN'

PNAME PVAL1

CPUSPEED 1265 MHZ

CPUSPEEDNW 484.974958263773 每个CPU每秒钟处理的操作数（百万次）

IOSEEKTIM 10 平均磁盘寻道时间，缺省为10毫秒，本机为12.06

IOTFRSPEED 4096 平均每毫秒磁盘传输的字节，缺省为4096，实际上远不止这个数，本机7200转的笔记本硬盘，值为41248

MAXTHR

MBRC

MREADTIM

SLAVETHR

SREADTIM 4.423

非工作量统计信息的收集（注意，可能有时需要执行多次才生效）：

exec dbms_stats.gather_system_stats(gathering_mode => 'noworkload');

由于使用人工基准测试产生负载来衡量系统性能，所以应在相对空闲的时间执行，约1分钟内完成。

10G开始，非工作量统计信息是不能删除的，即使删除，数据库下次启动时会自动收集。

9i上，即使收集了，也不在数据字典aux_stats$中存储，只是显示状态为noworkload;

工作量统计信息的收集，要利用正常业务的工作负载来评估I/O性能，必须显示的收集后才有统计数据，才可用。它分为三个步骤:

1. 执行快照，并存储初始值到aux_stats$中（sname为sysstats_temp）

exec dbms_stats.gather_system_stats(gathering_mode => 'start');

2. 等待有代表性的业务运行，建议至少30分钟

select count(产地) from yhis.药品收发记录 --多块读

select * from yhis.病人信息 where 病人id=110 --单块读

3. 第二次快照

手工停exec dbms_stats.gather_system_stats(gathering_mode => 'stop');

自动停exec dbms_stats.gather_system_stats(gathering_mode => 'interval',interval => 30);

4. 根据两次快照的差值，产生系统统计信息。

下面的笔记本上的统计信息

PNAME	PVAL1
CPUSPEED	1392	单位MHZ, 只是一个基准线操作的内部校准
CPUSPEEDNW	781.577	每个CPU每秒钟处理的操作数（百万次）
IOSEEKTIM	12.06
IOTFRSPEED	41248
MAXTHR		系统最大IO吞吐量（字节/秒）
MBRC	14	一次多块读，平均读取块数
MREADTIM	8.656	多块数据平均读取时间，毫秒
SLAVETHR		并行处理从属线程的平均IO吞吐量（字节/秒）
SREADTIM	4.421	单块数据平均读取时间，毫秒

下面是某三甲医院的统计信息

CPUSPEEDNW	1107.385
IOSEEKTIM	3.457
IOTFRSPEED	26413.414
SREADTIM	1.082
MREADTIM	0.557
CPUSPEED	1119
MBRC	15
MAXTHR	444416
SLAVETHR

为了收集到有代表性的统计信息，可连续多天收集后取平均值，使用手工设定，调用过程dbms_stats.set_system_stats来进行。

下面是通过模拟工作负载来收集工作负载统计信息的方法(执行需要3-5分钟)：

Create Or Replace Procedure Oltp_Style As

l_Rec Yhis.住院费用记录%Rowtype;

l_n Number;

Begin

For I In 1 .. 10000 Loop

l_n := Trunc(Dbms_Random.Value(2, 1000000));

Begin

Select * Into l_Rec From Yhis.住院费用记录 Where ID = l_n;

Exception

When Others Then

Null;

End;

End Loop;

For I In 1 .. 3 Loop

Select Count(年龄) Into l_n From Yhis.病人信息;

End Loop;

End;

exec dbms_stats.drop_stat_table( user, 'SYSTEM_STATS' );

exec dbms_stats.create_stat_table( user, 'SYSTEM_STATS' );

exec dbms_stats.delete_system_stats;

declare

n number;

begin

oltp_style;

dbms_job.submit( n, 'oltp_style;' );

commit;

dbms_stats.gather_system_stats( gathering_mode => 'START',

stattab => 'SYSTEM_STATS',

statid => 'OLTP' );

select count(*) into n from user_jobs where what = 'oltp_style;';

while ( n > 0 )

loop

dbms_lock.sleep(5);

select count(*) into n from user_jobs where what = 'oltp_style;';

end loop;

dbms_stats.gather_system_stats( gathering_mode => 'STOP',

stattab => 'SYSTEM_STATS',

statid => 'OLTP' );

end;

alter system flush shared_pool;

begin

dbms_stats.import_system_stats

( stattab => 'SYSTEM_STATS', statid => 'OLTP', statown => user );

end;

select * from sys.aux_stats$;

系统统计信息对优化器的影响

CPU开销的计算，10.2开始，计算访问一个列的开销：

Cpu_cost=column_position*20

即CPU开销和列的位置相关，每往后一列，增加20（所以，列的位置会影响SQL性能）

验证脚本：

SET ECHO ON

DROP TABLE t;

DELETE plan_table;

CREATE TABLE t (c1 NUMBER, c2 NUMBER, c3 NUMBER,

c4 NUMBER, c5 NUMBER, c6 NUMBER,

c7 NUMBER, c8 NUMBER, c9 NUMBER);

INSERT INTO t VALUES (1, 2, 3, 4, 5, 6, 7, 8, 9);

execute dbms_stats.gather_table_stats(user,'t')

EXPLAIN PLAN SET STATEMENT_ID 'c1' FOR SELECT c1 FROM t;

EXPLAIN PLAN SET STATEMENT_ID 'c2' FOR SELECT c2 FROM t;

EXPLAIN PLAN SET STATEMENT_ID 'c3' FOR SELECT c3 FROM t;

EXPLAIN PLAN SET STATEMENT_ID 'c4' FOR SELECT c4 FROM t;

EXPLAIN PLAN SET STATEMENT_ID 'c5' FOR SELECT c5 FROM t;

EXPLAIN PLAN SET STATEMENT_ID 'c6' FOR SELECT c6 FROM t;

EXPLAIN PLAN SET STATEMENT_ID 'c7' FOR SELECT c7 FROM t;

EXPLAIN PLAN SET STATEMENT_ID 'c8' FOR SELECT c8 FROM t;

EXPLAIN PLAN SET STATEMENT_ID 'c9' FOR SELECT c9 FROM t;

SELECT statement_id, cpu_cost AS total_cpu_cost,

cpu_cost-lag(cpu_cost) OVER (ORDER BY statement_id) AS cpu_cost_1_coll,

io_cost

FROM plan_table

WHERE id = 0

ORDER BY statement_id;

DROP TABLE t;

PURGE TABLE t;

优化器计算总开销的公式：

工作量统计信息

Cost=io_cost+cpu_cost/(cpuspeed*sreadtim*1000)

Sreadtim=单块数据平均读取时间

非工作量统计信息

Cost=io_cost+cpu_cost/( CPUSPEEDNW *sreadtim*1000)

其中sreadtim= IOSEEKTIM+db_block_size/ IOTFRSPEED

mreadtim= IOSEEKTIM+mbrc*db_block_size/ IOTFRSPEED

CPUSPEEDNW=每个CPU每秒钟处理的操作数

IOSEEKTIM=平均磁盘寻道时间

IOTFRSPEED=平均每毫秒磁盘传输的字节，缺省为4096，收集后是它的10倍以上

如果存在工作量统计信息，优化器会忽略非工作量统计信息。

4.3对象统计信息

直方图

频度直方图

桶数：唯一值的数量，最大254，每个桶在user_tab_histogram中存储为一行；

列endpoint_value是number型，非数字型的列进行了一个转换，只取前6个字节。如果前面几个字符相同，则直方图的分布会严重不均衡。

列endpoint_number是累计计数，前去前一行的数，则为当前值的计数。

等高直方图

桶数大于254时，会使用等高直方图，所有的值分为5个段。

等高直方图可能导致错误的估算，引起查询优化器估值不准。

扩展的统计信息

11G以上，考虑到查询中列的相关性，可以收集扩展的统计信息。

Dbms_stats.create_extended_stats

4.3.2收集对象统计信息

1. dbms_stats包

Gather_database_stats：收集整个数据库；

Gather_schema_stats：收集指定模式的所有对象；

Gather_table_stats：收集表(索引可选)；

Gather_index_stats：收集索引；

数据字典的对象统计信息(10G以上才提供)：dbms_stats.gather_dictionary_stats

数据字典的固定表的特定对象统计信息(10G以上才提供)：

dbms_stats.gather_fixed_objects_stats

查询该过程处理了哪些表select * from v$fixed_table where type='TABLE'；

锁定和解锁统计信息

Dbms_stats.lock_schema_stats，Dbms_stats.lock_table_stats

Dbms_stats.unlock_schema_stats，Dbms_stats.unlock_table_stats

几个重要的参数：

Cascade：9i缺省为False，10G缺省为auto（自动决定是否收集索引，规则是什么?，是数据变化量吗？没有找到资料），所以，如果要收集索引，最好指定为True；

Options：缺省为Gather，处理所有对象，指定为gather stale只收集失效的对象，指定为gather empty时，只收集没有统计信息的对象。

对象统计信息的时效性：all(dba/user)_tab_modifications

10G，修改超过10%的行认为失效，11G可修改stale_percent参数来配置；

9i通过表的monitoring参数来监控表数据变化；

10G由数据库参数statistics_level来决定是否启动变化计数。缺省为typical，启动计数；

Estimate_percent：是否采样收集，该参数指定的值仅指定采样的最小百分比。100等同于Null，表示不采样，0表示auto_sample_size，9i缺省为Null，10G缺省为auto_sample_size，对于大表，使用0.5%或0.1%，都不错，数据库会自动校正较小的值。

Method_opt：是否收集直方图，以及收集的最大桶数。Null表示只收集列的统计信息（最大，最小值等），不收集直方图。

9i缺省是for all columns size 1；10G缺省是for all columns size auto；为了加快速度，建议使用for all indexed columns（只收集索引上的列）。

Size repeat 刷新可用的直方图；

Size 1…254指定最大桶数，1表示不创建直方图；

Size skewonly只收集非均匀分布的列的直方图，自动确定桶数；

Size auto 只收集非均匀分布的列，并且根据列使用历史统计表决定是否收集；

查询优化器生成执行计划时，会跟踪Where 子句中列的使用情况，存储在col_usage$表中。

没有使用过的列不会在该表中出现。

SELECT c.name, cu.timestamp,

cu.equality_preds AS equality, cu.equijoin_preds AS equijoin,

cu.nonequijoin_preds AS noneequijoin, cu.range_preds AS range,

cu.like_preds AS "LIKE", cu.null_preds AS "NULL"

FROM sys.col$ c, sys.col_usage$ cu, sys.obj$ o, sys.user$ u

WHERE c.obj# = cu.obj# (+) AND c.intcol# = cu.intcol# (+)

AND c.obj# = o.obj# AND o.owner# = u.user#

AND o.name = '病人信息' AND u.name = 'YHIS'

ORDER BY c.col#;

Degree：指明收集一个对象统计时所用的从属时程数量。指定为Null时，使用对象自身的并行度。注意：多个对象的处理是顺序执行的，这个并行只是基于一个对象范围内。要并行收集多个对象，必须手工并行（同时启动多个执行任务）。

No_invalidate：是否使收集的对象相关的游标失效。为false时，立即失效。9i缺省是false，10G缺省为auto_invalidate，即Null，表示过一段时间后失效，目的是为了避免集中重新解析所有相关游标。

2.配置dbms_stats

10G以上才可用，通过Set_param过程修改 dbms_stats的参数缺省值，包括cascade,estimate_percent,degree,method_opt,no_invalidate,granuarity。

Set_param过程的参数：autostats_target被作业gather_stats_job使用，缺省是auto表示由作业决定要收集的对象，all表示处理所有对象,oracle表示仅处理数据字典的对象。

11G，除了全局的默认值外，还可以在模式级，表级设置默认值。

使用optstat_hist_control$查看全局默认值，表级默认值可查看dba_tab_stat_prefs

3. 调度收集统计信息

10G缺省周一到周五每晚10点，持续8小时，周六到周日全天。

SELECT program_name, schedule_name, schedule_type, enabled, state

FROM dba_scheduler_jobs

WHERE owner = 'SYS'

AND job_name = 'GATHER_STATS_JOB';

SELECT program_action, number_of_arguments, enabled

FROM dba_scheduler_programs

WHERE owner = 'SYS'

AND program_name = 'GATHER_STATS_PROG';

禁用作业：dbms_scheduler.disable(name=>’sys.gather_stats_job’)；

调度结束后，会生成一个跟踪文件，记录了未处理的对象。

11G，该作业集成进了自动维护任务。缺省周一到周五每晚10点，持续4小时，周六到周日6点，持续20个小时。

SELECT task_name, status

FROM dba_autotask_task

WHERE client_name = 'auto optimizer stats collection';

4.其它

11G新增一个概念，待定的统计信息。测试时，可以在会话级使用未发布的统计信息。

Create index 和alter index 后面增加compute statistics子句，可在创建或修改索引同时收集统计信息。因为它使用的额外资源很少，几乎可以忽略，所以很有用。

9i，需要明确指定该子句才会收集。10G缺省是启用的，除非对象被锁定统计信息。

比较统计信息

dbms_stats.diff_table_stats_in_stattab

dbms_stats.diff_table_stats_in_history

dbms_stats.diff_table_stats_in_pending

统计信息历史

10G以后，收集统计信息后，旧的统计信息会自动备份，缺省保留30天

Dbms_stats. get_stats_history_retention，dbms_stats.alter_stats_history_retention

统计信息的变化日志

Dba(all/user)_tab_stats_history

恢复统计信息

dbms_stats.restore_table_stats，……

统计信息处理的日志(数据库、数据字典，模式级，未明细到对象级)

dba_optstat_operations

转自：http://www.cnblogs.com/zyk/archive/2010/06/08/1753680.html

阅读(1187) | 评论(0) | 转发(0) |

上一篇：几个常用VIEW说明

下一篇：oracle 归档日志查看方法--logminer

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6