全部博文(126)
分类: Oracle
2008-01-26 00:03:24
DBA应按如下方式对ORACLE数据库系统做定期监控
一、 DBA工作概要:
1. 每天对ORACLE数据库的运行状态,日志文件,备份情况,数据库的空间使用情况,系统资源的使用情况进行检查,发现并解决问题。
2. 每周对数据库对象的空间扩展情况,数据的增长情况进行监控,对数据库做健康检查,对数据库对象的状态做检查。
3. 每月对表和索引等进行Analyze,检查表空间碎片,寻找数据库性能调整的机会,进行数据库性能调整,提出下一步空间管理计划。对ORACLE数据库状态进行一次全面检查。
二、 每天的工作
1. 确认所有的INSTANCE状态正常
登陆到所有数据库或例程,检测ORACLE后台进程:
$ps –ef | grep ora
2. 检查文件系统的使用(剩余空间)。如果文件系统的剩余空间小于25%,需删除不用的文件以释放空间。(51job使用的是裸设备,只需关注表空间和数据文件使用率即可)
$df –k
3. 检查日志文件和trace文件记录alert和trace文件中的错误,每天会有定时mail发送。
4. 检查数据库当日备份的有效性。
对RMAN备份方式:
检查第三方备份工具(hpdp)的备份日志以确定备份是否成功
omnidb -sess -last 2 #检查近2天的备份情况
5. 检查数据文件的状态记录状态不是“online”的数据文件,并做恢复。
Select file_name from dba_data_files where status=’OFFLINE’;
6. 检查表空间的使用情况
SELECT tablespace_name, max_m, count_blocks free_blk_cnt, sum_free_m,to_char(100*sum_free_m/sum_m, '99.99') || '%' AS pct_free
FROM ( SELECT tablespace_name,sum(bytes)/1024/1024 AS sum_m FROM dba_data_files GROUP BY tablespace_name),
(
SELECT tablespace_name AS fs_ts_name, max(bytes)/1024/1024 AS max_m,
count(blocks) AS count_blocks, sum(bytes/1024/1024) AS sum_free_m FROM
dba_free_space GROUP BY tablespace_name )
WHERE tablespace_name = fs_ts_name;
7. 检查剩余表空间
SELECT tablespace_name, sum ( blocks ) as free_blk ,
trunc ( sum ( bytes ) /(1024*1024) ) as free_m,
max ( bytes ) / (1024) as big_chunk_k, count (*) as num_chunks
FROM dba_free_space GROUP BY tablespace_name;
8. 监控数据库性能
获取AWR或STATSPACK报表以及TOP时间点的SQL报告,并分析。
9. 检查数据库性能,记录数据库的cpu使用、IO、buffer命中率等等
使用vmstat,iostat,glance,top等命令
10. 日常出现问题的处理。
三、 每周的工作
1. 控数据库对象的空间扩展情况
根据本周每天的检查情况找到空间扩展很快的数据库对象,并采取相应的措施
-- 删除历史数据
可参照数据删除备份的文档
-- 扩表空间
alter tablespace add datafile ‘/dev/vgdb01/rtbs01_01’ size 2000M autoextend off;
-- 调整数据对象的存储参数
next extent
pct_increase
注:老HP数据库为10g的ASSM表空间管理方式,可以不要。
2. 监控数据量的增长情况
根据本周每天的检查情况找到记录数量增长很快的数据库对象,并采取相应的措施
-- 删除历史数据
可参照数据删除备份的文档
-- 扩表空间
alter tablespace add datafile ‘/dev/vgdb01/rtbs01_01’ size 2000M autoextend off;
3. 系统健康检查
检查以下内容:
spfile.ora
controlfile
redo log file
archiving
tablespace(system,temporary,tablespace fragment)
datafiles(autoextend,location)
object(number of extent,next extent, index)
4. 检查无效的数据库对象
SELECT owner, object_name, object_type FROM dba_objects WHERE status=’INVALID’;
5. 检查不起作用的约束
SELECT owner, constraint_name, table_name,
constraint_type, status
FROM dba_constraints
WHERE status = 'DISABLED’ AND constraint_type = 'P';
6. 检查无效的trigger
SELECT owner, trigger_name, table_name, status
FROM dba_triggers
WHERE status = 'DISABLED’;
四、 每月的工作
1. Analyze Tables/Indexes/Cluster
analyze table estimate statistics sample 50 percent;
可根据实际情况调整取样率,可考虑使用dbms_stats生成分析柱状图
2. 检查表空间和表的碎片
根据本月每周的检查分析数据库碎片情况,找到相应的解决方法
表空间碎片检查:
SELECT SUBSTR(ts.name, 1, 10) TSPACE,
tf.blocks BLOCKS,
SUM(f.length) FREE,
COUNT(*) PIECES,
MAX(f.length) BIGGEST,
MIN(f.length) SMALLEST,
ROUND(AVG(f.length)) AVERAGE
FROM sys.fet$ F, sys.file$ TF, sys.ts$ TS
WHERE ts.ts# = f.ts#
AND ts.ts# = tf.ts#
GROUP BY ts.name, tf.blocks
/
表的碎片检查:
select /*+ ordered */
u.name || '.' || o.name table_name,
lpad(decode(t.degree, 32767, 'DEFAULT', nvl(t.degree, 1)), 7) degree,
substr(to_char(100 * t.rowcnt /
(floor((p.value - 66 - t.initrans * 24) /
greatest(t.avgrln + 2, 11)) * t.blkcnt),
'999.00'),
2) || '%' density,
1 new_free,
99 - ceil((100 * (p.value - 66 - t.initrans * 24 -
greatest(floor((p.value - 66 - t.initrans * 24) /
greatest(t.avgrln + 2, 11)) - 1,
1) * greatest(t.avgrln + 2, 11)) /
(p.value - 66 - t.initrans * 24))) new_used,
ceil((t.blkcnt -
t.rowcnt /
floor((p.value - 66 - t.initrans * 24) / greatest(t.avgrln + 2, 11))) /
m.value) reads_wasted
from sys.tab$ t,
(select value
from sys.v_$parameter
where name = 'db_file_multiblock_read_count') m,
sys.obj$ o,
sys.user$ u,
(select value from sys.v_$parameter where name = 'db_block_size') p
where t.tab# is null
and t.blkcnt > m.value
and t.chncnt = 0
and t.avgspc > t.avgrln
and ceil((t.blkcnt -
t.rowcnt / floor((p.value - 66 - t.initrans * 24) /
greatest(t.avgrln + 2, 11))) / m.value) > 0
and o.obj# = t.obj#
and o.owner# != 0
and u.user# = o.owner#
order by 5 desc, 2
/
3. 寻找数据库性能调整的机会
比较每天对数据库性能的监控报告,确定是否有必要对数据库性能进行调整
4. 数据库性能调整
如有必要,进行性能调整。
5. 提出下一步空间管理计划
根据每周的监控,提出空间管理的改进方法。