分类: Oracle
2008-04-03 07:52:23
故障诊断基础架构-Fault Diagnosability Infrastructure
一直以来,当用户的数据库出现故障以后,当用户向Oracle请求协助时,反复繁杂的交互与数据收集折磨了无数的用户,而这一工作又是不可缺少的。
Oracle也一直试图简化这些工作,提高故障的分析和解决。
现在新引入的Fault Diagnosability Infrastructure就是来完成这一使命的。
这一架构用来收集和管理诊断数据,通常的诊断数据包括:
跟踪文件-trace files
转储文件-dumps
内核转储文件-core files
新的诊断数据
这一架构的引入目的在于更快速的问题诊断与解决,更少的用户交互已经减少和缩减故障的影响。
实现这一架构设想的一项技术是:首次故障后的自动自动诊断数据捕获-Automatic capture of diagnostic data upon first failure
当数据库故障、错误出现并被检测到时,故障诊断架构就被激活收集诊断数据,并且将数据库不同组件记录的相关数据收集并存储到数据库之外的诊断库中。这一诊断原理非常类似飞机飞行中的"黑匣子(Black Box)",Oracle因此也将FDI称为Oracle数据库的黑匣子,通过这个黑匣子的引入,Oracle希望能够收集到完善完整的数据用于故障诊断。
配合FDI的另外一项技术是事件打包服务-Incident packaging service (IPS) 和 incident packages
和一次错误或故障相关的数据可能很多,包括traces, dumps, health check reports以及其他数据,手工收集和整理这些数据曾经是用户必需完成的工作,下载IPS服务帮助我们自动打包压缩这些数据。
用户需要做的就是将这些打包数据传输给技术支持即可。
我们看到,FDI实际上又是一系列自动化服务的增强,这些增强旨在更快的问题分析诊断、更少的用户交互,从而实现更高的可用性。
自动化是Oracle一直坚持不懈的方向。
FDI的另外几项相关技术为:
Standardized trace formats
Health checks
Data Recovery Advisor
SQL Test Case Builder