来自农村的老实娃
分类: Oracle
2007-11-27 10:08:44
需要在数据库中进行更改时 — 无论是进行微小的改动(如变更初始化参数和数据库属性)还是进行不可避免的较大改动(如应用补丁集),您最关心什么?对于您的到 Oracle 数据库 11g 的升级,您最关心的是什么?
对我而言,我最关心的是更改是否会带来“破坏性”风险。即使微小的改动也有可能引发多米诺骨牌效应,最终导致严重后果。
为了将这种风险降至最低,许多厂商在类似于生产环境的控制环境中进行更改,应用类似于生产系统的负载并观察随之产生的影响。复制生产系统非常简单(至少从技术层面上讲),但再现负载却是另一回事。说起来容易做起来难。
多数机构会采用一些可自动运行以模拟真实用户活动的第三方负载生成工具进行尝试。在大多数情况下,这种方法是可以的,但其始终无法真正忠实地再现生产数据库负载。这些第三方工具只是通过不同参数执行预编写的查询若干次;您必须向这些工具提供查询并给定其可以随机使用的参数范围。这并不能代表您的生产系统负载,而仅仅是运行了一小部分执行了若干次的生产负载,因此,这只是对 1% 的应用程序代码进行了测试。最糟糕的是,这些工具要求您自己提供所有来自生产负载的查询,对于小型应用程序而言,这可能需要数周或数月,对于复杂些的而言,则可能需要多达一年的时间。
如果可以,在数据库本身内记录所有数据库操作(与 DML 相关的操作及其它),而后按这些操作出现的真实顺序进行重放,难道不是一种更好的方法吗?
数据库重放与另一个工具 SQL 性能分析器共同构成了 Oracle 数据库 11g 的“真正应用测试”选件。这两个工具之间的主要不同在于涉及的范围:数据库重放适用于捕获和重放数据库内的所有(符合某些筛选条件)活动,而 SQL 性能分析器可用于捕获特定的 SQL 语句并对其进行重放。(在数据库重放中,您无法查看或访问捕获到的特定 SQL,而在 SQL 性能分析器中则可以)。后者的一个显著优势是 SQL 调整,因为您可以调整由应用程序执行的 SQL 语句并评估其影响。(本系列即将推出有关 SQL 性能分析器介绍的文章。)
理论上,数据库重放的工作顺序如下图所示。
例如,您注意到月末利息计算程序导致问题出现,并猜想更改参数将简化流程。您必须做的是捕获月末程序运行期间内的负载,在测试系统上对参数进行更改,然后在该测试系统上重放捕获文件。如果性能有所提升,则表明此解决方案可行。如果性能没有提升,这也仅仅是个测试系统而已。您不会妨碍到生产数据库的运行。
在我看来,单为了使用该工具,也值得升级到 Oracle 数据库 11g。下面将介绍该工具的工作原理。
$ cd /home/oracle $ mkdir dbcapture
SQL> create directory dbcapture as '/home/oracle/dbcapture';目录创建完成。
下面是一个可完成此任务的小的 PL/SQL 代码片断。该代码片断将生成 1,000 个插入语句并进行执行。(注意,此代码片段将生成 1,000 个不同的插入语句,而不是在同样的语句或程序中执行 1,000 次插入操作。)
declare l_stmt varchar2(2000); begin for ctr in 1..1000 loop l_stmt := 'insert into trans values ('|| trans_id_seq.nextval||','|| ''''||dbms_random.string('U',20)||''','|| 'sysdate - '|| round(dbms_random.value(1,365))||','|| round(dbms_random.value(1,99999999),2)||','|| round(dbms_random.value(1,99))||')'; dbms_output.put_line(l_stmt); execute immediate l_stmt; commit; end loop; end;只创建包含以上内容的文件;不要运行。将该文件命名为 add_trans.sql。
SQL> create restore point gold;(第 1 步到第 4 步仅对本课而言必不可少。如果没有目录对象,则在生产环境中执行操作时无需这些步骤。)
现在,准备开始捕获。导航到 Oracle Enterprise Manager Database Control 中的 Database Replay 主页面。在该主页中,选择 Software and Support(如下图所示,标记为“1”)
启动捕获流程后,可能会有一些正处于运行中的事务,其中并非所有都可进行捕获。重启数据库将使这些正处于运行中的事务无效。此外,共享池可能具有数个 SQL 语句,其中一些可缓存和固定。这可能会与捕获的负载相冲突。重启数据库可清除这些“干扰”。而且,重启数据库可以为您提供一个干净备份在测试系统上进行恢复,从而确保您在与生产系统的 SCN 号相同的系统上重放活动。
出于以上这些原因,特别是第一个,Oracle 建议在捕获之前重启数据库(该选项为默认设置)。但这不是必须的。如果不希望重启,请选择另一个单选按钮。
您也可以添加其它过滤器。例如,要添加排除所有 Perl 程序的过滤器,可单击 Add Another Row 并在域“Filter Name”和“Value”中分别输入“perl”和“%perl%”。同样,纠正默认参数中的小错误 — Oracle Management Agent 过滤器的值应是“%emagent%”,而不是“emagent%”。
或者,假设您希望排除所有 SYS 用户操作。那么,您需要从 Session Attribute 下拉框中选择 USER,并在“Value”列中输入 SYS。
SQL> connect scott/tiger SQL> @add_trans这将在表 TRANS 中执行 1,000 个插入语句。
在同一数据库中进行重放并不常见,但有可能出现。例如,您可能希望在主系统中重放事务,测试完成后闪回至起始点。您可能会中断一个时段,以在期间测试参数更改(您将在同一数据库中进行此更改)的效果。
您需要在播放捕获的负载之前对其进行预处理。预处理可使这些捕获的文件为重放做好准备。
捕获负载并进行预处理后,您就可在测试数据库中进行重放了。出于教学目的,您在同一数据库中预处理了负载,并将使用同一数据库重放这些活动。为此,您必须将数据库重置回起始点。您可以通过将其闪回到在捕获流程期间创建的恢复点 GOLD 来轻松实现此目的。
SQL> shutdown immediate; ... database shuts down ... SQL> startup mount ... instance starts and mounts the database ... SQL> flashback database to restore point gold; ... database will be flashed back ... SQL> alter database open resetlogs; ... database is opened ...现在,您处于负载启动之前的一个点,可以重放之前捕获的负载了。按照以下步骤对其进行重放。
本例中,您将数据库闪回至该 SCN 号。因此,您遵循了规定。
$ wrc userid=system password=* replaydir=/home/oracle/dbcapture当然,您需要提供正确的 SYSTEM 口令。如果捕获文件存储在另一个地方,则需更改目录名。应返回以下消息:
Workload Replay Client: Release 11.1.0.4.0 - Beta on Wed Jun 6 01:47:53 2007 Copyright (c) 1982, 2006, Oracle. All rights reserved. Wait for the replay to start (01:47:53)此时,重放客户端仅仅是等待重放管理程序(数据库控制)告知其启动。您可以决定是否启动多个客户端来并行处理负载。
不一定。看看下一个量度:Database Time(数据库时间)。该值没有变化 — 大约 2 秒钟。因此,您实施的这些更改没有带来任何明显的改善。
数据库重放可轻松应对这种情况。您可以从生产系统捕获负载,而后将捕获的负载移至不同的测试系统中,并将 db_file_multiblock_read_count 设为 32,然后重放负载。之后,您可以将数据库闪回至初始状态,将该值设为 64,并重放相同的负载。您可以针对该参数所有可能的值重复执行这一过程:闪回、设置值、重放捕获的负载。每次重放时,您可捕获重放前后的 AWR 快照并进行比较。然后选择可带来最佳整体结果的参数值。如果没有数据库重放,则根本不可能确定出最佳值。
操作系统升级 — 您计划升级操作系统或只是应用一个小补丁来修复 I/O 问题,但您如何能确保它不会带来任何破坏或带来一些其它问题?很简单:只要捕获负载并在应用补丁的测试系统中对其进行重放。该方法同样也适用于内核参数更改。
应用补丁 — 假设您发现一个错误,并且有相应的补丁可用。但您无法确保其会对现有操作产生何种影响,当然,您也可以和企业中 1000 位其他用户共同找出答案。数据库重放将为您解决这一难题。
调试 — 总是会有一些会带来意外结果的令人讨厌的程序。幸运的是,有了数据库重放,调试变得前所未有的轻松。只需在程序运行期间捕获负载,并移至一个新系统,更改程序逻辑以加入一些调试信息,而后重放负载、分析输出并解决问题。如果第一次并未凑效,不要失去信心。重复该过程(从重放开始;无需再次捕获)直至找到解决方案。
对象更改 — 您希望添加索引或将索引从 b 树转换为位图。这会对 INSERT 语句产生何种影响?会在何处产生影响?不要猜测;只需捕获负载并在测试系统中进行重放即可。
数据库升级 — 这是梦寐以求的更改确保。升级至 Oracle 数据库 11g 的时代已经到来。最大的问题是:您所有的应用程序都会正常运行甚至是表现更好吗?无需多虑,只要从 Oracle 数据库 10g 捕获负载并在 Oracle 数据库 11g 中进行重放即可。您不是在新版本上测试一些复合事务,而是在测试应用程序每天都在使用的 SQL。如果有些事情并未按计划进行,则在新系统中对其进行调整,直至您获得完全满意的结果。
(注:截至本文撰写之日,Oracle 数据库 11g 还只有测试版,尚不支持来自 Oracle 数据库 10g 的捕获。但是,该功能将在 Oracle 数据库 11g 的生产版中提供。)
平台更改 — 假设您希望将数据库平台从 Solaris 移植到 HP-UX(其中没有提供适用于文件系统的异步 I/O)。性能是否还会一样?为什么要猜测?只要捕获 Solaris 中的负载并在 HP-UX 中进行重放即可。
转换到 Oracle 真正应用集群 (RAC) — 这是一个普遍问题:您计划将数据库从单一实例转换为 RAC 实例。应用程序表现是否如初?获取答案的唯一方法是运行实际的负载,对其进行捕获,而后在 RAC 数据库中进行重放。
更改从来都是困难重重,但也不再是无法忍受。您可以通过使用新的数据库重放工具捕获最终用户放入系统中的确切活动,而后在测试系统上进行重放,以精确地衡量更改影响来降低多数风险,而这些都只需几下鼠标点击和键盘敲击即可实现。请记住,您还可以测试应用程序的功能,并不仅仅限于性能