Oracle Redo文件恢复-liyf0371-ChinaUnix博客

liyf0371peter1981.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

liyf0371

博客访问： 3441260
博文数量： 631
博客积分： 10716
博客等级：上将
技术积分： 8397
用户组：普通用户
注册时间： 2008-04-01 22:35

文章分类

全部博文（631）

AWS（1）
考试认证（4）
HP-UX（11）
JSP程序设计（0）
Linux集群（9）
网络安全（7）
休闲IT（5）
Aix和IBM小型机（59）
Solaris和Sun小型（51）
Oracle数据库（273）
Cisco网络技术（49）
Linux（82）
Jboss（4）
Shell脚本（74）
未分配的博文（2）

文章存档

2020年（2）

2019年（22）

2018年（4）

2017年（37）

2016年（22）

2015年（1）

2013年（12）

2012年（20）

2011年（19）

2010年（20）

2009年（282）

2008年（190）

我的朋友

相关博文

Oracle Redo文件恢复

分类： Oracle

2011-04-11 20:46:34

REDO文件丢失或者损坏的恢复

REDO文件的功能描述

REDO文件存储所有数据库的变更内容和每一次变更所需的重做脚本，是数据库不可缺少的一部分，如果REDO GROUP中只有一个REDO文件，同时这个REDO文件被损坏，则系统切换到这个REDO GROUP时，数据库将直接DOWN机;如果REDO GROUP中有多个REDO文件，其中一个或者多个REDO被损坏，只要该组中还有一个好的REDO文件，则系统将报警（写入alert.log文档中），数据库仍然可以超常运行。
REDO文件在数据库恢复时提供前滚所需的内容。

查看REDO 相关信息的视图有：V$LOG,V$LOGFILE,V$INSTANCE_RECOVERY
SQL> DESC V$INSTANCE_RECOVERY;
名称是否为空? 类型
----------------------------------------- -------- ------
RECOVERY_ESTIMATED_IOS NUMBER
ACTUAL_REDO_BLKS NUMBER
TARGET_REDO_BLKS NUMBER
LOG_FILE_SIZE_REDO_BLKS NUMBER
LOG_CHKPT_TIMEOUT_REDO_BLKS NUMBER
LOG_CHKPT_INTERVAL_REDO_BLKS NUMBER
FAST_START_IO_TARGET_REDO_BLKS NUMBER
TARGET_MTTR NUMBER
ESTIMATED_MTTR NUMBER
CKPT_BLOCK_WRITES NUMBER
OPTIMAL_LOGFILE_SIZE NUMBER
ESTD_CLUSTER_AVAILABLE_TIME NUMBER
WRITES_MTTR NUMBER
WRITES_LOGFILE_SIZE NUMBER
WRITES_LOG_CHECKPOINT_SETTINGS NUMBER
WRITES_OTHER_SETTINGS NUMBER
WRITES_AUTOTUNE NUMBER
WRITES_FULL_THREAD_CKPT NUMBER
一般情况下,最好有3-5个REDO GROUP,每个REDO GROUP中有两个成员,放在不同的磁盘资源上。同一个REDO GROUP 中的REDO文件的大小尽量设置为相同，否则系统以最小的一个为基准，比较浪费空间。各个REDO GROUP 的大小也最好一致。

REDO文件恢复实例

2.1查看REDO 相关视图
SQL> select * from v$log;
GROUP# THREAD# SEQUENCE# BYTES MEMBERS ARC STATUS FIRST_CHANGE# FIRST_TIME
---------- ---------- ---------- ---------- ---------- --- ---------------- ------------- -------------------
1 1 14 10485760 2 YES ACTIVE 1304089 2006-07-06 12:33:59
2 1 15 10485760 2 YES INACTIVE 1314889 2006-07-06 15:55:10
3 1 16 10485760 2 NO CURRENT 1323514 2006-07-07 08:33:21
STATUS状态的解释:
CURRENT: 当前的REDO文件,REDO BUFFER 的内容有LGWR进程写入当前REDO文件,如果丢失该组文件,会造成数据的丢失.
ACTIVE : 文件中含有的内容还没有写入到ARCHIVELOG文件中,如果丢失该组文件也会造成数据的丢失.
INACTIVE: 已经归档,丢失文件不会造成数据丢失,不过在做数据库的恢复时,该组文件可以用来做前滚操作.
SQL> SELECT * FROM V$LOGFILE ORDER BY GROUP#;
GROUP# STATUS TYPE MEMBER IS_
---------- ------- ------- ------------------------------ ---
1 ONLINE C:\ORADATA\AIDU\REDO01.LOG NO
1 ONLINE C:\ORADATA\AIDU\REDO01B.LOG NO
2 ONLINE C:\ORADATA\AIDU\REDO02.ORA NO
2 ONLINE C:\ORADATA\AIDU\REDO02B.ORA NO
3 ONLINE C:\ORADATA\AIDU\REDO03.LOG NO
3 ONLINE C:\ORADATA\AIDU\REDO03B.LOG NO
已选择6行。
可以看到,当前数据库有3个REDO GROUP,每个GROUP 含有两个MEMBER(REDO文件).

2.2 增加REDO GROUP
SQL> alter database add logfile group 4 'C:\ORADATA\AIDU\REDO04.ORA' SIZE 10M REUSE;
数据库已更改。
SQL> SELECT * FROM V$LOGFILE ORDER BY GROUP#;
GROUP# STATUS TYPE MEMBER IS_
---------- ------- ------- ------------------------------ ---
1 ONLINE C:\ORADATA\AIDU\REDO01B.LOG NO
1 ONLINE C:\ORADATA\AIDU\REDO01.LOG NO
2 ONLINE C:\ORADATA\AIDU\REDO02.ORA NO
2 ONLINE C:\ORADATA\AIDU\REDO02B.ORA NO
3 ONLINE C:\ORADATA\AIDU\REDO03B.LOG NO
3 ONLINE C:\ORADATA\AIDU\REDO03.LOG NO
4 ONLINE C:\ORADATA\AIDU\REDO04.ORA NO
已选择7行。

2.3 删除REDO GROUP
SQL> ALTER DATABASE DROP LOGFILE GROUP 4;
数据库已更改。
SQL> SELECT * FROM V$LOGFILE ORDER BY GROUP#;
GROUP# STATUS TYPE MEMBER IS_
---------- ------- ------- ------------------------------ ---
1 ONLINE C:\ORADATA\AIDU\REDO01.LOG NO
1 ONLINE C:\ORADATA\AIDU\REDO01B.LOG NO
2 ONLINE C:\ORADATA\AIDU\REDO02.ORA NO
2 ONLINE C:\ORADATA\AIDU\REDO02B.ORA NO
3 ONLINE C:\ORADATA\AIDU\REDO03.LOG NO
3 ONLINE C:\ORADATA\AIDU\REDO03B.LOG NO
已选择6行。

2.4 REDO GROUP中增加REDO文件（MEMBER）
SQL> ALTER DATABASE ADD LOGFILE MEMBER 'C:\ORADATA\AIDU\REDO01C.LOG' TO GROUP 1;
数据库已更改。
SQL> SELECT * FROM V$LOGFILE ORDER BY GROUP#;
GROUP# STATUS TYPE MEMBER IS_
---------- ------- ------- ------------------------------ ---
1 INVALID ONLINE C:\ORADATA\AIDU\REDO01C.LOG NO
1 ONLINE C:\ORADATA\AIDU\REDO01.LOG NO
1 ONLINE C:\ORADATA\AIDU\REDO01B.LOG NO
2 ONLINE C:\ORADATA\AIDU\REDO02.ORA NO
2 ONLINE C:\ORADATA\AIDU\REDO02B.ORA NO
3 ONLINE C:\ORADATA\AIDU\REDO03.LOG NO
3 ONLINE C:\ORADATA\AIDU\REDO03B.LOG NO
已选择7行。
我们注意到新建的MEMBER的状态为INVALID,这个不用担心，等下次切换到该组，然后状态就会修改为正常。

2.5 REDO GROUP中删除REDO 文件（MEMBER）
SQL> ALTER DATABASE DROP LOGFILE MEMBER 'C:\ORADATA\AIDU\REDO01C.LOG';
数据库已更改。
SQL> SELECT * FROM V$LOGFILE ORDER BY GROUP#;
GROUP# STATUS TYPE MEMBER IS_
---------- ------- ------- ------------------------------ ---
1 ONLINE C:\ORADATA\AIDU\REDO01.LOG NO
1 ONLINE C:\ORADATA\AIDU\REDO01B.LOG NO
2 ONLINE C:\ORADATA\AIDU\REDO02.ORA NO
2 ONLINE C:\ORADATA\AIDU\REDO02B.ORA NO
3 ONLINE C:\ORADATA\AIDU\REDO03.LOG NO
3 ONLINE C:\ORADATA\AIDU\REDO03B.LOG NO
已选择6行。
注意：不可以删除REDO GROUP 中所有的REDO 文件,这样会报错，如下所示：
SQL> ALTER DATABASE DROP LOGFILE MEMBER 'C:\ORADATA\AIDU\REDO01.LOG';
数据库已更改。
SQL> ALTER DATABASE DROP LOGFILE MEMBER 'C:\ORADATA\AIDU\REDO01B.LOG';
ALTER DATABASE DROP LOGFILE MEMBER 'C:\ORADATA\AIDU\REDO01B.LOG'
*第 1 行出现错误:
ORA-00361: 无法删除最后一个日志成员 C:\ORADATA\AIDU\REDO01B.LOG (组 1)

2.6 已经归档的REDO文件损坏的恢复
所谓已经归档的REDO文件就是在V$LOG视图中状态为INACTIVE的REDO文件。
这些文档的丢失，不会对数据库造成任何影响，但需要及时的恢复，否则切换到这个组时将会发生错误。
解决问题有两个办法：

A.删除这个

REDO GROUP,

记住删除后数据库的

REDO GROUP

数目不应小于

，如果当前

REDO GROUP

数目为

，则不可以使用这个办法。

B.在组中增加新的同样大小的REDO文件，然后删除原来的MEMBER。增加、删除REDO文件的方法见上面的2.4,2.5。

2.7没有归档的REDO文件损坏的恢复

2.7.1 简述
所谓没有归档的REDO文件就是在V$LOG视图中状态为ACTIVE,CURRENT的REDO文件。如果没有归档的REDO GROUP中含有多个REDO 文件，丢失或者损坏的只是部分REDO文件，则可以通过复制正常的REDO文件，覆盖损坏的REDO文件的方式解决问题，数据不会丢失，不用做恢复操作。
如果没有归档的REDO GROUP组中所有的REDO文件都丢失或者损坏，将会导致数据库数据丢失，如果没有归档的REDO GROUP 为当前组，则数据库立即DOWN机。当这个情况发生时，就意味着数据的丢失，我们只能将数据库恢复到前一次的归档日志切换时刻。

2.7.2 建立测试环境
检查当前的REDO GROUP为第1组.
SQL> SELECT * FROM V$LOG;
GROUP# THREAD# SEQUENCE# BYTES MEMBERS ARC STATUS
---------- ---------- ---------- ---------- ---------- --- ----------------
FIRST_CHANGE# FIRST_TIME
------------- -------------------
1 1 17 10485760 1 NO CURRENT
1333209 2006-07-07 11:47:23
2 1 15 10485760 2 YES INACTIVE
1314889 2006-07-06 15:55:10
3 1 16 10485760 2 YES INACTIVE
1323514 2006-07-07 08:33:21
建立一个测试表,这个数据库的变化存放在当前的REDO文件中。
SQL> CREATE TABLE AIDU.TEST_FOR_REDO AS SELECT * FROM AIDU.TEST02;
表已创建。

2.7.3 模拟灾难发生
SQL> SHUTDOWN ABORT;
ORACLE 例程已经关闭。
SQL>HOST DELETE C:ORADATAAIDUREDO01*.* #删除当前日志组的所有成员文件
SQL> STARTUP ＃启动数据库时将报找不到数据库文件的错误,数据库只能启动到MOUNT状态。
ORA-32004: obsolete and/or deprecated parameter(s) specified
ORACLE 例程已经启动。

Total System Global Area 268435456 bytes
Fixed Size 1248504 bytes
Variable Size 96469768 bytes
Database Buffers 167772160 bytes
Redo Buffers 2945024 bytes
数据库装载完毕。
ORA-00313: 无法打开日志组 1 (用于线程 1) 的成员
ORA-00312: 联机日志 1 线程 1: 'C:\ORADATA\AIDU\REDO01B.LOG'
ORA-27041: 无法打开文件
OSD-04002: 无法打开文件
O/S-Error: (OS 2) 系统找不到指定的文件。
SQL> SELECT OPEN_MODE FROM V$DATABASE;
OPEN_MODE
----------
MOUNTED

2.7.4 进行灾难恢复

尝试使用RESETLOG或者NORESETLOGS打开数据库，结果失败
SQL> alter database open resetlogs;
alter database open resetlogs
*第 1 行出现错误:
ORA-01139: RESETLOGS 选项仅在不完全数据库恢复后有效
SQL> alter database open noresetlogs;
alter database open noresetlogs
*第 1 行出现错误:
ORA-01139: RESETLOGS 选项仅在不完全数据库恢复后有效

尝试删除当前被破坏的REDO GROUP，结果失败
SQL> alter database drop logfile group 1;
alter database drop logfile group 1
*
第 1 行出现错误:
ORA-01623: 日志 1 是实例 aidu (线程 1) 的当前日志 - 无法删除
ORA-00312: 联机日志 1 线程 1: 'C:\ORADATA\AIDU\REDO01B.LOG'

清除当前日志组的内容，然后重新建立
SQL> ALTER DATABASE CLEAR UNARCHIVED LOGFILE GROUP 1;
*第 1 行出现错误:
ORA-01624: 日志 1 是紧急恢复实例 aidu (线程 1) 所必需的
ORA-00312: 联机日志 1 线程 1: 'C:\ORADATA\AIDU\REDO01B.LOG'

这样我们只能做不完全的恢复了，恢复的方法有两个：

使用RMAN或者手工进行基于CANCEL的恢复。

SQL>SHUTDOWN IMMEDIATE;
手工删除数据文件（DATAFILE）
C:>RMAN TARGET /
RMAN>STARTUP MOUNT
RMAN>RUN{
ALLOCATE CHANNEL D1 TYPE DISK;
RESTORE DATABASE;
RECOVER DATABASE;
RELEASE CHANNEL D1;}
RMAN>ALTER DATABASE OPEN RESETLOGS;
这里不详细讨论RMAN的恢复。

使用EXP,IMP进行恢复。

具体操作步骤如下：
SQL>SHUTDOWN IMMEDIATE;
在init.ora中加入参数: _allow_resetlogs_corruption=TRUE
重新启动数据库,利用until cancel恢复
SQL>recover database until cancel;
Cancel
如果出错，不再理会，发出
SQL>alter database open resetlogs;
数据库被打开后，马上执行一个full export
shutdown数据库,去掉_all_resetlogs_corrupt参数
重建库
import并完成恢复
建议执行一下ANALYZE TABLE ...VALIDATE STRUCTURE CASCADE

oracle redo日志恢复

Oracle备份恢复中，redo的恢复相对来说还是比较简单的，只要保证每组的成员不止一个，出现问题的几率就相当小，即使出了问题我们也可按照不同的方法将他们恢复，所以如果碰到日志文件损坏，完全不必紧张！按照下面的方法来做，基本上都能搞定！

试验一：用命令清空日志组方法

1、查看原来表中数据

SQL> conn test/test

Connected.

SQL> select * from test;

TEL

----------

2、插入新数据

SQL> insert into test values(4);

1 row created.

SQL> commit;

Commit complete.

SQL>

3、正常关闭数据库

4、利用os command删除所有redo文件

5、启动数据库

SQL> startup

ORACLE instance started.

Total System Global Area 353862792 bytes

Fixed Size 730248 bytes

Variable Size 285212672 bytes

Database Buffers 67108864 bytes

Redo Buffers 811008 bytes

Database mounted.

ORA-00313: open failed for members of log group 1 of thread 1

ORA-00312: online log 1 thread 1: '/T3/ORACLE/oradata/ORA9/redo01.log'

6、查看当前日志状态

SQL> select * from v$log;

GROUP# THREAD# SEQUENCE# BYTES MEMBERS ARC STATUS

---------- ---------- ---------- ---------- ---------- --- ----------------

FIRST_CHANGE# FIRST_TIME

------------- ----------

1 1 2 104857600 1 YES INACTIVE

487837 01-9月 -05

2 1 4 104857600 1 NO CURRENT

487955 01-9月 -05

3 1 3 104857600 1 YES INACTIVE

487839 01-9月 -05

看来redo01.log不是当前日志，对于这类非当前日志可以直接clear,系统会重新自动生成一个redo文件

7、SQL> alter database clear logfile group 1;

Database altered.

7、继续启动db

SQL> alter database open;

alter database open

ERROR at line 1:

ORA-00313: open failed for members of log group 2 of thread 1

ORA-00312: online log 2 thread 1: '/T3/ORACLE/oradata/ORA9/redo02.log'

8、看来redo也得恢复，但是redo02是当前redo,直接clear是不行的

SQL> alter database clear logfile group 2;

alter database clear logfile group 2

ERROR at line 1:

ORA-00350: log 2 of thread 1 needs to be archived

ORA-00312: online log 2 thread 1: '/T3/ORACLE/oradata/ORA9/redo02.log'

9、按照oracle的某些做法也是不行的

SQL> alter database clear unarchived logfile group 2 unrecoverable datafile;

alter database clear unarchived logfile group 2 unrecoverable datafile

ERROR at line 1:

ORA-00313: open failed for members of log group 2 of thread 1

ORA-00312: online log 2 thread 1: '/T3/ORACLE/oradata/ORA9/redo02.log'

ORA-27037: unable to obtain file status

SVR4 Error: 2: No such file or directory

Additional information: 3

10、尝试从其他冷被分cp过来一个，再作clear,还是不行

SQL> host cp /T3/ORACLE/oradata2/ORA9/redo02.log /T3/ORACLE/oradata/ORA9/

SQL> alter database clear unarchived logfile group 2 unrecoverable datafile;

alter database clear unarchived logfile group 2 unrecoverable datafile

ERROR at line 1:

ORA-00322: log 2 of thread 1 is not current copy

ORA-00312: online log 2 thread 1: '/T3/ORACLE/oradata/ORA9/redo02.log'

SQL>

11、但是对于非当前日志就都可以，下面看看redo03

SQL> alter database clear logfile group 3;

Database altered.

结论：

如果数据库是正常shutdown,非当前日志都可以直接clear来重新生成，而且不丢失数据，因为正常关闭db,数据已经写入dbf文件了。唯独当前日志不可以，当前日志必须用其他方法恢复，不管是不是正常关闭，

方法二：用cancel模式恢复数据库

前面的出错提示，步骤都一样，唯独恢复的方法不一样

SQL> startup

ORACLE instance started.

Total System Global Area 353862792 bytes

Fixed Size 730248 bytes

Variable Size 285212672 bytes

Database Buffers 67108864 bytes

Redo Buffers 811008 bytes

Database mounted.

ORA-00313: open failed for members of log group 1 of thread 1

ORA-00312: online log 1 thread 1: '/T3/ORACLE/oradata/ORA9/redo01.log'

看看丢失了哪些redo

SQL> host ls /T3/ORACLE/oradarta/ORA9/redo*

/T3/ORACLE/oradarta/ORA9/redo*: No such file or directory

看来redo都丢了

直接recover

SQL> recover database until cancel;

Media recovery complete.

这个时候redo还没有生成

SQL> host ls /T3/ORACLE/oradata/ORA9/redo*

/T3/ORACLE/oradata/ORA9/redo*: No such file or directory

启动数据库

SQL> alter database open ;

alter database open

ERROR at line 1:

ORA-01589: must use RESETLOGS or NORESETLOGS option for database open

SQL> alter database open resetlogs;

Database altered.

（注意，这里必须用resetlogs,否则会错误的

SQL> alter database open noresetlogs;

alter database open noresetlogs

ERROR at line 1:

ORA-00313: open failed for members of log group 1 of thread 1

ORA-00312: online log 1 thread 1: '/T3/ORACLE/oradata/ORA9/redo01.log'

SQL>

Resetlogs其实就是根据控制文件让系统自动重新生成redo,如果noresetlog的话，就不会重新生成redo,缺少了文件，db自然无法启动）

SQL> host ls /T3/ORACLE/oradata/ORA9/redo*

/T3/ORACLE/oradata/ORA9/redo01.log /T3/ORACLE/oradata/ORA9/redo02.log /T3/ORACLE/oradata/ORA9/redo03.log

SQL>

检验

SQL> select * from test.test;

TEL

----------

SQL>

数据一点儿都没有丢失

结论：

如果数据库是正常关闭的，用recover database until cancel可以轻松恢复或者说重新建立所有的redo，不再区分是否是当前日志，而且由于正常关闭，不会丢失任何数据，唯一可能丢失的情况就是如果日志还没有归档

这种恢复方法由于要resetlogs,所以在恢复完成后，日志清零，以前的备份不再起作用，所以建议立即备份

SQL> archive log list;

Database log mode Archive Mode

Automatic archival Enabled

Archive destination /T3/ORACLE/arch

Oldest online log sequence 0

Next log sequence to archive 1

Current log sequence 1

SQL>

实验三：通过重新生成控制文件来恢复redo

前面的都一样，只是处理方法不一样

SQL> startup

ORACLE instance started.

Total System Global Area 353862792 bytes

Fixed Size 730248 bytes

Variable Size 285212672 bytes

Database Buffers 67108864 bytes

Redo Buffers 811008 bytes

Database mounted.

ORA-00313: open failed for members of log group 1 of thread 1

ORA-00312: online log 1 thread 1: '/T3/ORACLE/oradata/ORA9/redo01.log'

SQL> alter database backup controlfile to trace;

Database altered.

SQL> shutdown immediate

ORA-01109: database not open

Database dismounted.

ORACLE instance shut down.

SQL>

2、修改一下刚才生成的那个文件

CREATE CONTROLFILE REUSE DATABASE "ORA9" RESETLOGS ARCHIVELOG

-- SET STANDBY TO MAXIMIZE PERFORMANCE

MAXLOGFILES 50

MAXLOGMEMBERS 5

MAXDATAFILES 100

MAXINSTANCES 1

MAXLOGHISTORY 226

LOGFILE

GROUP 1 '/T3/ORACLE/oradata/ORA9/redo01.log' SIZE 100M,

GROUP 2 '/T3/ORACLE/oradata/ORA9/redo02.log' SIZE 100M,

GROUP 3 '/T3/ORACLE/oradata/ORA9/redo03.log' SIZE 100M

-- STANDBY LOGFILE

DATAFILE

'/T3/ORACLE/oradata/ORA9/system01.dbf',

'/T3/ORACLE/oradata/ORA9/undotbs01.dbf',

'/T3/ORACLE/oradata/ORA9/cwmlite01.dbf',

'/T3/ORACLE/oradata/ORA9/drsys01.dbf',

'/T3/ORACLE/oradata/ORA9/example01.dbf',

'/T3/ORACLE/oradata/ORA9/indx01.dbf',

'/T3/ORACLE/oradata/ORA9/odm01.dbf',

'/T3/ORACLE/oradata/ORA9/tools01.dbf',

'/T3/ORACLE/oradata/ORA9/users01.dbf',

'/T3/ORACLE/oradata/ORA9/xdb01.dbf',

'/T3/ORACLE/oradata/ORA9/test01.dbf'

CHARACTER SET ZHS16GBK

;

另存为一个脚本，运行他

SQL> @clone.sql

Control file created.

SQL> alter database open resetlogs;

Database altered.

SQL>

搞定……………

结论：这种方法的关键是重新创建控制文件，后面的步骤和前面的道理一样的

前面的三种方法都是假设db是正常关闭的，数据已经写入数据库文件中，所以不会由数据存在redo种，所以clear的话也不会有数据丢失

阅读(4667) | 评论(0) | 转发(0) |

上一篇：AIX根盘镜像更换hdisk(dump device问题)

下一篇：CISCO 6500 VSS 配置全过程

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6