goldengate维护要点-bzcat-ChinaUnix博客

bzcat的技术博客

首页　| 　博文目录　| 　关于我

bzcat

博客访问： 99391
博文数量： 25
博客积分： 10
博客等级：民兵
技术积分： 316
用户组：普通用户
注册时间： 2012-08-02 00:39

文章分类

全部博文（25）

nosql（0）
缓存系统（2）
消息中间件（0）
分布式系统（2）
linux系统管理和（0）
linux开发（0）
c/c++（0）
perl（3）
web server（3）
mysql（7）
oracle（8）
未分配的博文（0）

文章存档

2013年（25）

我的朋友

相关博文

goldengate维护要点

分类： Oracle

2013-04-22 15:14:22

oracle Goldengate 维护要点

1.查看各个进程状态和日志

1.1 查看所有进程状态，如

GGSCI (IP0106) 36> info all

Program     Status      Group       Lag           Time Since Chkpt

MANAGER     RUNNING
EXTRACT     RUNNING     EX1         00:00:00      00:00:07
EXTRACT     RUNNING     PMP1        00:00:00      00:00:01
REPLICAT    RUNNING     REP1        00:00:00      00:00:02
REPLICAT    RUNNING     REP2        00:00:00      00:00:04

status是running即为正常，如果是abended或者stopped就需要查看错误原因,lag正常为0

1.2 查看单个进程状态如

GGSCI (IP0106) 37> info ex1,detail

EXTRACT    EX1       Last Started 2011-06-04 11:35   Status RUNNING
Checkpoint Lag       00:00:00 (updated 00:00:00 ago)
Log Read Checkpoint Oracle Redo Logs
                     2011-06-12 13:29:37 Seqno 1763, RBA 179811328

Target Extract Trails:

Remote Trail Name                                Seqno        RBA     Max MB

./dirdat/ex                                        134 834768473       1000

Extract Source                          Begin             End

/u01/app/oracle/oradata/orcl/redo04.log 2011-06-04 10:29 2011-06-12 13:29
/u01/app/oracle/oradata/orcl/redo05.log 2011-05-10 11:17 2011-06-04 10:29
/u01/app/oracle/oradata/orcl/redo05.log 2011-05-06 16:49 2011-05-10 11:17
/u01/app/oracle/oradata/orcl/redo04.log 2011-05-02 13:16 2011-05-06 16:49
/u01/app/oracle/oradata/orcl/redo04.log 2011-04-30 14:05 2011-05-02 13:16
/u01/app/oracle/oradata/orcl/redo02.log 2011-04-30 12:48 2011-04-30 14:05
/u01/app/oracle/oradata/orcl/redo05.log 2011-04-30 11:51 2011-04-30 12:48
/u01/app/oracle/oradata/orcl/redo05.log 2011-04-30 11:29 2011-04-30 11:51
/u01/app/oracle/oradata/orcl/redo05.log 2011-04-30 06:11 2011-04-30 11:29
/u01/app/oracle/oradata/orcl/redo05.log 2011-04-29 16:29 2011-04-30 06:11
Not Available                           * Initialized *   2011-04-29 16:29
/u01/app/oracle/arch/1_144_745802503.dbf 2011-04-29 15:13 2011-04-29 15:13
/u01/app/oracle/arch/1_144_745802503.dbf 2011-04-29 15:13 2011-04-29 15:13
Not Available                           * Initialized *   2011-04-29 15:13

Current directory    /u01/app/ggs

Report file          /u01/app/ggs/dirrpt/EX1.rpt
Parameter file       /u01/app/ggs/dirprm/ex1.prm
Checkpoint file      /u01/app/ggs/dirchk/EX1.cpe
Process file         /u01/app/ggs/dirpcs/EX1.pce
Stdout file          /u01/app/ggs/dirout/EX1.out
Error log            /u01/app/ggs/ggserr.log

主要查看log read checkpoint的时间是否还停留在过去某一时间点，说明extract进程没有在读日志

2.查看系统和进程日志

2.1 查看系统日志如

GGSCI>view ggsevt

2.2 查看进程日志，在排错时常常用到如

GGSCI>view report ex1,detail

查看ogg错误和数据库对应错误编号

3.启动各个进程

3.1 启动extract，如

GGSCI>start ex1

3.2 启动datapump 如

GGSCI>start pmp1

3.3 启动replicat 如

GGSCI>start rep1

4.复制停止后的处理

4.1 extract进程因为错误而停止

查看进程错误日志，一般错误都为日志读取错误，可以start ex1手动启动，如果状态还是abended,日志读取还是有问题，建议等源端没有同步任务的时候
delete extract，然后再重新添加add extract的方式重建进程，如

GGSCI>delete ex1

GGSCI>add ex1,vam,begin now              --mysql extract的语法

GGSCI>add exttract ./sq2/ex1,extract ex1 --队列位置要和重建前的队列一致，通过

GGSCI>info exttrail *                    --查看

4.2 datapump因为错误而停止

一般为远端mgr的端口连接不上导致错误，查看远端mgr的端口和防火墙的配置

4.3 replicat因为错误而停止

建议查看replicat进程的错误日志，查看具体原因

如果需要跳过问题事务而恢复复制

GGSCI>start rep1,skiptransaction

一般等replicat的lag时间为0且状态为running说明恢复正常

5.队列的维护

一般都在mgr进程中配置了队列文件的自动删除，如

GGSCI>edit params mgr

purgeoldextracts ./dirdat/ex*,minkeepdays 3,minkeepfiles 10

可以手动修改保持时间，然后refresh mgr,如

GGSCI>refresh mgr

阅读(951) | 评论(0) | 转发(0) |

上一篇：Goldengate mysql-oracle复制配置文档

下一篇：wmsys.wm_concat 报错ora-22813的方法

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6