heartbeat双机热备软件的奇怪问题(续)-anfenghu-ChinaUnix博客

自学Linux从这里开始anfenghu.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

anfenghu

博客访问： 606253
博文数量： 248
博客积分： 52
博客等级：民兵
技术积分： 1028
用户组：普通用户
注册时间： 2012-12-23 12:05

文章分类

全部博文（248）

服务器骗（1）
管理员心得（4）
批量部署（1）
双网卡绑定bond0（1）
oracle（1）
linux技术（55）
存储（0）
虚拟化（9）
dhcp释放地址池信（2）
挂载远程服务器的（0）
日志（1）
linux（23）
zabbix报错（1）
其它（0）
network（7）
数据库（37）
监控（5）
未分配的博文（100）

文章存档

2016年（7）

2013年（241）

我的朋友

相关博文

heartbeat双机热备软件的奇怪问题(续)

分类： LINUX

2013-04-09 04:43:43

原文地址：heartbeat双机热备软件的奇怪问题(续) 作者：fan3838

上周天加班处理的heartbeat双机热备软件的奇怪问题今天又有进展。周天我只是发现时间差很多，所以我就直接判断数据库可能有问题（而且他两个数据库是分别安装的，只不过后装的使用先装的数据文件，这样是有问题的。因为oracle里面对数据文件有自己的命名，这种命令其实是写在了一些配置文件中，只要把特定的配置文件从先装机上拷贝到后装机上就可以了。但是到底哪些配置文件没有研究。所以以前我的做法都是将先装好的/opt目录打包，拷贝到另一台机器上解压即可使用）。今天张俊说周一按原文档又做了一次，结果还是s2机器有问题。我登上去好好看看。
单就s2上看，数据库手工启动，测试都没有问题（这些张俊也测试过了），但是启动启动heartbeat之后，数据库启动正常，mon启动，没2分钟，heartbeat就停止了。看日志ha-log和ha-debug都没有写为什么失败。我还是采用老办法──查看进程大法，百试不爽啊。结果从日志中发现mon启动之后，很正常，但是马上就有一个进程

root 5723 1 0 17:33 ? 00:00:00 /bin/sh /usr/lib/mon/alert.d/ha_stop.alert -s net -g net -h -t 1187688783 root 5724 5723 0 17:33 ? 00:00:00 /bin/sh /etc/init.d/heartbeat stop

看到两个“net”我忽然想到一个问题：他们为了测试，只连了心跳，其中s1机器跟一台笔记本链接，因为两台服务器都没有显示器。也就是说s2机器的eth0网卡是“no link”的。而heartbeat监控oracle和网络。
这个结果让我很是吃惊，当时我写的文档非常详细，八十多台机器都按照文档装没有问题，就这一台机器有问题，而且张俊都没有解决。我相信张俊如果没有解决，那肯定是他不细心，因为能力上面我还是非常信任他的。结果我也同样犯了不细心的错误，周天是发现一个比较低级的错误，我就没有再细细的找，结果今天又发现了一个更低级的错误。这也印证了IP的真理：所有问题的出现，都有原因引起的。所有奇怪问题的出现，肯定有一个特别低级的原因引起的。

阅读(468) | 评论(0) | 转发(0) |

上一篇：青岛公安HA问题反映出来我们的粗心

下一篇：heartbeat双机热备软件的奇怪问题

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6