Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1492029
  • 博文数量: 263
  • 博客积分: 10851
  • 博客等级: 上将
  • 技术积分: 2627
  • 用 户 组: 普通用户
  • 注册时间: 2008-11-26 22:40
文章分类

全部博文(263)

文章存档

2013年(4)

2012年(25)

2011年(33)

2010年(50)

2009年(138)

2008年(13)

分类: LINUX

2009-12-14 18:55:02

尽信书, 不如无书
最近在学习heartbeat, 用自己的vmware模拟出实战环境, 基本上是对照《The Linux Enterprise Cluster.chm》来配置的。 配置好之后, 主备两边都启动, 然后过不了多久, 在备机的/var/log/messages里就发现满屏的:
Dec  4 12:44:40 lvs_slave heartbeat: [2960]: ERROR: Message hist queue is filling up (488 messages in queue)
... ...
Dec  4 12:44:47 lvs_slave heartbeat: [2960]: ERROR: Message hist queue is filling up (500 messages in queue)
Dec  4 12:44:48 lvs_slave heartbeat: [2960]: ERROR: Message hist queue is filling up (500 messages in queue)
Dec  4 12:44:48 lvs_slave heartbeat: [2960]: ERROR: Message hist queue is filling up (500 messages in queue)
在linux-ha的官网邮件列表上, 得到的结论是由于防火墙的原因, 造成"Communication problems" , 但是我防火墙对所有的udp包都是开放的, 所以可以排除这一原因。
搜了英文的, 未果 ,就搜中文的网页, 还好在cu上得到了结论(), 原来是ha.cf的配置问题, /etc/ha.d/ha.cf
ucast eth1 192.168.25.3 这个要求主备两边分别填写对方的ip, 修改之后, 就OK 了。
但是我在《The Linux Enterprise Cluster.chm》上看到的, 说要求ha.cf/haresource/auths这三个文件, 在主备机上都要一致, 所以一开始压根就没想到是配置的原因, 呵呵
This chapter used a "test" resource script to demonstrate how Heartbeat starts a resource and fails it over to a backup server when the primary server goes down. We've looked at a sample configuration using the three configuration files /etc/ha.d/ha.cf, /etc/ha.d/haresources, and /etc/ha.d/authkeys. These configuration files should always be the same on the primary and the backup servers to avoid confusion and errant behavior of the Heartbeat system.
不过也有可能是版本原因, 在作者写书的时候用的版本我不太清楚, 我使用的版本是2.1.4?
阅读(4806) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~