分类: LINUX
2009-03-26 22:27:35
硬件环境 :DELL GX620, P4 630, 2G Memory
Vmware Workstation 6.5
操作系统 :Host - WinXP
Guest - CentOS 5.2
总体结构 :虚拟三台机器,两台作为Cluster,一台提供GFS
共同的配置:
在ClusterNode1的命令格式下输入:system-config-cluster,进入配置界面
点击“add a cluster node",添加rhcs01,quorum votes填1。
点击“add a cluster node",添加rhcs02,quorum votes填1。
在”fence device"中,选择“add a fence device",这里添加的是"manual Fencing",名字任意,这里写”web"。
在"cluster Nodes->rhcs01和rhcs02”,中“manange fencing for this node",选择”add a fence level"。
在“manager resource->failover domains"中,”create a failover domain",名称为web
点击“manager resource->failover domains->web","edit failover domain propertis",在"available cluster node"中,将rhcs01和rhcs02都添加进去。
"create a resource",选择IP address,地址为“10.1.5.169",后边的monitor link要选中。10.1.5.169为浮动IP, 即集群对面暴露的IP, 不需要提前配置,会在Server启动后自动生成。无法通过ifconfig查看,只能ping,或是通过ip命令查看。
"create a resource",选择script,name 为"httpd",script为"/etc/init.d/httpd"。
先保存,然后将cluster.conf传到ClusterNode2相同位置一份。
service cman start
service clvmd start
service gfs start
service rgmanager start
然后在ClusterNode1上,首先 #modprobe gnbd
将gfs通过gnbd倒入: #gnbd_import -v -i node3
检查加载状态: #gnbd_import -v -l
#modeprobe gfs
创建文件系统: #gfs_mkfs -p lock_dlm -t testingCluster:gfs -j 2 /dev/gnbd/gfs (testingCluster为ClusterName)
在ClusterNode1再打开system-config-cluster,
接着创建"resource"
"create a resource",选择GFS,name "web_content",mount point:"/gfs",device:"dev/gnbd/gfs"。
同步到ClusterNode2。
由于是为了实现httpd的集群,因此需要对/etc/httpd/conf/httpd.conf一些内容进行修改,包括
在ClusterNode1再打开system-config-cluster,
"service","create a service", name设为httpd。failover domain为 web。
点"add a shared resource to this service" ,首先把ip address加入。
选择"10.1.5.169 ip address share",然后再“attach a shared resource to the selecetion",分别添加刚才设的script和gfs的resource。
同步到ClusterNode2。
分别重新启动进程:
service rgmanager stop
service gfs stop
service clvmd stop
service cman stop
service cman start
service clvmd start
service gfs start
service rgmanager start
打开,system-config-cluster,如果刚才的管理进程都正常的话,将会有cluster management的tab。
在service 中,点击httpd 按"enable"启动。
如果无法启动,查看/var/log/messages详细出错信息。
如果无法正常启动,尝试着去掉一些resource,然后再看是否正常启动,来定位故障。