分类: LINUX
2010-10-26 11:11:59
红帽企业集群RHCS解决方案套件介绍与原理+(Red.Hat.Cluster.Solution.Suite)
这两个月一直在测试RHCS,这里有一个中文文档和大家分享一下,具体细节这里就不写了,大家要是感兴趣的话可以一起交流交流。
集群基础
群集是由两个或多个计算机(称为??或??)组成的一起执行任务的系统。主要的群集类型有 4 种:
存储型(Storage)
高可用性型(High availability)
负载平衡型(Load balancing)
高性能型(High performance)
存储型群集跨服务器提供一致的文件系统映像,它允许服务器同步地读取和写入单个的共享文件系统。
存储型群集将应用程序的安装和修补限制到一个文件系统,简化了存储的管理。而且,采用群集范围的
文件系统,存储型群集消除了应用程序数据的冗余拷贝并简化了备份和恢复。Red Hat Cluster Suite 是通
过 Red Hat GFS 提供存储群集功能的。
高可用性型群集通过消除单点失效以及在一个节点停止运作时将服务从一个群集节点切换到另外一个节
点,提供服务的持续可用性。通常,在高可用性型群集中的服务读写数据(通过以读写方式挂载的文件
系统)。因此,高可用性型群集必须维护数据的完整性,因为一个群集节点是从另一个群集节点接管某
个服务的控制。客户端中高可用性型群集中产生故障的节点在群集外并不可见。(高可用性型群集有时
候被称作故障切换群集。)Red Hat Cluster Suite 通过其高可用性服务管理(High-availability Service
Management)组件提供高可用性的群集功能。
负载平衡型群集将网络服务请求分摊在多个群集节点中来平衡请求负载。因为您可以按照负载来调整节
点数目,这样就提供了有性价比的灵活性。如果负载平衡型群集中的某个节点不可操作了,负载平衡软
件检测到这个故障并将请求重定向到其他群集节点。负载平衡型群集中的节点故障在群集外是不可见的
。Red Hat Cluster Suite 通过 Linux 虚拟服务器(Linux Virtual Server,LVS)提供了负载平衡功能。
高性能型群集使用群集节点来执行并行运算。高性能型群集允许应用程序以并行的方式工作,因此提高
了应用程序的性能。(高性能型群集也被称为计算群集或网格计算。)
集群方案概述
不间断的无故障的业务运行环境是每一个企业IT系统部署要求的重中之重。任何一个发生在关键服务上的停顿故障都会导致直接和间接的企业经济损失以及客户的满意度下降。虽然红帽企业版Linux操作系统已经提供高度的容错能力,但是关键业务系统仍旧需要成熟的技术来实现服务的高可用性,尽可能减少和缩短服务停顿的次数和时间。
传统的通过冗余和复制硬件设备的解决方式既昂贵且局限性大,用户只能通过这样的方式解决企业中最关键的业务应用对 于可用性的要求。 因此很多企业内部的重要应用由于缺乏高性价比的方案而失去保护,面临着灾难后的长时间恢复和数据的丢失。 同样的情况下,当企业的IT部门需要对关键应用所处软硬件环境进行调整,或仅仅是作系统维护的时候,这种计划内的停机也会造成应用重新上线前的长时间服务 停止以及潜在的数据丢失。
红帽的企业集群解决方案(RHCS)是全球领先的高可用性解决方案,专为红帽企业Linux量身定做,是全球企业Linux厂商中唯一提供原生集群解决方 案的厂商。RHCS集群经过红帽公司全球研发团队以及广大开发者社区的多年打造,已经成为企业级Linux平台上顶尖的高可用解决方案。
红帽RHCS集群采用了业界成熟的技术和主流国际标准,遵循高度安全和可靠的苛刻要求,被广泛的部署在电信,金融,政府,军队,制造,医疗,商贸,教育等各行业。
通过长年于主流硬件制造商及软件制造商的研发协作与合作,红帽RHCS集群已经在几乎所有主流硬件平台上运行,并且高度支持主流的数据库及中间件应用,针对绝大多数网站/网络所必须的应用服务也提供了完整的支持。 红帽RHCS集群方案已经预置了对主要网络和数据库服务的支持,用户可通过红帽全球专家服务(GlobalProfessional Service)完成对特殊服务和应用的集群定制部署。
以下介绍下,最近测试碰到的一些问题,大家也可多交流交流,以共同进步。
1、hosts主机记录,两台hosts主机记录需要保持一致。
2、RedHat AS 5版本后,系统都会有自带RHCS的各个组件,大家可以通过配置yum本地源去安装所需要的所有的组件。下篇文件介绍下yum本地源的配置方法。
3、节点之间设置ssh信任连接。
4、通过QDisk增强Red Hat Cluster Suite的仲裁机制,以下有一个连接介绍qdisk仲裁机制的介绍及创建方法
http://hi.baidu.com/luosong253/blog/item/9a950bc82d56981e7e3e6f5d.html
5、添加好fence,测试环境可以使用手工fence来进行测试的,以下大致介绍下fence的作用
fence也是RedHat Cluster的产物,没有它GFS也没法工作,fence的作用就是当一个节点宕掉(和cluster断掉联系)后,其他的正常节点会通过fence设备来把宕掉的设备fence掉,把宕掉的设备踢出cluster保证整个cluster的正常运行,而fence设备一般是服务器自带硬件设备,如hp的ilo口,IBM和dell的ipmi等等,由于服务器硬件的不同,导致不同的fence设备的配置方法不同,手工fence的功能是:当一个节点宕掉后我们需要在正常的节点上输入命令:“# fence_ack_manual -n 宕掉的节点名 ” 来把于cluster的主机隔离掉,才能让正常的节点正常工作。
然而在RedHat Cluster的官方文档中,并不建议设置这种手工fence,它只被建议用在测试环境下,尤其是在生产环境中,原因就是人工判断的不够准确:如果宕掉的机器无法连接到cluster但是还在占用cluster资源(例如还在访问共享文件系统),这时候我们通过命令fence_ack_manual -n 宕掉的节点名 告诉正常的节点已经成功隔离了宕掉的设备,这个时候正常的节点也会继续访问资源,导致冲突发生,文件系统产生崩溃(即便是GFS系统,没有了cluster的调度调整,也会发生这种崩溃)。
chinaunix网友2010-10-26 18:24:15
很好的, 收藏了 推荐一个博客,提供很多免费软件编程电子书下载: http://free-ebooks.appspot.com