分类: LINUX
2011-06-09 17:06:48
Linux 平台高可用集群软件(High Availability Cluster- HA) 为数众多,相细可见nntp和ljhb两位大侠的帖子:
Linux集群主要分成三类
高可用( High Availability Cluster):保障用户的应用程序持续对外提供服务,如HACMP/MC-SG等
负载均衡(Load Balance Cluster):如LVS 等.
科学计算集群(High Performance Computing Cluster)
负载均衡集群软件Linux Virtual Server ( Linux 虚拟服务 简称LVS) 是指使一个群集的服务器在对外服务时表现为单个服务器的技术。这个表现出来的“单个服务器”被我们称为“虚拟服务器”。那些单独的组成集群的服务器(也就是真实提供服务的服务器,我们称为realservers)是由内核打了ipvs补丁包的Linux控制器(或是负载平衡器)控制着。运行的ipvs补丁包的控制器就具体了基本的LVS特征,lvs需要内核有ipvs支持。其它运用层的程序是用来管理LVS(如:为服务处理,容错处理设置规则)。控制器是基于可修改规则的4层路由结构(换而言之,连接并不来自于或是终止于控制器,控制器并不发送信息,它仅仅是一个路由)。
虚拟服务器软件IPVS
在控制器的实现技术中,IP负载均衡技术是效率最高的。
1、VS/NAT技术(Virtual Server via Network Address Translation)
在已有的IP负载均衡技术中有通过网络地址转换(Network Address Translation)将一组服务器构成一个高性能的、高可用的虚拟服务器。 通过网络地址转换,调度器重写请求报文的目标地址,根据预设的调度算法,将请求分派给后端的真实服务器;真实服务器的响应报文通过调度器时,报文的源地址被重写,再返回给客户,完成整个负载调度过程。
如Cisco的LocalDirector、F5的Big/IP和 Alteon的ACEDirector。
2、通过IP隧道实现虚拟服务器的方法VS/TUN (Virtual Server via IP Tunneling)
采用NAT技术时,由于请求和响应报文都必须经过调度器地址重写,当客户请求越来越多时,调度器的处理能力将成为瓶颈。为了解决这个问题,调度器把请求报 文通过IP隧道转发至真实服务器,而真实服务器将响应直接返回给客户,所以调度器只处理请求报文。由于一般网络服务应答比请求报文大许多,采用 VS/TUN技术后,集群系统的最大吞吐量可以提高10倍。
3、通过直接路由实现虚拟服务器的方法VS/DR(Virtual Server via Direct Routing)。
VS/DR通过改写请求报文的MAC地址,将请求发送到真实服务器,而真实服务器将响应直接返回给客户。同VS/TUN技术一样,VS/DR技术可极大地 提高集群系统的伸缩性。这种方法没有IP隧道的开销,对集群中的真实服务器也没有必须支持IP隧道协议的要求,但是要求调度器与真实服务器都有一块网卡连 在同一物理网段上。
IPVS软件实现了这三种IP负载均衡技术。
在LVS结构中一个新的连接是如何由客户端请求到服务器的呢(以httpd为例),控制器将为客户端选择一个真实服务器(realserver)。客户端与真实服务器(realserver)之间将以tcp(或是udp)通信。当下一个tcp请求来临时,控制器将为它选择一个新的真实服务器(realserver)(这个也许是,或不是之前的那个真实服务器)。所以,浏览器请求由LVS系统所提供的一个复杂页面(包括众多图片,文档)时,有可能为每个连接都指向不同的真实服务器。
由于控制器随机把客户请求发送给某台真实服务器,这个请求有可能是只读操作(如,web服务),也有可能是读写操作(如,在线商店的购物车),因此某些外部机制必须提供给LVS用来将这种请求在适当的时候发送给其它的真实服务器(所有节点的真实服务器,这次购买物品的数量应该在下次购买该物品前减一)。最好LVS系统只提供只读服务。
假设你希望某个服务节点能够在任意时间更新,同时其它没有成为首要节点的节点(或是多个节点)被激活成主节点提供服务,那么你需要的可能并不是LVS系统:而是高可用性设置,例:如LINUX-HA(LINUX心跳系统),vrrp 或是 carp。如果你想要一些分布在不同地区的服务器,那么需要的是类似 Supersparrow的异地分布式服务器。用户工具ipvsadm及schedulers是用于管理LVS,用来添加真实服务器以及移除出错服务器。
安装ipvsadm就可以把一台服务器配置成负载调度器(Load Balancer)。通过IP(VIP) 对外提供服务的。调度器LB的任务主要是分发请求,真正处理的是真实服务器(Real Server)。LVS自身不用于检测错误状态;外部代理通过ipvsadm检测错误状态,然后更新LVS状态。
负载调度器(load balancer):它是整个集群对外面的前端机,负责将客户的请求发送到一组服务器上执行,而客户认为服务是来自一个IP地址(我们可称之为虚拟IP地址)上的。
服务器池(server pool):是一组真正执行客户请求的服务器,执行的服务有WEB、MAIL、FTP和DNS等。
共享存储(shared storage):它为服务器池提供一个共享的存储区,这样很容易使得服务器池拥有相同的内容,提供相同的服务。
1.IP虚拟服务器软件IPVS
Virtual Server via Network Address Translation(VS/NAT)
通过网络地址转换,调度器重写请求报文的目标地址,根据预设的调度算法,将请求分派给后端的真实服务器;真实服务器的响应报文通过调度器时,报文的源地址被重写,再返回给客户,完成整个负载调度过程。
杂项 VS/NAT VS/TUN VS/DR
服务器操作系统 任意 支持隧道 多数(支持Non-arp )
服务器网络 私有网络 局域网/广域网 局域网
服务器数目(100M网络) 10-20 100 多(100)
服务器网关 负载均衡器 自己的路由 自己的路由
效率 一般 高 最高
针对不同的网络服务需求和服务器配置,IPVS调度器实现了如下八种负载调度算法(rr,wrr,lc,wlc,lblc,lblcr,dh,sh):
轮叫(Round Robin)
调度器通过”轮叫”调度算法将外部请求按顺序轮流分配到集群中的真实服务器上,它均等地对待每一台服务器,而不管服务器上实际的连接数和系统负载。
加权轮叫(Weighted Round Robin)
调度器通过”加权轮叫”调度算法根据真实服务器的不同处理能力来调度访问请求。这样可以保证处理能力强的服务器处理更多的访问流量。调度器可以自动问询真实服务器的负载情况,并动态地调整其权值。
最少链接(Least Connections)
调度器通过”最少连接”调度算法动态地将网络请求调度到已建立的链接数最少的服务器上。如果集群系统的真实服务器具有相近的系统性能,采用”最小连接”调度算法可以较好地均衡负载。
加权最少链接(Weighted Least Connections)
在集群系统中的服务器性能差异较大的情况下,调度器采用”加权最少链接”调度算法优化负载均衡性能,具有较高权值的服务器将承受较大比例的活动连接负载。调度器可以自动问询真实服务器的负载情况,并动态地调整其权值。
基于局部性的最少链接(Locality-Based Least Connections)
“基于局部性的最少链接” 调度算法是针对目标IP地址的负载均衡,目前主要用于Cache集群系统。该算法根据请求的目标IP地址找出该目标IP地址最近使用的服务器,若该服务器 是可用的且没有超载,将请求发送到该服务器;若服务器不存在,或者该服务器超载且有服务器处于一半的工作负载,则用”最少链接”的原则选出一个可用的服务 器,将请求发送到该服务器。
带复制的基于局部性最少链接(Locality-Based Least Connections with Replication)
“带复制的基于局部性最少链接”调度算法也是针对目标IP地址的负载均衡,目前主要用于Cache集群系统。它与LBLC算法的不同之处是它要维护从一个 目标IP地址到一组服务器的映射,而LBLC算法维护从一个目标IP地址到一台服务器的映射。该算法根据请求的目标IP地址找出该目标IP地址对应的服务 器组,按”最小连接”原则从服务器组中选出一台服务器,若服务器没有超载,将请求发送到该服务器,若服务器超载;则按”最小连接”原则从这个集群中选出一 台服务器,将该服务器加入到服务器组中,将请求发送到该服务器。同时,当该服务器组有一段时间没有被修改,将最忙的服务器从服务器组中删除,以降低复制的 程度。
目标地址散列(Destination Hashing)
“目标地址散列”调度算法根据请求的目标IP地址,作为散列键(Hash Key)从静态分配的散列表找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空。
源地址散列(Source Hashing)
“源地址散列”调度算法根据请求的源IP地址,作为散列键(Hash Key)从静态分配的散列表找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空。
环境:LB:ipvsadm,RS:LAMP
ipvsadm可以到官网下载安装:;LAMP安装省略,网上资料很多。
VIP:192.168.1.100
LB:10.3.37.100
RS:10.3.37.101
RS:10.3.37.102
RS:10.3.37.103
RS:10.3.37.104
LB配置:
外部地址为192.168.1.100 内部地址为10.3.37.100,LVS在VS/NAT、VS/DR和VS/TUN3种方式下均需要打开ip_forward功能。
ipvs的脚本(ipvsadin详解见下文)
RealServer的配置(网关设置成BL内网IP:10.3.37.100):
网关配置(/etc/sysconfig/network 文件的内容如下)
网卡配置文件(/etc/sysconfig/network-scripts/ifcfg-eth0的内容如下)
只要知道了原理和ipvsadm基本使用,配置和VS/NAT没多大差别,关键在于RS上要关闭arp。
RealServer的配置: