Chinaunix首页 | 论坛 | 博客
  • 博客访问: 148314
  • 博文数量: 31
  • 博客积分: 2075
  • 博客等级: 大尉
  • 技术积分: 340
  • 用 户 组: 普通用户
  • 注册时间: 2009-08-29 10:06
文章分类

全部博文(31)

文章存档

2017年(3)

2014年(1)

2013年(1)

2011年(9)

2010年(14)

2009年(3)

我的朋友

分类: LINUX

2011-06-09 17:06:48

Linux 平台高可用集群软件(High Availability Cluster- HA) 为数众多,相细可见nntpljhb两位大侠的帖子:

Linux集群主要分成三类

高可用( High Availability Cluster):保障用户的应用程序持续对外提供服务,如HACMP/MC-SG等

负载均衡(Load Balance Cluster):如LVS 等.

科学计算集群(High Performance Computing Cluster)

负载均衡集群软件Linux Virtual Server ( Linux 虚拟服务 简称LVS) 是指使一个群集的服务器在对外服务时表现为单个服务器的技术。这个表现出来的“单个服务器”被我们称为“虚拟服务器”。那些单独的组成集群的服务器(也就是真实提供服务的服务器,我们称为realservers)是由内核打了ipvs补丁包的Linux控制器(或是负载平衡器)控制着。运行的ipvs补丁包的控制器就具体了基本的LVS特征,lvs需要内核有ipvs支持。其它运用层的程序是用来管理LVS(如:为服务处理,容错处理设置规则)。控制器是基于可修改规则的4层路由结构(换而言之,连接并不来自于或是终止于控制器,控制器并不发送信息,它仅仅是一个路由)。

虚拟服务器软件IPVS

在控制器的实现技术中,IP负载均衡技术是效率最高的。

1VS/NAT技术(Virtual Server via Network Address Translation

在已有的IP负载均衡技术中有通过网络地址转换(Network Address Translation)将一组服务器构成一个高性能的、高可用的虚拟服务器。 通过网络地址转换,调度器重写请求报文的目标地址,根据预设的调度算法,将请求分派给后端的真实服务器;真实服务器的响应报文通过调度器时,报文的源地址被重写,再返回给客户,完成整个负载调度过程。

CiscoLocalDirectorF5Big/IPAlteonACEDirector

2、通过IP隧道实现虚拟服务器的方法VS/TUN Virtual Server via IP Tunneling

采用NAT技术时,由于请求和响应报文都必须经过调度器地址重写,当客户请求越来越多时,调度器的处理能力将成为瓶颈。为了解决这个问题,调度器把请求报 文通过IP隧道转发至真实服务器,而真实服务器将响应直接返回给客户,所以调度器只处理请求报文。由于一般网络服务应答比请求报文大许多,采用 VS/TUN技术后,集群系统的最大吞吐量可以提高10倍。

3、通过直接路由实现虚拟服务器的方法VS/DRVirtual Server via Direct Routing)。

VS/DR通过改写请求报文的MAC地址,将请求发送到真实服务器,而真实服务器将响应直接返回给客户。同VS/TUN技术一样,VS/DR技术可极大地 提高集群系统的伸缩性。这种方法没有IP隧道的开销,对集群中的真实服务器也没有必须支持IP隧道协议的要求,但是要求调度器与真实服务器都有一块网卡连 在同一物理网段上。

IPVS软件实现了这三种IP负载均衡技术。

LVS结构中一个新的连接是如何由客户端请求到服务器的呢(以httpd为例),控制器将为客户端选择一个真实服务器(realserver)。客户端与真实服务器(realserver)之间将以tcp(或是udp)通信。当下一个tcp请求来临时,控制器将为它选择一个新的真实服务器(realserver)(这个也许是,或不是之前的那个真实服务器)。所以,浏览器请求由LVS系统所提供的一个复杂页面(包括众多图片,文档)时,有可能为每个连接都指向不同的真实服务器。

由于控制器随机把客户请求发送给某台真实服务器,这个请求有可能是只读操作(如,web服务),也有可能是读写操作(如,在线商店的购物车),因此某些外部机制必须提供给LVS用来将这种请求在适当的时候发送给其它的真实服务器(所有节点的真实服务器,这次购买物品的数量应该在下次购买该物品前减一)。最好LVS系统只提供只读服务。

假设你希望某个服务节点能够在任意时间更新,同时其它没有成为首要节点的节点(或是多个节点)被激活成主节点提供服务,那么你需要的可能并不是LVS系统:而是高可用性设置,例:如LINUX-HA(LINUX心跳系统)vrrp 或是 carp

如果你想要一些分布在不同地区的服务器,那么需要的是类似 Supersparrow的异地分布式服务器。用户工具ipvsadmschedulers是用于管理LVS,用来添加真实服务器以及移除出错服务器。

安装ipvsadm就可以把一台服务器配置成负载调度器(Load Balancer)。通过IPVIP) 对外提供服务的。调度器LB的任务主要是分发请求,真正处理的是真实服务器(Real Server)LVS自身不用于检测错误状态;外部代理通过ipvsadm检测错误状态,然后更新LVS状态。


负载调度器(load balancer):它是整个集群对外面的前端机,负责将客户的请求发送到一组服务器上执行,而客户认为服务是来自一个IP地址(我们可称之为虚拟IP地址)上的。

服务器池(server pool):是一组真正执行客户请求的服务器,执行的服务有WEBMAILFTPDNS等。

共享存储(shared storage):它为服务器池提供一个共享的存储区,这样很容易使得服务器池拥有相同的内容,提供相同的服务。

1.IP虚拟服务器软件IPVS

Virtual Server via Network Address TranslationVS/NAT

通过网络地址转换,调度器重写请求报文的目标地址,根据预设的调度算法,将请求分派给后端的真实服务器;真实服务器的响应报文通过调度器时,报文的源地址被重写,再返回给客户,完成整个负载调度过程。




Virtual Server via IP TunnelingVS/TUN

采用
NAT技术时,由于请求和响应报文都必须经过调度器地址重写,当客户请求越来越多时,调度器的处理能力将成为瓶颈。为了解决这个问题,调度器把请求报 文通过IP隧道转发至真实服务器,而真实服务器将响应直接返回给客户,所以调度器只处理请求报文。由于一般网络服务应答比请求报文大许多,采用 VS/TUN技术后,集群系统的最大吞吐量可以提高10倍。




Virtual Server via Direct RoutingVS/DR

VS/DR通过改写请求报文的MAC地址,将请求发送到真实服务器,而真实服务器将响应直接返回给客户。同VS/TUN技术一样,VS/DR技术可极大地 提高集群系统的伸缩性。这种方法没有IP隧道的开销,对集群中的真实服务器也没有必须支持IP隧道协议的要求,但是要求调度器与真实服务器都有一块网卡连 在同一物理网段上。
 


三种IP负载均衡技术的优缺点比较:

杂项         VS/NAT     VS/TUN      VS/DR

服务器操作系统    任意      支持隧道     多数(支持Non-arp )

服务器网络      私有网络    局域网/广域网   局域网

服务器数目(100M网络) 10-20      100        多(100)

服务器网关      负载均衡器   自己的路由    自己的路由

效率         一般      高        最高


针对不同的网络服务需求和服务器配置,IPVS调度器实现了如下八种负载调度算法(rr,wrr,lc,wlc,lblc,lblcr,dh,sh):

轮叫(Round Robin

调度器通过”轮叫”调度算法将外部请求按顺序轮流分配到集群中的真实服务器上,它均等地对待每一台服务器,而不管服务器上实际的连接数和系统负载。

加权轮叫(Weighted Round Robin

调度器通过”加权轮叫”调度算法根据真实服务器的不同处理能力来调度访问请求。这样可以保证处理能力强的服务器处理更多的访问流量。调度器可以自动问询真实服务器的负载情况,并动态地调整其权值。

最少链接(Least Connections

调度器通过”最少连接”调度算法动态地将网络请求调度到已建立的链接数最少的服务器上。如果集群系统的真实服务器具有相近的系统性能,采用”最小连接”调度算法可以较好地均衡负载。

加权最少链接(Weighted Least Connections

在集群系统中的服务器性能差异较大的情况下,调度器采用”加权最少链接”调度算法优化负载均衡性能,具有较高权值的服务器将承受较大比例的活动连接负载。调度器可以自动问询真实服务器的负载情况,并动态地调整其权值。

基于局部性的最少链接(Locality-Based Least Connections

基于局部性的最少链接” 调度算法是针对目标IP地址的负载均衡,目前主要用于Cache集群系统。该算法根据请求的目标IP地址找出该目标IP地址最近使用的服务器,若该服务器 是可用的且没有超载,将请求发送到该服务器;若服务器不存在,或者该服务器超载且有服务器处于一半的工作负载,则用”最少链接”的原则选出一个可用的服务 器,将请求发送到该服务器。

带复制的基于局部性最少链接(Locality-Based Least Connections with Replication

带复制的基于局部性最少链接”调度算法也是针对目标IP地址的负载均衡,目前主要用于Cache集群系统。它与LBLC算法的不同之处是它要维护从一个 目标IP地址到一组服务器的映射,而LBLC算法维护从一个目标IP地址到一台服务器的映射。该算法根据请求的目标IP地址找出该目标IP地址对应的服务 器组,按”最小连接”原则从服务器组中选出一台服务器,若服务器没有超载,将请求发送到该服务器,若服务器超载;则按”最小连接”原则从这个集群中选出一 台服务器,将该服务器加入到服务器组中,将请求发送到该服务器。同时,当该服务器组有一段时间没有被修改,将最忙的服务器从服务器组中删除,以降低复制的 程度。

目标地址散列(Destination Hashing

目标地址散列”调度算法根据请求的目标IP地址,作为散列键(Hash Key)从静态分配的散列表找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空。

源地址散列(Source Hashing

源地址散列”调度算法根据请求的源IP地址,作为散列键(Hash Key)从静态分配的散列表找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空。

2.实现VS/NAT

环境:LB:ipvsadm,RS:LAMP
ipvsadm可以到官网下载安装:;LAMP安装省略,网上资料很多。
VIP:192.168.1.100
LB:10.3.37.100
RS:10.3.37.101
RS:10.3.37.102
RS:10.3.37.103
RS:10.3.37.104

LB配置:
外部地址为192.168.1.100 内部地址为10.3.37.100,LVS在VS/NAT、VS/DR和VS/TUN3种方式下均需要打开ip_forward功能。

  1. vi /etc/sysctl.conf  
  2. #加入一行  
  3. net.ipv4.ip_forward = 1  
  4. #退出编辑,执行sysctl -p使配置生效。  
  5. sysctl -p  

ipvs的脚本(ipvsadin详解见下文)

  1. #!/bin/sh  
  2.   
  3. ipvsadm -C  
  4. ipvsadm -A -t 192.168.1.100:80 -s wlc  
  5. ipvsadm -a -t 192.168.1.100:80 -r 10.3.37.101:80 -m  
  6. ipvsadm -a -t 192.168.1.100:80 -r 10.3.37.102:80 -m  
  7. ipvsadm -a -t 192.168.1.100:80 -r 10.3.37.103:80 -m  
  8. ipvsadm -a -t 192.168.1.100:80 -r 10.3.37.104:80 -m  

RealServer的配置(网关设置成BL内网IP:10.3.37.100):
网关配置(/etc/sysconfig/network 文件的内容如下)

  1. NETWORKING=yes  
  2. HOSTNAME=localhost.localdomain  
  3. GATEWAY=10.3.37.100  

网卡配置文件(/etc/sysconfig/network-scripts/ifcfg-eth0的内容如下)

  1. DEVICE=eth0  
  2. ONBOOT=yes  
  3. BOOTPROTO=static  
  4. IPADDR=10.3.37.101  
  5. NETMASK=255.255.255.0  
  6. BROADCAST=10.3.37.255  

3.实现VS/DR

只要知道了原理和ipvsadm基本使用,配置和VS/NAT没多大差别,关键在于RS上要关闭arp。
RealServer的配置:

  1. vi /etc/sysctl.conf  
  2. #加入一行  
  3. net.ipv4.ip_forward = 1  
  4. net.ipv4.conf.lo.arp_ignore = 1  
  5. net.ipv4.conf.lo.arp_announce = 2  
  6. net.ipv4.conf.all.arp_ignore = 1  
  7. net.ipv4.conf.all.arp_announce = 2  
  8. #退出编辑,执行sysctl -p使配置生效。  
  9. sysctl -p  

4.ipvsadm详解

  1. 1,virtual-service-address:是指虚拟服务器的ip 地址  
  2. 2,real-service-address:是指真实服务器的ip 地址  
  3. 3,scheduler:调度方法  
  4. (lna@networksbase.com 翻译 ipvsadm v1.21 2004 年4 月)  
  5. ipvsadm 的用法和格式如下:  
  6. ipvsadm -A|E -t|u|f virutal-service-address:port [-s scheduler] [-p  
  7. [timeout]] [-M netmask]  
  8. ipvsadm -D -t|u|f virtual-service-address  
  9. ipvsadm -C  
  10. ipvsadm -R  
  11. ipvsadm -S [-n]  
  12. ipvsadm -a|e -t|u|f service-address:port -r real-server-address:port  
  13. [-g|i|m] [-w weight]  
  14. ipvsadm -d -t|u|f service-address -r server-address  
  15. ipvsadm -L|l [options]  
  16. ipvsadm -Z [-t|u|f service-address]  
  17. ipvsadm --set tcp tcpfin udp  
  18. ipvsadm --start-daemon state [--mcast-interface interface]  
  19. ipvsadm --stop-daemon  
  20. ipvsadm -h  
  21. 命令选项解释:  
  22. 有两种命令选项格式,长的和短的,具有相同的意思。在实际使用时,两种都可  
  23. 以。  
  24. -A --add-service 在内核的虚拟服务器表中添加一条新的虚拟服务器记录。也  
  25. 就是增加一台新的虚拟服务器。  
  26. -E --edit-service 编辑内核虚拟服务器表中的一条虚拟服务器记录。  
  27. -D --delete-service 删除内核虚拟服务器表中的一条虚拟服务器记录。  
  28. -C --clear 清除内核虚拟服务器表中的所有记录。  
  29. -R --restore 恢复虚拟服务器规则  
  30. -S --save 保存虚拟服务器规则,输出为-R 选项可读的格式  
  31. -a --add-server 在内核虚拟服务器表的一条记录里添加一条新的真实服务器  
  32. 记录。也就是在一个虚拟服务器中增加一台新的真实服务器  
  33. -e --edit-server 编辑一条虚拟服务器记录中的某条真实服务器记录  
  34. -d --delete-server 删除一条虚拟服务器记录中的某条真实服务器记录  
  35. -L|-l --list 显示内核虚拟服务器表  
  36. -Z --zero 虚拟服务表计数器清零(清空当前的连接数量等)  
  37. --set tcp tcpfin udp 设置连接超时值  
  38. --start-daemon 启动同步守护进程。他后面可以是master 或backup,用来说  
  39. 明LVS Router 是master 或是backup。在这个功能上也可以采用keepalived 的  
  40. VRRP 功能。  
  41. --stop-daemon 停止同步守护进程  
  42. -h --help 显示帮助信息  
  43. 其他的选项:  
  44. -t --tcp-service service-address 说明虚拟服务器提供的是tcp 的服务  
  45. [vip:port] or [real-server-ip:port]  
  46. -u --udp-service service-address 说明虚拟服务器提供的是udp 的服务  
  47. [vip:port] or [real-server-ip:port]  
  48. -f --fwmark-service fwmark 说明是经过iptables 标记过的服务类型。  
  49. -s --scheduler scheduler 使用的调度算法,有这样几个选项  
  50. rr|wrr|lc|wlc|lblc|lblcr|dh|sh|sed|nq,  
  51. 默认的调度算法是: wlc.  
  52. -p --persistent [timeout] 持久稳固的服务。这个选项的意思是来自同一个客  
  53. 户的多次请求,将被同一台真实的服务器处理。timeout 的默认值为300 秒。  
  54. -M --netmask netmask persistent granularity mask  
  55. -r --real-server server-address 真实的服务器[Real-Server:port]  
  56. -g --gatewaying 指定LVS 的工作模式为直接路由模式(也是LVS 默认的模式)  
  57. -i --ipip 指定LVS 的工作模式为隧道模式  
  58. -m --masquerading 指定LVS 的工作模式为NAT 模式  
  59. -w --weight weight 真实服务器的权值  
  60. --mcast-interface interface 指定组播的同步接口  
  61. -c --connection 显示LVS 目前的连接 如:ipvsadm -L -c  
  62. --timeout 显示tcp tcpfin udp 的timeout 值 如:ipvsadm -L --timeout  
  63. --daemon 显示同步守护进程状态  
  64. --stats 显示统计信息  
  65. --rate 显示速率信息  
  66. --sort 对虚拟服务器和真实服务器排序输出  
  67. --numeric -n 输出IP 地址和端口的数字形式  
结束:
这里主要介绍LVS的基本原理和基本配置,实际使用时,是使用keepalived实现BL的HA和RS的可用性检测。

大规模Web应用有两个要解决的问题: 高可用性负载均衡.
Keepalived可以提供IP层的高可用性, 一旦某一台机器的网络出现问题, 另一台服务器会立即(几秒或者更少的时间)使用出故障的服务器的IP进行工作.


惹不起F5这些抢钱的公司,于是LVS+Keepalived 这种基于完整开源软件架构而又可以提供一个负载均衡及高可用服务器的解决方案得到广泛使用.


一个完整的负载均衡项目,一般由虚拟服务器、故障隔离及失败切换3个功能框架所组成。要从技术上实现这3个功能,需要两个工具:ipvsadm和keepalived。

keepalived是一个类似于layer3, 4&5交换机制的软件,也就是我们平时说的第3层、第4层和第5层交换。Keepalived的作用是检测web服务器的状态,如果有一台web服务器死机, 或工作出现故障,Keepalived将检测到,并将有故障的web服务器从系统中剔除,当web服务器工作正常后Keepalived自动将web服务 器加入到服务器群中,这些工作全部自动完成,不需要人工干涉,需要人工做的只是修复故障的web服务器。

Layer3,4&5工作在IP/TCP协议栈的IP层,TCP层,及应用层,原理分别如下:
   
Layer3:Keepalived使用Layer3的方式工作式时,Keepalived会定期向服务器群中的服务器 发送一个ICMP的数据包(既我们平时用的Ping程序),如果发现某台服务的IP地址没有激活,Keepalived便报告这台服务器失效,并将它从服务器群中剔除,这种情况的典型例子是某台服务器被非法关机。Layer3的方式是以服务器的 IP地址是否有效作为服务器工作正常与否的标准。

Layer4:如果您理解了Layer3的方式,Layer4就容易了。Layer4主要以 TCP端口的状态来决定服务器工作正常与否。如web server的服务端口一般是80,如果Keepalived检测到80端口没有启动,则Keepalived将把这台服务器从服务器群中剔除。  

Layer5:Layer5就是工作在具体的应用层了,比Layer3,Layer4要复杂一点,在网络上占用的带宽也要大一些。Keepalived将根据用户的设定检查服务器程序的运行是否正常,如果与用户的设定不相符,则 Keepalived将把服务器从服务器群中剔除。


实战文档可参考:

阅读(1424) | 评论(0) | 转发(0) |
0

上一篇:Shell Environment Variables

下一篇:Mirror Note

给主人留下些什么吧!~~