负载均衡解决方案－Array IDC功能优化解决方案-zzjlzx-ChinaUnix博客

zzjlzxzzjlzx.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

zzjlzx

博客访问： 10649469
博文数量： 1669
博客积分： 16831
博客等级：上将
技术积分： 12594
用户组：普通用户
注册时间： 2011-02-25 07:23

个人简介

柔中带刚，刚中带柔，淫荡中富含柔和，刚猛中荡漾风骚，无坚不摧，无孔不入！

文章分类

全部博文（1669）

NGINX（1）
MongoDB（2）
docker（8）
shadowsocks（1）
CloudFoundry（11）
CloudStack（102）
openstack（61）
PHP（0）
mail（0）
hadoop（25）
GemFire（1）
文件系统（4）
CDN（7）
下载及资源（15）
数据缓存（8）
web 加速（9）
分布式文件系统架（23）
虚拟化（133）
同步（6）
网站架构（50）
windows 监控（15）
mysql 监控（5）
oracle 监控（2）
linux 监控（24）
web 监控（35）
其他数据库（27）
备份恢复（28）
VPN及认证（24）
云系统（29）
windows（29）
WEB 故障（13）
mysql 备份（10）
oracle 集群（15）
HA及负载均衡（52）
存储（66）
shell（39）
web 应用（19）
mysql 优化（16）
mysql 故障（14）
mysql 安全（8）
mysql 配置（29）
mysql 应用（10）
web 安全（21）
SAN交换路由（26）
web 优化（46）
基础解释（24）
linux 安全（37）
linux 故障（22）
linux 应用（85）
linux 配置（64）
web 配置（23）
oracle 备份（33）
UNIX（12）
Solaris（5）
Aix（1）
oracle 配置（69）
oracle 优化（62）
oracle 安全（10）
oracle 应用（30）
交流（29）
oracle 故障（59）
linux 优化（31）
未分配的博文（4）

文章存档

2023年（4）

2022年（1）

2021年（10）

2020年（24）

2019年（4）

2018年（19）

2017年（66）

2016年（60）

2015年（49）

2014年（201）

2013年（221）

2012年（638）

2011年（372）

我的朋友

相关博文

负载均衡解决方案－Array IDC功能优化解决方案

分类：系统运维

2015-04-21 20:07:09

部门：网络优化与安全产品部

方案名称：负载均衡解决方案－Array IDC功能优化解决方案

一、用户需求

　　数据中心是以若干个高品质机房或整座数据中心大楼为其物理环境，提供网络间的高速互联，让来自任何一个网络的用户都能高速访问，同时提供一种高端的Data Delivery的服务，即高速接入的服务，并辅以明确的服务保证，其中对温度、湿度、安全、管理都有严格的要求。利用网络为各类Internet用户，提供高品质的，7×24小时的高可靠性、高可用性的各类服务。
　　为了能提供优质的服务，任何一家高质量的数据中心，在网络建设方面都不可避免地面临下面的应用需要：
　　（1）同各大网络的高速互联
　　由于国家电信宏观政策调整，九大骨干网通过中国国家互联网中心已基本互联互通，此时要求数据中心同国内各互联网网络单位高速对等互联，并根据需要在各个接入线路实现链路负载分担，即确保了整体网络的不间断性，又充分利用了现有的网络接入资源。
　　（2）高品质的网络监测
　　数据中心内部的网络控制中心（NOC）提供供不间断的网络设备联结状况、服务器运行状态、流量监控及系统管理和支持，要求网络设备具有很强的可监控性和可维护性。
　　（3）服务器负载均衡服务
　　网站内容的增加，功能的增多，使得支撑网站的服务器数量开始增多，网站的服务器负载均衡服务，可以根据实际的服务器响应时间，平衡服务器群中所有服务器之间的通信负载，从而提高站点性能和响应能力，同时减少错误的发生。
　　（4）网站加速服务
　　网站加速服务，可以使服务器处理HTTP压缩或安全套接层协议（SSL）的加密/解密工作时的效率提高数十倍，从而提高对应用的的响应速度。采用这种HTTP压缩或SSL加速服务，网站可以最大限度地利用互联网服务器投资，提高访问相应速度，为用户的投资提供极高的性能价格比。
　　（5）网站镜像服务
　　由于中国互联网发展的不平衡性，各地之间互联的带宽也不相同，造成了网站在各地的访问速度不一致。利用多址流量分配和Cache技术提供的多址镜像服务，能够根据单个URL将通信路由至最方便、最可用的站点。

二、 Array数据中心服务优化解决方案的设计原则

　　
　　在深入了解数据中心用户的需求后，Array 设计了这一套完整的数据中心网络服务优化解决方案，用以保证数据中心的成功运营。
　　根据数据中心的具体特点及建设经验，以及数据中心网络系统整个工程的重要性，网络系统优化设计必须既适应当前应用考虑，又面向未来信息化发展需求。在设计技术方案时，遵循以下设计原则：
1. 可扩展性
　　数据中心网络系统是一个不断发展的系统，所以它必须具有良好的扩展性。能够根据将来信息化的不断深入发展的需要，方便的扩展网络覆盖范围、扩大网络容量和提高网络各层次节点的功能。具备支持多种通信媒体、多种物理接口的能力，提供技术升级、设备更新的灵活性。
　　Array设计的数据中心网络应用优化解决方案采用了模块化的设计，从而具有良好的可扩展性，完全可以适应数据中心业务的发展，逐步扩展网络。针对到具体的数据中心网络解决方案，其可扩展性主要体现在以下方面：
　　（1）网络可扩展的关键在于能否实现合理的模块化设计，采取模块化的设计可以根据网络需求的变化，在不影响现有网络运行的状况下，迅速扩展。在Array提供的方案中，模块化即为其重要的一点，在整个数据中心网络设计中分为Internet互联模块、系统安全模块、核心交换模块、针对不同数据中心用户类型的功能模块、及后台管理模块。每个模块可以进行独立设计，可根据不同数据中心的不同需求、规模、及业务发展状况进行取舍。
　　（2）在Array提供的数据中心方案中，Internet互联层、核心层、业务功能层皆采用先进的智能专用网络设备，其分布式的体系结构提供了十分强大的网络吞吐能力，加上这些设备丰富的L4/L7功能，使得整个数据中心网络具有极强的扩展能力。
2. 实用性和可靠性
　　高实用性和高可用性是数据中心运营成功的关键，也是数据中心用户特别是进行电子商务的用户选择数据中心的基本原则。针对数据中心的网络方案，其可用性设计包括网络设备本身的冗余能力、网络的冗余设计。Array方案中主要的高实用性和高可用性设计有：
　　（1）提供多种冗余技术。在Array 数据中心优化解决方案中，在不同层次可提供增值冗余设计，在Internet 层采用 HSRP或VRRP 冗余协议、核心层采用STP、VRRP等技术、分布层采用Array TM负载均衡设备的重定向功能实现高效、负载均衡的服务器备份。采用 VRRP实现网络连接的冗余设计。
　　（2）采用Array TM的健康检查功能，对实现负载均衡的服务器、防火墙等设备实施实时的监测和故障自动屏蔽功能。
　　（3）采用Array TM的负载均衡功能和基于内存的Cache功能配合的解决方案，实现对客户服务器的吞吐能力的动态冗余备份能力，帮助用户在不增加服务器的情况下，响应访问高峰时的突发流量，避免服务器过载。
　　（4）采用Array TM的L4/L7增值功能，提供在线备份服务器方案，故障后的应急服务器方案，在线维修服务器方案。
3. 灵活性
　　灵活的目的是要实现“根据用户具体需求进行定制”，这是数据中心运营商在激烈的竞争中可继续发展的保证。在Array的解决方案中，其模块化设计，可根据数据中心不同需求进行取舍，特别是后台管理平台的设计思想，使数据中心可实现对于不同用户定制的服务，如在后台管理平台中的用户数据备份中心、客户中心、控制中心，使数据中心用户可以方便地进行对其应用的控制与更新。
4. 可管理性
　　对于数据中心运营商而言，运营管理的成功与否是数据中心是否成功的标志，而网络的可管理性是数据中心运营管理成功的基础。在Array 的数据中心优化网络方案中，可提供多种优化的可管理信息。
　　（1）对于用户的各项业务，Array 解决方案可提供多种方式的详尽的事件记录以供给计费系统进行计费。
　　（2）通过SNMP协议，Array设备能够与网络管理产品方便的进行集成，只需建档设置便能够实现统一管理平台下多台Array产品的即时监控和管理。
　　（3）提供多种安全管理控制模式，通过WebUI方式，用户安全的能够快速配置管理Array设备，实现所有功能。

三、 Array数据中心优化解决方案

　　针对Internet市场用户不断增加、Internet服务负载不断加重、Interent新型的电子商务应用需求的增长，以及目前数据中心网络面临的问题，为满足广大电信用户的需求，Array公司采用全新的网络服务概念，以优质的服务和产品建立高质量的数据中心，使用户获得高质量的服务，为数据中心提出了高可靠性、高可用性的全面解决方案。
　　Array的All In One核心技术，提供了按需应用的概念，它支持服务器的负载均衡，链路负载均衡应用层状态检测防火墙（WEBWAll），SSL加速，Cache功能，广域网的负载均衡（GSLB），HTTP压缩，高可靠性Cluster 技术和支持CDN 的重定向访问的CDD技术。
　　（1）数据中心可利用Array产品为用户提供的服务保证：
　　a. 为用户提供每天24小时的服务
　　b. 提供全网的高可靠性
　　c. 提供本地，异地的负载均衡
　　d. 提供网络访问的加速
　　（2）数据中心利用array 产品提供的增值服务：
　　a. 提供各类基于IP地址和固定端口的负载均衡
　　b. 为用户服务器提供高可性、高可靠性的控制
　　c. 为大型Internet用户提供全球负载均衡
　　d. 为电子商务用户提供SSL加速
　　e. 为用户提供内容加速
　　h. 提供CDN的实现和多种服务

1．SLB－对各类服务器提供的高可靠性、负载均衡的解决方案
　　对于数据中心而言，访问时延和服务器的可靠性是非常重要的问题。而随着业务的增长，对拥有多台服务器的数据中心来说，不是全部服务器都发挥了其应有的效力。Array的负载均衡服务，使每台服务器的处理能力都能得到充分的发挥。SLB可以实现如下的功能：
　　- 提供真正面向应用层的WWW、DNS、FTP，以及基于固定端口的TCP/UDP等应用的负载均衡；
　　- 无需改动网络拓扑结构，即可实现功能；
　　- 功能强大，支持路由功能- 根据实际响应时间的负载平衡算法来实现真正的合理的流量分配。
1.1 SLB的工作模式

Array的服务器负载均衡可以以两种模式执行：Reverse Proxy Mode（反向代理模式）和Transparent Mode（透明模式）。
　　（1）Reverse Proxy Mode（反向代理模式）
　　使用Array TM的反向代理服务可以将请求转发给内部的服务器，让Array TM将请求均匀地转发给多台内部服务器之一上，从而达到负载均衡的目的。这种代理方式与普通的代理方式有所不同，标准代理方式是客户使用代理访问多个外部服务器，而这种代理方式是多个客户使用它访问内部服务器，因此也被称为反向代理模式。其传输流程如下所示：

反向代理模式的优点：
　　－可以采用One-armed的结构部署；
　　－可以通过连接池技术增强系统性能。
　　反向代理模式的局限性：
　　－服务器无法记录哪些IP的客户端曾进行访问
　　解决办法: Array TM可以在用户的HTTP包头中加入X-Forwarded-For字段，用它记录客户端的IP地址。
　　（2）Transparent Mode（透明模式）
　　Array TM 的透明模式是指Array TM在转发用户请求时，透明地将客户端的连接定向到特定的服务器上，即用户的源IP地址对服务器是透明的，服务器可以知道哪个客户对其进行了访问。其传输流程如下：

透明模式的优点：服务器可以记录哪些IP的客户端曾进行访问。
　　透明模式的局限性：
　　－结构/路由设计必须保障从源服务器端来的响应必须经过TM；
　　－One-armed的结构有可能不能实现；
　　－由于每个请求的源IP地址都不一样，因此无法利用连接池技术改善系统性能。

1.2 SLB的负载均衡算法

　　Array支持多种服务器负载均衡算法（持续性的和非持续性的），包括轮循算法、最少连接算法、响应时间算法、散列算法、最少连接失误算法，链路带宽算法等等。此外实际服务器可以被分配不同的加权值来调整被分配的流量。比如性能高的大型服务器可配置较大的加权值，而为性能较低的小型服务器设置较小的加权值。为了避免服务器因过载而崩溃，可为实际服务器指定最大连接阈值来避免该服务器过载。任何服务器可被指定为另一台服务器的备份服务器或溢出服务器，从而进一步保证了应用可用性。
　　（1）非持续性算法（Non-Persistent）：一个客户端的不同的请求可能被分配到一个实服务组中的不同的实服务器上进行处理。主要有轮循算法、最少连接算法、响应速度算法等。
－轮循算法（Round Robin）：每一次来自网络的请求轮流分配给内部中的每台服务器，从1至N然后重新开始。此种均衡算法适合于服务器组中的所有服务器都有相同的软硬件配置并且平均服务请求相对均衡的情况；
　　－最少连接算法（Least Connection）：客户端的每一次请求服务在服务器停留的时间都可能会有较大的差异，随着工作时间的加长，如果采用简单的轮循或随机均衡算法，每一台服务器上的连接进程可能会产生极大的不同，这样的结果并不会达到真正的负载均衡。最少连接数均衡算法对内部中有负载的每一台服务器都有一个数据记录，记录的内容是当前该服务器正在处理的连接数量，当有新的服务连接请求时，将把当前请求分配给连接数最少的服务器，使均衡更加符合实际情况，负载更加均衡。此种均衡算法适合长时间处理的请求服务。
　　－响应速度算法（Response Time）：负载均衡设备对内部各服务器发出一个探测请求（例如Ping），然后根据内部中各服务器对探测请求的最快响应时间来决定哪一台服务器来响应客户端的服务请求。此种均衡算法能较好地反映服务器的当前运行状态，但最快响应时间仅仅指的是负载均衡设备与服务器间的最快响应时间，而不是客户端与服务器间的最快响应时间。
　　（2）持续性算法（Persistent）：从一个特定的客户端发出的请求都被分配到一个实服务组中的同一个实服务器上进行处理。主要包括：
　　A．基于IP的算法
　　－Persistent IP (pi)：基于用户IP地址来选择服务器。
　　－Hash IP (hi) ：基于用户IP地址的HASH值，来选择服务器
　　－Consistent Hash IP (chi)：
　　B．基于报头/请求的算法
　　－Hash Header (hh)：基于用户请求报中HTTP报头来选择服务器；
　　－Persistent Hostname (ph) ：基于用户请求报中HTTP报头的Hostname的HASH值，来选择服务器；
　　－Persistent URL (pu)：基于对URI Tag 和值的静态对应关系来选择服务器。－SSL Session ID (sslsid)：基于SSL会话ID来选择服务器。
　　C．基于Cookie的算法
　　－Persistent Cookie (pc) ：选择服务器基于用户请求包用Cookie Name / Value 的静态对应关系；
　　－Hash Cookie (hc) ：选择服务器基于用户请求包用Cookie Name / Value 的Hash 值对应关系；
　　－Insert Cookie (ic) ：选择服务器基于Array 向服务器响应包中插入Cookie；
　　－Re-write Cookie (rc)：选择服务器基于Array 向服务器响应包中重写Cookie值。（必须为重写指定Cookie值的偏移量）

1.3 SLB的负载均衡策略

　　SLB 的负载均衡策略主要有三大类：基础性策略、保持性策略、　　QOS策略。
　　（1）基础性策略
　　－Static
　　－Default
　　－Backup
　　（2）保持性策略
　　－Persistent URL
　　－Persistent Cookie
　　－Rewrite Cookie
　　－Insert Cookie
　　－Header
　　（3）QOS 策略
　　－QOS Cookie
　　－QOS Hostname
　　－QOS URL
　　－QoS Network
　　－Regular Expression
　　－Header

1.4 Array的SLB健康检查

　　Array通过对服务器的实时健康检查，保证数据流量会自动绕过故障服务器或不可用服务器。当Array的健康检测机制，检测到服务器重新恢复正常以后，将使该服务器可以自动回到服务器群之中，所有这些服务器故障的处理，对进行操作的用户是完全透明的。
Array对服务器的健康检查，可采用三种方式：
　　－ICMP检查：利用ICMP可检查服务器的网络工作是否正常。
　　－TCP检查：Array可与服务器之间，利用服务器的服务端口建立TCP连接，检查服务器的服务是否正常。
　　－HTTP检查：Array采用HTTP的检查，来验证服务器提供的服务是否正常。
　　通过这三种机制，确保服务器为用户提供正确可靠的服务。用户再也不会得到这样请求的响应 “404 Object Not Found”，或响应内容不正确。

1.5 Array的SLB的特点

　　－实时监控服务器应用系统的状态，并智能屏蔽故障应用系统；
　　－实现多台服务器的负载均衡，提升系统的可靠性；
　　－可以监控和同步服务器提供的内容，确保客户获取到准确可靠的内容；
　　－提供服务器在线维护和调试的手段。
2．Array的GSLB技术，解决异地容灾问题
　　上面提到的SLB（服务器负载均衡）是指能够在性能不同的服务器之间进行任务分配，既能保证性能差的服务器不成为系统的瓶颈，又能保证性能高的服务器的资源得到充分利用。而GSLB（全局服务器负载均衡）允许Web网络托管商、门户站点和企业根据地理位置分配内容和服务。通过使用多站点内容和服务来提高容错性和可用性，防止因本地网或区域网络中断、断电或自然灾害而导致的故障。在Array 数据中心解决方案中GSLB将发挥重要作用，其性能高低将直接影响整个系统的性能。
　　因此，数据中心必须要同时提供基于服务质量的高可用性和完善的负载平衡功能。Array的GLSB可提供基于服务质量的高可用性，从而确保数据中心站点持续运行，并使其IP服务基础设施投资获得最大回报。
　　Array的GLSB用以向用户提供分布于不同地理位置的数据中心的高可用性和智能化业务及流量分担解决方案。

2.1 Array GSLB的工作方式

　　比较大的站点都是由跨网络、跨地域的许多服务器组成的。形成这种局面的主要原因有2个，一个是高可靠性。当我们在一个地点采用负载均衡等技术后，在该地的工作我们已经做得很好了，但问题是如果这个地方的访问量大到超过设计容量、托管数据中心的Internet接入慢了或断了，那我们的站点就会受到影响。另一个是使客户能更快地访问到信息。我们在服务器端做了许多工作，响应能力很强。但由于Internet的延时，对客户的响应时间还有可能太长，如何做到跨网络、跨地域的服务器之间负载均衡呢？使用全球负载均衡Global Server Load Balance，（GSLB）技术就可以做到。
　　全局服务器负载均衡或GSLB 是功能更为强大的 SLB实施。使用GSLB 不仅能够缩短Web响应时间，而且还可使全球的客户察觉不到服务器的故障。GSLB 的基本前提是改进互联网中采用的处理流程，将客户机请求匹配到合适的服务器。
　　实现GSLB的优势在于：
　　* 能够实现内容的高可用性，高扩展性
　　* 能够实现对用户请求最快/最近的响应
　　* 能够实现系统负载的合理分担

　　应用Array TM产品的内容路由功能：SmartDNS可以全面的实现GSLB功能，结合Array TM产品的其它特性和卓越的处理能力，最大程度的满足用户的应用需求，取得最优的性价比。
下图表示的是Array GSLB的工作方式。

2.2 Array GSLB的负载平衡算法

　　在Array TM产品上实现GSLB，最重要的一点是每一个TM设备都需要知道其它TM设备所掌握的服务、链路、系统状态信息，这一点通过Array状态信息通信协议（SICP）来完成。SICP是Array自行研发的私有协议，通过应用SICP协议在各TM产品间进行通信协商，利用协商得到的各个TM产品SLB、LLB的健康检查和状态监测功能，完成GSLB组中状态信息的交换，进而实现GSLB功能。
　　在GSLB中的，TM每2秒（可配置）互相交换健康状态信息。在GSLB中的TM每30秒（可配置）互相交换本地服务器负载、链路负载、网络状况信息。其中网络状态信息包括：链路可用性－LLB、实服务可用性－SLB、虚服务可用性和集群状态。
　　GSLB的核心是负载均衡算法，Array支持非常丰富的算法，包括以下3大类：
　　* 一般性算法
　　* Round Robin Load Balance：类似于服务器负载分担，将用户访问请求按序一个接一个的发送到TM组中。

　　* 基于（链路、网络、系统、服务）负载的算法
　　* Global Link Load Balance：
　　在所有参加的TM设备之间进行选择，进行通信负载分担。当接受到一个新服务请求后，GSLB将会选择最空闲的链路来响应这个请求。链路负载可以通过如下方式来评估：
　　* DNS采样数量
　　* 从一个链路发送/接收的数据包数量
　　* 从一个链路发送/接收的字节数量
　　* Member-based Weighted Round Robin Load Balance：
　　维护一个Round Robin成员列表。表中的每一个TM成员均定义一个weight（加权）。新的服务请求将被路由到当前的TM，直到overflow：超出预先界定的临界值。当overflow发生时,新连接请求将被路由到TM列表中的下一台设备上。通过以下方式定义weight:
　　* DNS采样数量
　　* 从一个链路发送/接收的数据包数量
　　* 从一个链路发送/接收的字节数量
　　* Site-based Weighted Round Robin Load Balance：
　　维护一个基于站点的Round Robin列表。列表中的每一个站点均被赋予一个weight。新服务请求将被路由指向到当前的站点，直到overflow，超出预先界定的临界值。当overflow发生时，下一个服务请求将被路由到列表中指定的下一个站点。Intra-site通信可以通过大多数GSLB所支持的方式进行分配。通过以下方式定义weight:
　　* DNS采样数量
　　* 从一个链路发送/接收的数据包数量
　　* 从一个链路发送/接收的字节数量
　　* Connection Overflow Load Balance：
　　这种方式定义了一个溢出链（Overflow Chain）：TM1, TM2, …, TMn
　　每一个TM均被指定一个溢出阀值。当GSLB接受到一个服务请求的时候，它对TM1上的活动TCP连接进行检查，如果连接数超过了指定的数值（在TM1上设定的TCP最大连接数），则在下一个TM设备上继续检查工作，以此类推，直到发现满足设定，没有溢出的TM。在一个溢出链中最多可以支持64个TM设备。在每一个溢出链中都有一个默认的TM，当所与其它的TM设备的连接数均发生溢出后，GSLB将会把所有新服务请求发送到默认的TM上，直到其它TM设备不在溢出状态为止。这种算法对Web服务器组非常重要，能够确保没有服务器过载。
　　* Member-based Volume Overflow Load Balance：
这种方式类似于Connection Overflow算法，除了是通过TM的负载进行的判断，而不是通过活动TCP连接数。进行比较的数值为:
　　* 发送/接收的数据包的数量
　　* 发送或接收的字节的数量
　　* Site-based Volume Overflow Load Balance：
　　这种算法类似于 Member-based Overflow 算法，除了比较的数值是每一个站点的访问量，而不是每个TM的情况。进行比较的数值为:
　　* 发送/接收的数据包的数量
　　* 发送或接收的字节的数量
　　* Member-based Hit Overflow Load Balance：
这种算法类似于 volume overflow 算法，除了是通过实际服务连接数进行判断，而不是通过发送/接收的数据包，或发送/接收的字节数。
　　* Site-based Hit Overflow Load Balance：
这种算法类似于 member-based hit overflow ,区别在于算法是基于每一个站点进行判断，而不是基于每一个TM进行。
　　* Response Time based Load Balance：
通过响应时间来衡量服务器的QoS，通过初始化一个到真实服务器的服务，每一个TM以一个有规则的方式来衡量响应时间。当收到一个服务请求，则将此请求路由发送到TM组中最小响应时间的TM上。
　　* 基于与用户距离的算法
　　* Proximity Load Balance：
　　亲近负载均衡服务基于用户地址位置。例如，如果一个服务在纽约、拉丁美洲、伦敦和北京均有服务器，当一个用户从芝加哥访问这个服务时，他的访问请求将被直接路由到纽约的服务器上，如果纽约的服务器不能正常工作或太忙，他将被路由到拉丁美洲的服务器上，以此类推。亲近负载均衡服务能够基于站点的成员进行，如果是基于站点的站点内的算法将可以同时通过其它TM的算法来实现。
　　* Least Hop Load Balance：
当收到一个访问请求时，GSLB比较从发起请求者到每一个选择响应的TM组的成员的路由跳数（hop），选择最小跳数的TM设备来响应用户的请求。
　　* Least Latency Load Balance
当收到一个访问请求，GSLB比较所有TM到访问发起者的响应时间延迟，并选择最小延迟的TM来响应此用户的请求。

Smart DNS通过其内置的IP地址／地域／网络对应表来实现用户的就近访问策略，当位于不同位置的Local DNS请求到达的时候，SmartDNS根据对用户的Local DNS策略判断用户所处的位置，返回距离用户最近的镜像站点的IP地址。
　　SmartDNS通过智能状态检测功能实现对链路、服务器健康状态的检测。检测的策略可以为ping、TCP端口检测和内容检测，真正的检测服务器和链路的健康状态。对于因故障或检修而停止服务的服务器和链路从负载均衡组中摘除，并继续检测链路和服务器的状态，一旦该链路或服务器恢复健康，则将其继续加入负载均衡组。
　　在网络状况复杂，用户要求较高的状况下，SmartDNS可通过在镜像站点安装Probe探针软件来检测从各镜像站点到达用户Local DNS的速度，通过自我学习建立全网网络状况表，配合智能检测功能来实现用户的最快访问策略。
　　在SmartDNS的内部，采用矩阵算法，对服务器健康状态、网络健康状态、用户IP地理位置等参数进行综合计算，判断返回给用户的最佳镜像站点IP地址，使用户始终能得到最佳的网络服务。

2.4 Array的Disaster recovery――灾难恢复

Array 的灾难恢复是指在两个地理上分离的站点之间提供服务可靠性的策略。其中一个站点作为主站点（Primary Site），另一个作为备份站点（Backup Site）。当主站点工作正常时，所有流量通过主站点；当主站点发生故障时，Array的灾难恢复功能就会把所有请求转到备份站点，备份站点来处理主站点所有的网络请求；当主站点故障恢复时，Array 会把所有的请求转回到主站点上。

2.5 Array GSLB的优势

　　1）GSLB将用户指引到一个地区内的最佳站点上。那些依靠像路由器转发（hops）这种规格的竞争性解决方案在做出负载均衡决定时未能考虑到像网络拥塞和服务器负载这样的一些重要因素。只有Array Networks的GSLB有效地考虑到了这些因素。
　　2）智能负载分配将大多数通信量灌进那些性能最好的站点中而不会使之超载。所有资源均得到有效使用，使用户获得更好的体验。
　　3）当一个站点的所有服务器均出现故障或拥塞时，用户就被自动地转移到下一个最佳站点上，提高了服务和内容的可用性。

3．Array的Cache技术，为数据中心提供加速能力

　　随着访问量的增加，服务器的负载越来越大，这时用户必须投资更换或增加服务器，通过服务器的增加来响应访问量的增大的方式，使得性能价格比大大减小，在一定程度上浪费了用户的投资，同时增加了管理成本。Array的Cache功能可以有效地解决增加或更换服务器的问题，同时又能减轻服务器的负担，提高性能。将反向Cache server放在服务器的前端，使静态的内容由Array Cache响应用户的请求，服务器仅处理动态的内容，可以在节约40%带宽的情况下，最大化的提高网络用户访问本网站内容的速度。

Array的Cache采用下列技术，提高其响应和吞吐量：
　　（1）Array Reverse Proxy Cache 特点：
　　－兼容HTTP 1.0 和HTTP 1.1；
　　－被Cache的内容以 “Frame” 格式存贮，而不是以文件存贮，从而快速存取，仅仅数据以“Frame”格式保存；（剥去了Etherent，IP&TCP的报头）
　　－内容保存于RAM，具有更快的存取速度；
　　－ Cache 内容能手动删除；
　　－内容能容预先装入 (recursive pre-load)；
　　－利用“GET if modified:” 请求，在后台对内容进行有效性验证；
　　－仅 HTTP GET 请求由Cache Engine处理，其它请求Forward到 SLB处理；
　　－请求含有Cookies 由 SLB 处理。响应含有Cookies的根据报头的Cache控制信息处理；
　　－ HHTP无Cache控制报头，自动Cache，通过人工删除Cache的内容；
　　－支持LOG Squid 格式 (messages sent via Syslog)。
　　（2）Re-use 连接
　　－为了提高Array和服务器的性能，在Array与服务器之间建立持续的TCP连接，从而Array不要为每个需与WEB服务器得理的请求，建立新的连接；
　　－Array与Web服务器之间，预先建立20个TCP连接，用于Forward用户的请求到WEB服务器，一个连接能Foreward 95 个用户请求。
　　因此，Array Cache 能在加速用户访问的同时，减轻服务器的负担。
　　Array TM反向代理快速缓存的优势：
　　－采用内存缓存和包存储结构的方式，提供比其他缓存更快速的响应速度；
　　－解决服务器端的“连接塞车”问题。对同一个内容的并发请求通过TM后，只会产生一个请求到后端服务器；
　　－动态调整缓存空间。Array TM可以根据系统负载动态调整缓存空间大小，在系统需要更多内存处理HTTP请求时，可以自动减少缓存空间，将部分内存归还系统；在系统负载降低后，再将该部分内存返还，继续作为缓存的空间；
　　－提供防DOS攻击的好处。

4．提供SSL加速能力

　　SSL（安全套接层协议）已经成为互联网安全通信的标准协议。它是一种对用户进行鉴权的公钥加密方案。首先，服务器向客户机发送承认其可靠性的认证。然后，使用共享密钥来对发送方与接收方之间的数据进行加密。例如，当发送方确认接收方正确无误时，会为数据包加上一个安全的“外壳”（加密），同时通过线缆传输此数据包。必须在目的地将此“外壳”去掉，才能使用该数据包信息。其它的步骤还包括：认证、加密和解密，这极大地增加了Web服务器的流量处理负担。
　　为了解决数据中心服务器反应速度问题，从根本上解决SSL给服务器运行带来的不利影响，必须采用专门设备处理SSL协议，以便使服务器的CPU从繁重的加密/解密过程中解脱出来。
　　Array内置SSL加速功能使问题迎刃而解。Array产品包括SSL加速技术，该技术是用于卸载服务器的SSL（安全套接层）处理的，以提高其性能，同时大幅度缩短响应时间并增强客户流量管理。SSL加速技术可以提高数据中心服务器的性能，并在运行过程中提供安全性、高速度和流量管理，所有这一切都是从同一地点进行的，无需费钱费力地在每台服务器上安装额外的硬件或软件。
　　Array解决方案能使数据中心工作人员卸载认证管理以及加密和解密功能，从而提高工作效率和可靠性。解决方案真正解除了Web服务器上的通信负载。因此，无需再购买额外的服务器来处理SSL流量。Array产品还允许您为整个服务器集群只购买一个证书，从而降低了成本并减少了证书管理的时间，与必须为每台Web服务器购买和安装SSL处理卡不同的是，您只需安装一次SSL加速器。

Array SSL 加速特性：
　　－通过专用硬件――SSL加速卡实现高性能的SSL加速；
　　－同时支持异步和同步的加密加速服务；
　　－通过突破性的专利技术SpeedStack?技术保障高性能；
　　－可以同时处理SSL流量和非SSL流量；
　　－ CSR 能产生证书的申请，同时生成一个临时的证书用于测试；
　　－能为Open-SSL，Apache-SSL and Microsoft IIS导入PEM格式的证书；
　　－能导入 Chained (intermediate) certificates；
　　－利用X-Forwarded header，把用户的IP地址传给服务器，用于LOG记录用户的访问；
　　－支持当今流行 128 bit 加密密钥。
　　－Array TM每秒钟可以处理5000个SSL交易，并以750Mbps的吞吐量同时处理32000个SSL连接。

5．提供安全机制－Webwall有效解决安全问题

　　数据中心的首要条件是安全性，如果数据的安全无法保证，数据中心也将成为空谈。因此数据中心站点必须配备防火墙，以确保交易安全。随着网上用户的逐步增加，Internet的连接速度不断提升，防火墙作为整个系统的瓶颈将越来越明显。由于防火墙要求数据流同进同出，故无法采用简单的叠加方式提升防火墙性能，直接导致速度缓慢甚至无法运行。
　　Array的产品具备内在的安全特性，这些特性是专门为避免遭受攻击和为服务器和网络设备提供保护而特别设计的。Array WebWall防火墙能有效地保护服务器和应用的安全。
　　Array WEBWALL 产品可有效保护您的服务器：
　　1）支持应用层URL的过滤；
　　2）基于包状态检测的防火墙；
　　3）支持NAT的功能，使内部用户能访问Internet的资源；
　　4）端口的 Forward 功能，使用户能远端对服务器进行管理，能把常用的端口映射到服务器的任意端口(端口映射)。常用的端口，比如80，443，20，21能映射到服务器任何端口。这个能提供更高的安全性,让闯入者很难知道哪些服务运转在哪个端口；
　　5） WebWall功能启动后，它将关闭所有的访问，除非用户显式地打开；
　　6）高效，Array支持多达1000个访问控制列表，仅消耗1％的CPU资源；
　　7） Array的是个坚固的设备，设计得能抵抗一般的攻击，譬如：DOS攻击；
　　8）通过HTTPS或SSL远端管理，使用SSH命令行或以HTTPS来做浏览器界面管理；
　　9）支持SSL的安全访问。

6．Array的Cluster技术，提高可靠性和吞吐量

6.1 Cluster的工作方式

　　传统的四层设备，仅支持二台设备工作在HA方式下，支持Active/Active、Active/Standby工作方式，从而L4设备可靠性，可扩展性，网络吞吐量都受到限制。但L4层的设备是一关健设备，许多L4 层厂家都没有很好解决这些问题。
　　Array在给服务器提供高容错性，高可靠性的前提是，Array设备本身的容错性和高可靠性。Array支持Cluster的工作模式，提供1＋1 和N＋1 的冗余配置模式，能工作在Active/Standby或Active/Active方式。
　　（1） Active/Standby方式
　　在Active/Standby方式，一个Cluster中某个Array设备的所有VIP都是主VIP，其他Array中的VIP都是备份VIP。当主设备故障时，备份设备转换为主设备。如图所示：

图中，Array1为主设备，处理SLB流量，Array2为备份设备，监听Array1的广播，当Array1发生故障时，Array2就会接管Array1上的所有流量。
　　（2）Active/Active方式
　　在Active/Active方式，一个Cluster中每一个Array设备的都有主VIP和备份VIP。如图所示：

图中Array1的VIP1为主VIP，VIP2为备份VIP，Array2的VIP1为备份VIP，VIP2为主VIP。Array1和Array2同时处理SLB流量，又互为备份。

6.2 Array clustering 工作原理

　　－利用 IP Multicast (224.0.0.18) 进行广播，默认值：每3秒一次；
　　－具有最高优先级的成为Master，若一个备份的Array具有最高优先级，它就成为Master；
　　－一个备份Array在3 秒内，没在听到Master的广播，它宣布成为Master；
　　－只在Master的Array的VIP响应ARP请求；
　　－每个设备独立的流量的处理，同时又监视本Cluster中其它设备的工作状态；
　　－能把Clustering 配置成Active-Standby 或 Active-Active ；
　　－利用VRRP的技术实现（ VRRP－虚拟路由冗余协议， RFC 2338）。
7．LLB（Link Load Balanceing）链路负载平衡

7.1 Array LLB在数据中心中的应用

　　目前几乎所有的数据中心都采用多个接入链路（多宿主）接入Internet，采用多宿主的解决方案来避免Internet接入中断所造成的损失。在这里所提及的“多宿主”通常指同时使用不同ISP提供的多条Internet接入链路。可用性的提高来自于多条链路的使用，而性能提高则是因为同时使用多条链路增加了带宽。但是这种多宿主网络目前存在几个严重的问题，一是对于流入流量来说，不能保证链路的同时使用，多宿主解决方案的部分优点无法实现。二是内部网络同时使用两个ISP提供的地址，一部分内部用户（A组）使用ISP1提供的地址，另一部分内部用户（B组）使用ISP2提供的地址，当ISP1的链路中断时，A组的用户将无法接入Internet。除去以上的问题，多宿主网络的一些优势还没有完全实现，例如：
　　－现在一些多宿主网络解决方案只是“共享”式，而不是真正的负载均衡。
　　－没有就近性的路径判断。
　　－对流入的流量没有很好的解决方案。
　　Array 的LLB（链路负载平衡）技术能轻松横跨多个链路连结以传送数据流量，无需在路由器上进行复杂的BGP设定；智能管理不同ISP提供的IP地址网段；保证优化所有的ISP链路，即通过智能负载均衡所有通过可用链路的流量；使用Array的SmartNAT和SmartDNS、最小响应时间检测算法来选择用于输入输出流量的最佳ISP；确保两个ISP链路同时应用与所有的流入流量，保证数据中心Internet连接的畅通。

7.2 Array LLB的技术实现

　　Array的LLB技术实现如图所示：

图中多宿主网络通过ISP1和ISP2接入Internet。每个ISP都分配给该网络一个IP地址网段，假设ISP1分配的地址段为100.10.1.0/24，ISP2分配的地址段为200.20.1.0/24。同样，Internet知道通过ISP1访问100.10.1.0/24，通过ISP2访问200.20.1.0/24。网络中的主机和服务器都属于私有网段192.168.1.0/24。
　　Array的解决方案就是在内部交换机和连接ISP的路由器之间，跨接一台Array TM，所有的地址处理和Internet链路优化全部由Array TM来完成。
　　如图所示，Array TM的外侧端口1上绑定IP地址100.10.1.2/24，外侧端口2上绑定IP地址200.20.1.2/24，内侧端口上绑定IP地址192.168.1.1/24。
　　（1）流出（Outbound）流量处理
　　ARRAY TM主要采用以下方式来处理流出流量。
　　SmartNAT
　　对于流出流量的智能地址管理，ARRAY TM使用了称为SmartNAT的算法。当选定一个路由器（某一个ISP）传送流出流量时，ARRAY TM将选择该ISP提供的地址。在图二中，如果ARRAY TM选择ISP1作为流出流量的路径，则它将把内部的主机地址　　192.168.1.A/24翻译为100.10.1.10/24，并作为流出数据包的源地址。同样，如果ARRAY TM选择ISP2作为流出流量的路径，则它将把内部的主机地址192.168.1.A/24翻译为200.20.1.10/24，并作为流出数据包的源地址。
　　Shortest Response Time--最快响应时间
　　为了优化流出的流量，ARRAY TM还为流出的流量实施最快响应时间运算。如果内部主机要访问某一Internet站点，可能通过一个ISP的路径比通过其他ISP的路径有效。因此，ARRAY TM可以提供最短响应时间算法，为流出到某一个站点的流量选择最佳的ISP路径，保证所需内容最快到达目的地，提高服务的品质。
　　（2）流入（Inbound）流量处理
　　ARRAY TM不仅需要管理流出的流量，还必须管理来自Internet的访问，即流入（InBound）流量。假设下图中的Server是Web服务器，Internet主机名为llb.arraynetworks.net，地址为私有IP：192.168.1.100/24。

　SmartDNS
　　ARRAY TM上集成的SmartDNS功能能够完成流入流量的负载均衡。
　　如图所示，在DNS服务器上有两笔NS记录指向ARRAY TM：
　　llb.arraynetworks.net 100.10.1.10
　　llb.arraynetworks.net 200.20.1.10
　　而在ARRAY TM上设置静态的地址翻译：
　　192.168.1.100 100.10.1.10
　　192.168.2.100 200.20.1.10
　　当有Internet用户访问llb.arraynetworks.net时，DNS服务器回应给用户由ARRAY TM来完成最终地址解析。ARRAY TM根据具体设置来选定适当的ISP线路，如果选择ISP1，则将地址解析为100.10.1.10。同样，如果选择ISP2，则将地址解析为200.20.1.10。从而完成流入流量的负载均衡。
　　Shortest Response Time
　　对于流入的流量，ARRAY TM使用与流出流量相同的最短响应时间判断机制，选择最佳的流入流量传输路径，进行最终的解析地址。
　　（3）LLB其他的功能设置
　　链路健康检查
　　ARRAY TM在多宿主网络中的一个主要作用是检测ISP链路的可用性，即健康状况。因此，ARRAY TM提供了链路健康检查的功能，从而保证多条数据链路的正常，提高服务质量。
路径健康检查
　　访问Internet的可靠性不仅仅是由ISP路由器提供的链路状况决定的，而是由整个数据流经的路径决定。因此，ARRAY TM提供了路径健康检查的功能，从而保证整条数据路径的正常，提高服务质量。
　　策略路由
　　ARRAY TM可以设置基于用户数据包源IP/Port、目标IP/Port的策略路由，通过该功能可以帮助企业人为的对特殊的流入流出流量进行规划，比如某个业务部门的应用系统需要比较高的数据传输带宽，而公司的多条Internet链路的带宽存在不均衡性，管理员可以选择一条带宽更高的链路承载这个部门的数据流量。

7.3 Array LLB 的优势

　　Array TM是专门为企业实现链路负载均衡设计，它具有以下优势：
　　* 支持多宿主网络，保障企业可以从不同运营商租用链路
　　* 实现流入/流出双向流量负载均衡
　　* 支持防火墙负载均衡
　　* 支持链路和路径健康检查，智能的将不可用的链路排除，保障对Internet访问的永远可用
　　* 支持最短响应时间的监测机制，使用户获得更高的服务质量
　　* 支持策略路由，方便企业人工调控业务流量分配
　　* 支持1＋1的集群，保障TM本身的高可靠性和高性能
　　* 可以和SLB/GSLB/Cache等功能无缝集成，方便企业未来功能扩展
　　* 性价比是业界最优秀的。

8．HTTP压缩（HTTP Compression）技术

　　网速太慢是CNNIC历次调查中用户认为最不满意的一个主要问题。线路拥挤带来的不便甚多，数据中心运营难免不受影响。随着网上业务的增长，用户对因特网的传输速率提出了越来越高的要求。要改善目前上网慢的情况，除了增加路由器速度和服务器的处理能力外，还要想办法提高网络带宽利用率。采用HTTP 压缩技术可以大大提高网络带宽的利用率。
　　Array设备采用了HTTP 压缩技术，即时同轴的HTTP压缩功能可将效能提升为原来的6倍，并大幅节省传送网络服务与其他动态内容时所需的频宽。
　　Array HTTP压缩过程：

采用Array HTTP压缩的优势：
　　－节省带宽；
　　－缩短用户下载内容的时间；
　　－在Web Server上不需要压缩功能，减轻了Web Server的负担。
　　下图是采用HTTP压缩前后的带宽利用率比较：

9． Array在网络加速方面的改进技术

9.1 SpeedstackTM专利技术

　　Array Networks的突破性的SpeedStackTM专利技术，采用高性能数据包处理内核，包括GB级TCP/IP和SSL处理，HTTP处理内核和全代理内核，IP 数据包对全部的网路功能仅需在TCP/IP堆栈中分析一次，可避免重复性的数据包处理工作。
　　Array Networks的SpeedStack技术可以实现：
　　－系统的最低处理时延
　　－紧密的功能集成
　　－高级的功能交迭
　　－零拷贝：所有数据直接放置在内存中，无需多次移动。
　　Array Networks的SpeedStack技术带来的优势：
　　－业界出众的总体性能
　　－系统处理对资源最小化的需求

9.2 Connection Multiplexing（连接复用）技术

　　Array的Connection Multiplexing（连接复用）技术的主要作用是为了改善现有系统的总体性能，其技术原理是自动实现HTTP 1.0到HTTP 1.1的转换。HTTP1.0是短连接，即每次用户请求，都要重新建立一次连接；HTTP1.1 为长连接，连接维持时间较长，它可以将多个请求在一个连接中进行传输，减少连接建立和拆除所带来的延迟，并能够最大限度地降低对并发连接数的消耗，所以TCP/IP协议栈在处理长连接时具有更好的性能。Array的连接复用技术可以将客户端与Array TM的HTTP1.0连接转换为在Array TM与服务器之间使用HTTP1.1连接，使Array TM与服务器之间保持一个长连接，减少了服务器建立和拆除连接对服务器资源的消耗。
　　Array Connection Multiplexing（连接复用）技术的实现过程：

采用Array Connection Multiplexing（连接复用）技术后的效果比较：

9.3 Connection Pooling（连接池）技术
　　Array采用Connection Pooling（连接池）技术，其优点在于：
　　（1）加快了与后台服务器之间的TCP连接处理速度
　　－Array TM预先与后台服务器之间建立多个连接，并保持住它们(每个服务器最多预先建立20个连接)；
　　－如果有客户端的请求，根据负载分担算法被分配到某个后台服务器上，Array TM从预先建立的该服务器的连接池中选择一个连接，在此连接上发送客户端的请求，一个连接可以被用来传送多个请求(每个连接最多可以同时处理90个请求)；
　　－显著的减少了后台服务器需要处理的用户端连接数(减少量可能达90%)
　　（2）改善了服务器的性能.
　　－服务器不需要花费更多的时间处理TCP连接建立和拆除的工作
　　－服务器不需要耗费更多的资源保持多个客户端连接

四、 Array 数据中心解决方案的说明

　　
　　数据中心一般由网络设备、L4/L7的流量控制设备、服务器及网管组成。 Array能与各类网络设备、服务器设备配合工作。对保证网络系统高可靠性、高可用性及提供增值服务的L4/L7的流量控制设备，具有：
　　－服务器流量负载均衡；
　　－全球服务器流量负载均衡；
　　－多地服务器内容同步；
　　－高可靠性、高可用性；
　　－内容的加速访问；
　　－ SSL加速。
　　传统L4层的数据中心解决方案如下图所示。

传统的数据中心解决方案必然带来下面几个问题：
　　（1）系统服务质量低：IP包的多次处理使系统整体延时增大系统整体处理速度受制于最慢的一台设备；
　　（2）扩展系统将涉及到多个设备，系统的扩展处理能力低；
　　（3）系统比较复杂：多个完成单一功能的设备使系统结构趋于复杂；
　　（4）运维成本高：对工程师培训的成本以及多个厂家支持服务的成本。
　　 Array的数据中心解决方案具有简单，高效，成本低等特点，其拓扑结构如下所示：

Array TM在IDC系统设计中的典型应用：

系统一般包括以下几个部分：
　　 Internet接入层 ―― IDC Internet接入层是IDC与公网的汇聚点，一般要求IDC与Internet采用高速、高可靠性的链路进行连接，最好采用冗余设备和链路。互连设备采用高速、高可靠性的路由器。
　　 L4/L7智能带宽管理层―― 主要通过Array TM实现对进出IDC的所有流量进行控制和管理，提高带宽利用率，为关键用户、关键应用提供带宽保证。Array TM提供服务器负载平衡，提升系统可用性和可靠性；提供Cache加速功能，提高Web访问速度，主要采用一些高速缓存加速设备；为IDC系统提供安全保证，通过采用防火墙、入侵检测等系统实现对IDC内部网络的有效保护；以及提供SSL加速，HTTP压缩，集群等功能，保证网络流量安全、畅通，提高带宽利用率。
　　核心交换层――主要提供IDC内部系统的高速、可靠的无阻塞交换，通常采用高性能的千兆以太网交换机，并且配置多台，实现冗余备份。
　　用户接入层 ―― 实现对IDC用户的接入，一般通过以太网、快速以太网实现托管主机、共享主机等服务器的接入，同时重要用户可以配置多台服务器，以及实现对用户数据的存储和备份，一般采用SAN、NAS方式为不同用户提供数据存储和备份，对重要客户提供容灾备份。

阅读(2307) | 评论(0) | 转发(0) |

上一篇：大型网站--负载均衡架构

下一篇：负载均衡应用解决方案－Array证券解决方案

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6