HAproxy健康检测机制-unicorn-ww-ChinaUnix博客

crazymind

首页　| 　博文目录　| 　关于我

unicorn-ww

博客访问： 233849
博文数量： 41
博客积分： 0
博客等级：民兵
技术积分： 407
用户组：普通用户
注册时间： 2013-06-27 13:42

文章分类

全部博文（41）

C（2）
java（3）
备忘（1）
算法（18）

广度优先搜索（2）

图（0）

数据结构（1）

动态规划（4）

例题其他（3）
nginx（8）
haproxy（1）

1.1.9（0）

转载（0）
Linux（8）

网络编程（7）
未分配的博文（0）

文章存档

2016年（1）

2015年（18）

2014年（22）

我的朋友

CU官方博

1 概述

HAProxy作为Loadbalance，支持对backend的健康检查，以保证在后端backend不能服务时，把从frotend进来的request分配至可以其它可服务的backend，从而保证整体服务的可用性。

2 相关配置

option httpchk

启用七层健康检测

http-check disable-on-404

如果backend返回404，则除了长连接之外的后续请求将不被分配至该backend

http-check send-state

增加一个header，同步HAProxy中看到的backend状态。该header为server可见。 X-Haproxy-Server-State: UP 2/3; name=bck/srv2; node=lb1; weight=1/2; scur=13/22; qcur=0

server option

check：启用健康检测

inter：健康检测间隔

rise：检测服务可用的连续次数

fall：检测服务不可用的连续次数

error-limit：往server写数据连续失败的次数上限，执行on-error的设定

observe ：把正常服务过程作为健康检测请求，即实时检测

on-error ：满足error-limit后执行的操作（fastinter、fail-check、sudden-death、mark-down）。其中fastinter表示立即按照fastinter的检测延时进行。fail-check表示改次error作为一次检测；sudden-death表示模仿一次fatal，如果紧接着一次fail则置server为down;mark-down表示直接把server置为down状态。

其它

retries：连接失败重试的次数，如果重试该次数后还不能正常服务，则断开连接。

3 检测机制

3.1 相关数据结构

struct server {

......

int health; /* 0->rise-1 = bad; rise->rise+fall-1 = good */

int consecutive_errors; /* current number of consecutive errors */

int rise, fall; /* time in iterations */

int consecutive_errors_limit; /* number of consecutive errors that triggers an event */

short observe, onerror; /* observing mode: one of HANA_OBS_*; what to do on error: on of ANA_ONERR_* */

int inter, fastinter, downinter; /* checks: time in milliseconds */

......

}

3.2 check流程

3.3 server状态切换条件

UP-->DOWN

初始为s->health=s->rise;

if (s->health < s->rise + s->fall – 1) then s->health = s->rise + s->fall – 1;

check失败：s->health--

if (s->health <= s->rise) then set_server_down(), s->health = 0;
DOWN-->UP

初始为s->health=0;

check成功：s->health++

if (s->health == s->rise) then set_server_up(), s->health = s->rise + s->fall – 1;

3.4 observe机制

observe机制是分析请求服务过程中发生错误的时候调用heath_adjust函数来实时更新check机制中的相关计数。其跟check机制的区别在于，check机制只通过定时检测。observe机制基于check机制。在不同的on-error(mode)情况下对s->health的影响如下：

备注：执行on-error(mode)的前提是

s->consecutive_errors < s->consecutive_errors_limit（连接失败的次数超过了上限）

fastinter

不修改s->health值，但是会调整check出发的时间，时间为间隔fastinter后的数字。

fail-check

把本次连接的失败作为1次check，s->health--

sudden-death

把本次连接作为1次致命的失败，s->health = s->rise + 1，如下次还失败则置为DOWN

mark-down

本次连接失败后，直接把后端server置为DOWN

阅读(2669) | 评论(0) | 转发(0) |

上一篇：TCP客户/服务器原理

下一篇：非阻塞式IO

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6