Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1047136
  • 博文数量: 244
  • 博客积分: 6820
  • 博客等级: 准将
  • 技术积分: 3020
  • 用 户 组: 普通用户
  • 注册时间: 2008-09-09 21:33
文章分类

全部博文(244)

文章存档

2013年(1)

2012年(16)

2011年(132)

2010年(3)

2009年(12)

2008年(80)

我的朋友

分类: LINUX

2011-04-29 15:04:44

对于 SO_KEEPALIVE做心跳,我也知道,但是平时一般不用,第一是使用SO_KEEPALIVE你无法控制,它会每时每刻都发,但是使用心跳我们自己可以收到包的情况下不发,第二使用了SO_KEEPALIVE后,对于判断断开时间太长,对于需要及时响应的程序不太适应。
大家一般都是使用业务层心跳来处理,主要是灵活可控。

网络编程不推荐使用SO_KEEPALIVE来做心跳,还是在业务层以心跳包做检测比较好,也方便控制,楼上给的代码是UNIX下的,下不适用。



此处的”非正常断开”指TCP连接不是以优雅的方式断开,如网线等物理链路的原因,还有突然主机断电等原因
有两种方法可以检测:1.TCP连接双方定时发握手消息 2.利用TCP协议栈中的KeepAlive探测
第二种方法简单可靠,只需对TCP连接两个Socket设定KeepAlive探测,
所以本文只讲第二种方法在,Window2000下的实现(在其它的平台上没有作进一步的测试)
Windows 2000平台下

#include
//定义结构及宏
struct TCP_KEEPALIVE {
u_longonoff;
u_longkeepalivetime;
u_longkeepaliveinterval;

} ;

 1. tcp_keepalive live,liveout;  
 2. live.keepaliveinterval=500;  
 3. live.keepalivetime=3000;  
 4. live.onoff=TRUE;  
 5. int iRet = setsockopt(Socket,SOL_SOCKET,SO_KEEPALIVE,(char *)Opt,sizeof(int));  
 6. if(iRet == 0){  
 7.  
 8.     DWORD dw;  
 9.  
 10.     if(WSAIoctl(Socket,SIO_KEEPALIVE_VALS,&live,sizeof(live),&liveout,sizeof(liveout),&dw,NULL,NULL)== SOCKET_ERROR){  
 11.  
 12.         //Delete Client  
 13.  
 14.         return;  
 15.     }  
 16.   }  

 ACE下代码

 int pt = 1;
 //在测试过程中,发现检测的次数是5次,即下面的中,从最近一次消息开始计算的10秒后,每次间隔5秒,连续发送5次,即
 //35秒发现网络断了
tcp_keepalive live,liveout;  
live.keepaliveinterval=5000; //每次检测的间隔 (单位毫秒)
live.keepalivetime=10000;  //第一次开始发送的时间(单位毫秒)
live.onoff=TRUE;  
int iRet = stream.set_option(SOL_SOCKET,SO_KEEPALIVE,&Opt,sizeof(int));  
if(iRet == 0){  

      DWORD dw;  

   //此处显示了在ACE下获取套接字的方法,即句柄的(SOCKET)化就是句柄
     if(WSAIoctl((SOCKET)h,SIO_KEEPALIVE_VALS,&live,sizeof(live),&liveout,sizeof(liveout),&dw,NULL,NULL)== SOCKET_ERROR){  

         //Delete Client  

         return;  
     }  
   }  



Linux平台下
#include   "/usr/include/linux/tcp.h"
#include "/usr/include/linux/socket.h"
////KeepAlive实现,单位秒
//下面代码要求有ACE,如果没有包含ACE,则请把用到的ACE函数改成linux相应的接口
int keepAlive = 1;//设定KeepAlive
int keepIdle = 5;//开始首次KeepAlive探测前的TCP空闭时间
int keepInterval = 5;//两次KeepAlive探测间的时间间隔
int keepCount = 3;//判定断开前的KeepAlive探测次数

if(setsockopt(s,SOL_SOCKET,SO_KEEPALIVE,(void*)&keepAlive,sizeof(keepAlive)) == -1)
{
ACE_DEBUG ((LM_INFO,
ACE_TEXT ("(%P|%t) setsockopt SO_KEEPALIVE error!\n")));

}

if(setsockopt(s,SOL_TCP,TCP_KEEPIDLE,(void *)&keepIdle,sizeof(keepIdle)) == -1)
{
ACE_DEBUG ((LM_INFO,
ACE_TEXT ("(%P|%t) setsockopt TCP_KEEPIDLE error!\n")));

}

if(setsockopt(s,SOL_TCP,TCP_KEEPINTVL,(void *)&keepInterval,sizeof(keepInterval)) == -1)
{
ACE_DEBUG ((LM_INFO,
ACE_TEXT ("(%P|%t) setsockopt TCP_KEEPINTVL error!\n")));

}

if(setsockopt(s,SOL_TCP,TCP_KEEPCNT,(void *)&keepCount,sizeof(keepCount)) == -1)
{
ACE_DEBUG ((LM_INFO,
ACE_TEXT ("(%P|%t)setsockopt TCP_KEEPCNT error!\n")));

}


假设一种情况:一个socket TCP监听进程监听数据的时候如何接收关闭文件的socket连接?

不用并发

 read/recv函数返回0均表示正常结束。此时关闭即可。如果用select/poll/epoll管理,该套接字也会读就绪,然后调用recv/read返回0。
 对于异常关闭如网络崩溃、主机宕机等,可通过设置SO_KEEPALIVE设置保活,会按照设定间隔自动发送探测分节。该选项分为设置无数据首次探测时间、探测间隔、探测次数控制TCP是否出错。如果你设置首次探测在10秒之后、探测间隔3次,探测次数3次,则最多30秒之后将给层返回一个对方非正常关闭的异常,此时可通过获得errno得到对应错误,read/recv返回为-1。具体代码是:
void setKeepAlive( int iSockfd , socklen_t iIdleTime , socklen_t iInterval , socklen_t iCount )
{
    
    setsockopt( iSockfd , SOL_SOCKET , SO_KEEPALIVE , (const char*)&iSockAttrOn , sizeof(iSockAttrOn) );

    
    setsockopt( iSockfd , SOL_TCP , TCP_KEEPIDLE , (const char*)&iIdleTime , sizeof(iIdleTime) );
    
    setsockopt( iSockfd , SOL_TCP , TCP_KEEPINTVL , (const char*)&iInterval,sizeof(iInterval) );
    
    setsockopt( iSockfd , SOL_TCP , TCP_KEEPCNT , (const char*)&iCount,sizeof(iCount) );

阅读(1281) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~