的实践过程中总结出来的一些经验,仅供大家参考。本文所谈到的Socket函数如果没有特别说明,都是指的Windows Socket API。
一、WSAStartup函数
int WSAStartup(
WORD wVersionRequested,
LPWSADATA lpWSAData
);
使
用Socket的程序在使用Socket之前必须调用WSAStartup函数。该函数的第一个参数指明程序请求使用的Socket版本,其中高位字节指
明副版本、低位字节指明主版本;操作系统利用第二个参数返回请求的Socket的版本信息。当一个应用程序调用WSAStartup函数时,操作系统根据
请求的Socket版本来搜索相应的Socket库,然后绑定找到的Socket库到该应用程序中。以后应用程序就可以调用所请求的Socket库中的其
它Socket函数了。该函数执行成功后返回0。
例:假如一个程序要使用2.1版本的Socket,那么程序代码如下
wVersionRequested = MAKEWORD( 2, 1 );
err = WSAStartup( wVersionRequested, &wsaData );
二、WSACleanup函数
int WSACleanup (void);
应用程序在完成对请求的Socket库的使用后,要调用WSACleanup函数来解除与Socket库的绑定并且释放Socket库所占用的系统资源。
三、socket函数
SOCKET socket(
int af,
int type,
int protocol
);
应用程序调用socket函数来创建一个能够进行通信的套接字。第一个参数指定应用程序使用的通信协议的协议族,对于TCP/IP协议族,该参数置PF_INET;第二个参数指定要创建的套接字类型,流套接字类型为SOCK_STREAM、报套接字类型为SOCK_DGRAM;第三个参数指定应用程序所使用的通信协议。
该函数如果调用成功就返回新创建的套接字的描述符,如果失败就返回INVALID_SOCKET。套接字描述符是一个整数类型的值。每个进程的进程空间里都有一个套接字描述符表,该表中存放着套接字描述符和套接字结构的对应关系。该表中有一个字段存放新创建的套接字的描述符,另一个字段存放套接字结构的地址,因此根据套接字描述符就可以找到其对应的套接字结构。每个进程在自己的进程空间里都有一个套接字描述符表但是套接字结构都是在操作系统的内核缓冲里。下面是一个创建流套接字的例子:
struct protoent *ppe;
ppe=getprotobyname("tcp");
SOCKET ListenSocket=socket(PF_INET,SOCK_STREAM,ppe->p_proto);
四、closesocket函数
int closesocket(
SOCKET s
);
closesocket函数用来关闭一个描述符为s套接字。由于每个进程中都有一个套接字描述符表,表中的每个套接字描述符都对应了一个位于操作系统缓冲区中的套接字结构,因此有可能有几个套接字描述符指向同一个套接字结构。套接字结构中专门有一个字段存放该结构的被引用次数,即有多少个套接字描述符指向该结构。当调用closesocket函数时,操作系统先检查套接字结构中的该字段的值,如果为1,就表明只有一个套接字描述符指向它,因此操作系统就先把s在套接字描述符表中对应的那条表项清除,并且释放s对应的套接字结构;如果该字段大于1,那么操作系统仅仅清除s在套接字描述符表中的对应表项,并且把s对应的套接字结构的引用次数减1。
closesocket函数如果执行成功就返回0,否则返回SOCKET_ERROR。
五、send函数
int send(
SOCKET s,
const char FAR *buf,
int len,
int flags
);
不论是客户还是器应用程序都用send函数来向TCP连接的另一端发送。客户程序一般用send函数向器发送请求,而器则通常用send函数来向客户程序发送应答。该函数的第一个参数指定发送端套接字描述符;第二个参数指明一个存放应用程序要发送的缓冲区;第三个参数指明实际要发送的的字节数;第四个参数一般置0。这里只描述同步Socket的send函数的执行流程。当调用该函数时,send先比较待发送的长度len和套接字s的发送缓冲区的长度,如果len大于s的发送缓冲区的长度,该函数返回SOCKET_ERROR;如果len小于或者等于s的发送缓冲区的长度,那么send先检查协议是否正在发送s的发送缓冲中的,如果是就等待协议把发送完,如果协议还没有开始发送s的发送缓冲中的或者s的发送缓冲中没有,那么send就比较s的发送缓冲区的剩余空间和len,如果len大于剩余空间大小send就一直等待协议把s的发送缓冲中的发送完,如果len小于剩余空间大小send就仅仅把buf中的copy到剩余空间里(注意并不是send把s的发送缓冲中的传到连接的另一端的,而是协议传的,send仅仅是把buf中的copy到s的发送缓冲区的剩余空间里)。如果send函数copy成功,就返回实际copy的字节数,如果send在copy时出现错误,那么send就返回SOCKET_ERROR;如果send在等待协议传送时断开的话,那么send函数也返回SOCKET_ERROR。要注意send函数把buf中的成功copy到s的发送缓冲的剩余空间里后它就返回了,但是此时这些并不一定马上被传到连接的另一端。如果协议在后续的传送过程中出现错误的话,那么下一个Socket函数就会返回SOCKET_ERROR。(每一个除send外的Socket函数在执行的最开始总要先等待套接字的发送缓冲中的被协议传送完毕才能继续,如果在等待时出现错误,那么该Socket函数就返回SOCKET_ERROR)
注意:在Unix系统下,如果send在等待协议传送时断开的话,调用send的进程会接收到一个SIGPIPE信号,进程对该信号的默认处理是进程终止。
六、recv函数
int recv(
SOCKET s,
char FAR *buf,
int len,
int flags
);
不论是客户还是器应用程序都用recv函数从TCP连接的另一端接收。该函数的第一个参数指定接收端套接字描述符;第二个参数指明一个缓冲区,该缓冲区用来存放recv函数接收到的;第三个参数指明buf的长度;第四个参数一般置0。这里只描述同步Socket的recv函数的执行流程。当应用程序调用recv函数时,recv先等待s的发送缓冲中的被协议传送完毕,如果协议在传送s的发送缓冲中的时出现错误,那么recv函数返回SOCKET_ERROR,如果s的发送缓冲中没有或者被协议成功发送完毕后,recv先检查套接字s的接收缓冲区,如果s接收缓冲区中没有或者协议正在接收,那么recv就一直等待,只到协议把接收完毕。当协议把接收完毕,recv函数就把s的接收缓冲中的copy到buf中(注意协议接收到的可能大于buf的长度,所以在这种情况下要调用几次recv函数才能把s的接收缓冲中的copy完。recv函数仅仅是copy,真正的接收是协议来完成的),recv函数返回其实际copy的字节数。如果recv在copy时出错,那么它返回SOCKET_ERROR;如果recv函数在等待协议接收时中断了,那么它返回0。
注意:在Unix系统下,如果recv函数在等待协议接收时断开了,那么调用recv的进程会接收到一个SIGPIPE信号,进程对该信号的默认处理是进程终止。
七、bind函数
int bind(
SOCKET s,
const struct sockaddr FAR *name,
int namelen
);
当创建了一个Socket以后,套接字结构中有一个默认的IP地址和默认的端口号。一个程序必须调用bind函数来给其绑定一个IP地址和一个特定的端口号。客户程序一般不必调用bind函数来为其Socket绑定IP地址和断口号。该函数的第一个参数指定待绑定的Socket描述符;第二个参数指定一个sockaddr结构,该结构是这样定义的:
struct sockaddr {
u_short sa_family;
char sa_data[14];
};
sa_family指定地址族,对于TCP/IP协议族的套接字,给其置AF_INET。当对TCP/IP协议族的套接字进行绑定时,我们通常使用另一个地址结构:
struct sockaddr_in {
short sin_family;
u_short sin_port;
struct in_addr sin_addr;
char sin_zero[8];
};
其
中sin_family置AF_INET;sin_port指明端口号;sin_addr结构体中只有一个唯一的字段s_addr,表示IP地址,该字段
是一个整数,一般用函数inet_addr()把字符串形式的IP地址转换成unsigned long型的整数值后再置给s_addr。有的器是多宿主机,至少有两个网卡,那么运行在这样的器上的程序在为其Socket绑定IP地址时可以把htonl(INADDR_ANY)置给s_addr,这样做的好处是不论哪个网段上的客户程序都能与该程序通信;如果只给运行在多宿主机上的程序的Socket绑定一个固定的IP地址,那么就只有与该IP地址处于同一个网段上的客户程序才能与该程序通信。我们用0来填充sin_zero数组,目的是让sockaddr_in结构的大小与sockaddr结构的大小一致。下面是一个bind函数调用的例子:
struct sockaddr_in saddr;
saddr.sin_family = AF_INET;
saddr.sin_port = htons(8888);
saddr.sin_addr.s_addr = htonl(INADDR_ANY);
bind(ListenSocket,(struct sockaddr *)&saddr,sizeof(saddr));
八、listen函数
int listen( SOCKET s, int backlog );
程序可以
调用listen函数使其流套接字s处于监听状态。处于监听状态的流套接字s将维护一个客户连接请求队列,该队列最多容纳backlog个客户连接请求。假如该函数执行成功,则返回0;如果执行失败,则返回SOCKET_ERROR。
九、accept函数
SOCKET accept(
SOCKET s,
struct sockaddr FAR *addr,
int FAR *addrlen
);
程序
调用accept函数从处于监听状态的流套接字s的客户连接请求队列中取出排在最前的一个客户请求,并且创建一个新的套接字来与客户套接字创建连接通道,如果连接成功,就返回新创建的套接字的描述符,以后与客户套接字交换的
是新创建的套接字;如果失败就返回INVALID_SOCKET。该函数的第一个参数指定处于监听状态的流套接字;操作系统利用第二个参数来返回新创建的
套接字的地址结构;操作系统利用第三个参数来返回新创建的套接字的地址结构的长度。下面是一个调用accept的例子:
struct sockaddr_in ServerSocketAddr;
int addrlen;
addrlen=sizeof(ServerSocketAddr);
ServerSocket=accept(ListenSocket,(struct sockaddr *)&ServerSocketAddr,&addrlen);
十、connect函数
int connect(
SOCKET s,
const struct sockaddr FAR *name,
int namelen
);
客户程序调用connect函数来使客户Socket s与监听于name所指定的计算机的特定端口上的Socket进行连接。如果连接成功,connect返回0;如果失败则返回SOCKET_ERROR。下面是一个例子:
struct sockaddr_in daddr;
memset((void *)&daddr,0,sizeof(daddr));
daddr.sin_family=AF_INET;
daddr.sin_port=htons(8888);
daddr.sin_addr.s_addr=inet_addr("133.197.22.4");
connect(ClientSocket,(struct sockaddr *)&daddr,sizeof(daddr));
sockets 的两种模式
1. 阻塞模式
在阻塞模式下,在I/O操作完成之前,执行的操作函数将会一直等待而不会立即返回,该函数所在的线程会阻塞在这里。
优点:简单,容易实现。
缺点:当同时处理大量套接字时,将无从下手,扩展性差。
2. 非阻塞模式
在非阻塞模式下,当socket执行操作时,不管调用的函数操作是否完成都会立即返回,函数所在的线程不会阻塞。
优点:能同时处理大量连接,在收发量不均、时间不定的情况下优势明显。
缺点:1. 需要不停地检查返回代码,浪费系统资源。
2. 需要编写更多的代码,使用较复杂。
Windows sockets I/O 模型
1. Select 模型
使用该模型使得Windows sockets 应用程序可以在同一时间内管理和控制多个套接字。该模型的核心是Select函数。在使用该函数时,还需要用到FD_SET、FD_ZERO、FD_ISSET和FD_CLR四个宏。
利用Select函数,Windows sockets 应用程序可以判断套接字上是否存在数据,或者能否向该套接字写入数据。
缺点:完成一次I/O操作需要经历两次Windows sockets 函数的调用,效率低下。
2. WSAAsyncSelect 模型
WSAAsyncSelect模型是Windows sockets 的一个异步I/O模型。利用该模型应用程序可以在一个套接字上,接收以Windows 消息为基础的网络事件。
Windows sockets 应用程序在创建套接字后,调用WSAAsyncSelect函数注册感兴趣的网络事件。当该事件发生时,Windows 窗口收到消息,然后应用程序就可以对接收到的网络事件进行处理。
特点:1. 异步模型
2. 基于Windows环境,必须创建窗口
3. 自动将套接字设置为非阻塞模式
3. WSAEventSelect 模型
WSAEventSelect 模型是Windows sockets 提供的另外一个异步I/O模型。该模型允许在一个或多个套接字上接收以事件为基础的网络事件通知。
Windows sockets 应用程序在创建套接字后,调用WSAEventSelect函数,将一个事件对象与网络事件集合关联起来。当网络事件发生时,应用程序以事件的形式接收网络事件通知。
WSAEventSelect模型与WSAAsyncSelect模型很相似,主要的区别是:网络事件发生时系统通知应用程序的形式不同。
WSAAsyncSelect模型以消息的形式通知应用程序,而WSAEventSelect模型则以事件的形式通知。
WSAEventSelect模型的核心是WSAEventSelect()函数。应用WSAEventSelect模型开发Windows
sockets
应用程序时,还需要用到WSACreateEvent()、WSAResetEvent()、WSACloseEvent()、
WSAWaitForMultipleEvents()、WSAEnumNetworkEvents()等函数。
缺点:每个WSAEventSelect模型最多只能管理64个套接字,当应用程序需要管理多于64个套接字时,就需要创建额外线程。
4. 重叠I/O模型
重叠I/O模型是真正意义上的异步I/O模型。该模型以Win32重叠I/O机制为基础。
利用重叠I/O模型,应用程序能在一个重叠结构上一次投递一个或者多个I/O请求,当系统完成I/O操作之后通知应用程序。应用程序接收到通知后,对数据进行处理。
系统向应用程序发送通知的形式有两种:1. 事件通知 2. 完成例程。在发起Windows sockets 函数调用时,由应用程序设置接收I/O操作完成的通知形式。
重叠I/O模型可以使用Windows sockets 应用程序达到比较好的性能。
5. 完成端口模型
完成端口是Win32的一种核心对象。完成端口模型是一种真正意义上的异步模型,以Win32的重叠I/O机制为基础。
利用完成端口模型,套接字应用程序能够管理数百个甚至上千个套接字。应用程序创建一个Win32完成端口对象,通过指定一定数量的服务线程,为已经完成的重叠I/O操作提供服务。
完成端口的目标是实现高效的服务器程序,它克服了并发模型(服务器线程模型之一)的不足。其方法为:
1. 为完成端口指定并发线程的数量;
2. 在初始化套接字时创建一定数量的服务线程,即所谓的线程池。当客户端请求到来时,这些线程立即为之服务。
优点:1. 对服务器提供服务的客户端数量没有限制;
2. 具有很好的系统性能;
3. 具有很好的可扩展性。
阻塞模式开发
一、套接字的阻塞模式
Windows Sockets 套接字模式用于当一个套接字被调用时,决定调用函数的阻塞行为。套接字模式有阻塞和非阻塞两种工作模式。
在阻塞模式下,在I/O操作完成之前,执行的操作函数将一直等候而不会立即返回,该函数所在的线程会阻塞在这里。
例如当调用recv()函数时,系统首先检查是否有准备好的数据。如果数据没有准备好,系统就处于等待状态。当数据准备好后,将数据从系统缓冲区复制到用
户空间,然后该函数返回。因为在Sockets
应用程序中,当调用recv()函数时,用户空间未必就已经存在数据,此时recv()函数就会阻塞在那里。
二、可能阻塞套接字的API调用
当使用socket()函数和WSASocket()函数创建socket时,默认的socket都是阻塞的。
但是并不是所有的Windows Sockets API 以阻塞套接字为参数都会发生阻塞。例如,以阻塞套接字为参数调用bind()、listen()等函数时,会立即返回。
可能阻塞套接字的Windows Sockets API 调用分为以下4种:
1. 输入操作
recv()、recvfrom()、WSARecv()和WSARecvfrom()函数。
2. 输出操作
send()、sendto()、WSASend()和WSASendto()函数。
3. 接受连接
accept()和WSAAccept()函数。
4. 外出连接
connect()和WSAConnect()函数。
三、阻塞模式套接字的优势和不足
优势:简单、容易实现。
不足:在大量建立好的套接字线程之间进行通信比较困难,无法同时处理大量套接字。
非阻塞模式开发
一、套接字的非阻塞模式
套接字的非阻塞模式是指套接字在执行操作时,调用的函数不管操作是否完成都会立即返回的工作模式。根据其返回的错误代码,确定操作是否正确完成。
二、设置套接字的非阻塞模式
在使用socket()和WSASocket()函数创建套接字时,默认都是阻塞模式的。在创建套接字之后,可以通过调用ioctlsocket()函数,将套接字设置为非阻塞模式。
int ioctlsocket(SOCKET , long , u_long FAR *);
:套接字
:在套接字s上执行的命令。使用FIONBIO将套接字设为非阻塞模式
:指向一个参数的指针。当使用FIONBIO时设置为非零值。
例如: unsigned long ul = 1;
int retval = ioctlsocket( s, FIONBIO, (unsigned long *)&ul);
if( retval == SOCKET_ERROR)
{
//失败处理
}
三、优势和不足
优势:在控制建立的多个连接、收发量不均、时间不定等方面相比阻塞模式具有明显优势。
不足:1. 不停地检查返回代码,浪费系统资源;
2. 相比阻塞模式,需要编写更多的代码,使用较复杂。