Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1428407
  • 博文数量: 842
  • 博客积分: 12411
  • 博客等级: 上将
  • 技术积分: 5772
  • 用 户 组: 普通用户
  • 注册时间: 2011-06-14 14:43
文章分类

全部博文(842)

文章存档

2013年(157)

2012年(685)

分类: LINUX

2012-03-04 14:15:38

Socket编程

 

Linux中的网络编程通过Socket(套接字)接口实现,Socket是一种文件描述符。

 

 

Socket类型

 

套接字socket有三种类型:

1)流式套接字(SOCK_STREAM

流式的套接字可以提供可靠的、面向连接的通讯流。它使用了TCP协议。TCP

保证了数据传输的正确性和顺序性。

 

2)数据报套接字(SOCK_DGRAM

数据报套接字定义了一种无连接的服务,数据通过相互独立的报文进行传输,是无序的,并且不保证可靠,无差错,它使用数据报协议UDP

3)原始套接字原始套接字

允许对低层协议如IPICMP直接访问,主要用于新的网络协议的测试等。

 

 

地址结构

 

struct sockaddr

{

u_short sa_family;

char sa_data[14];

}

Sa_family:

地址族,采用"AF_xxx"的形式,如:AF_INET

Sa_data

14字节的特定协议地址。

 

struct sockaddr_in

{

short int sin_family;  /* Internet地址族 */

unsigned short int sin_port;  /* 端口号 */

struct in_addr sin_addr;   /* IP地址 */

unsigned char sin_zero[8];  /* 0 */

}

编程中一般并不直接针对sockaddr数据结构操作,而是使用与sockaddr等价的sockaddr_in数据结构

 

 

 

struct  in_addr

{

unsigned  long  s_addr;

}

S_addr: 32位的地址。

 

地址转换

IP地址通常由数字加点(192.168.0.1)的形式表示,而在struct in_addr中使用的是IP地址是由32位的整数表示的,为了转换我们可以使用下面两个函数:

 

int inet_aton(const char *cp,struct in_addr *inp)

char *inet_ntoa(struct in_addr in)

 

函数里面 a代表 ascii n代表network.第一个函数表示将a.b.c.d形式的IP转换为32位的IP,存储在 inp指针里面。第二个是将32IP转换为a.b.c.d的格式。

 

字节序转换

不同类型的 CPU对变量的字节存储顺序可能不同:有的系统是高位在前,低位在后,而有的系统是低位在前,高位在后,而网络传输的数据顺序是一定要统一的。所以当内部字节存储顺序和网络字节顺序不同时,就一定要进行转换。

 

 

 

网络字节顺序TCP/IP中规定好的一种数据表示格式,它与具体的CPU类型、操作系统等无关,从而可以保证数据在不同主机之间传输时能够被正确解释。网络字节顺序采用big endian排序方式。

 

为什么要进行字节序转换?

例: INTELCPU使用的小端字节序MOTOROLA 68k系列CPU使用的是大端字节序MOTOROLA发一个16位数据0X1234INTEL, 传到INTEL ,就被INTEL解释为0X3412 

 

 

字节序转换函数:

 htons

unsigned short类型从主机序转换到网络序

htonl

unsigned long类型从主机序转换到网络序

ntohs

unsigned short类型从网络序转换到主机序

ntohl

unsigned long类型从网络序转换到主机序

 

IP与主机名

在网络上标识一台机器可以用IP,也可以使用主机名。

struct hostent *gethostbyname(const char *hostname)

struct hostent

{

char *h_name; /* 主机的正式名称  */

char *h_aliases; /* 主机的别名 */

int   h_addrtype; /* 主机的地址类型  AF_INET*/

int   h_length; /* 主机的地址长度  */

char **h_addr_list; /* 主机的IP地址列表 */

 

}

#define h_addr h_addr_list[0]  /* 主机的第一个IP地址*/

 

IP地址通常由数字加点(192.168.0.1)的形式表示,而在struct in_addr中使用的是IP地址是由32位的整数表示的,为了转换我们可以使用下面两个函数:

 

int inet_aton(const char *cp,struct in_addr *inp)

char *inet_ntoa(struct in_addr in)

 

函数里面 a代表 ascii n代表network.第一个函数表示将a.b.c.d形式的IP转换为32位的IP,存储在 inp指针里面。第二个是将32IP转换为a.b.c.d的格式。

 

 

进行Socket编程的常用函数有:

socket

创建一个socket

bind

用于绑定IP地址和端口号到socket

connect

该函数用于绑定之后的client端,与服务器建立连接。

 

 

操作函数

listen

设置能处理的最大连接要求,Listen()并未开始接收连线,只是设置socketlisten模式。

accept

用来接受socket连接。

send

发送数据

recv

接收数据

 

基于TCP-服务器

 

1. 创建一个socket,用函数socket()

2. 绑定IP地址、端口等信息到socket上,用函数bind()

3. 设置允许的最大连接数,用函数listen()

4. 接收客户端上来的连接,用函数accept()

5. 收发数据,用函数send()recv(),或者read()write()

6. 关闭网络连接

 

基于TCP-客户端

 

1. 创建一个socket,用函数socket()

2. 设置要连接的对方的IP地址和端口等属性

3. 连接服务器,用函数connect()

4. 收发数据,用函数send()recv(),或者read()write()

5. 关闭网络连接

 

基于TCP网络编程模型

 

 

 

基于UDP-服务器

1. 创建一个socket,用函数socket()

2. 绑定IP地址、端口等信息到socket上,用函数bind()

3. 循环接收数据,用函数recvfrom()

4. 关闭网络连接

 

 

基于UDP-客户端

1. 创建一个socket,用函数socket()

2. 绑定IP地址、端口等信息到socket上,用函数bind()

3. 设置对方的IP地址和端口等属性

4. 发送数据,用函数sendto()

5. 关闭网络连接

 

基于UDP网络编程模型

 

 

服务器模型

在网络程序里面,一般来说都是许多客户对应一个服务器,为了处理客户的请求,对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有:

循环服务器:服务器在同一个时刻只可以响应一个客户端的请求

并发服务器:服务器在同一个时刻可以响应多个客户端的请求

 

 

UDP循环服务器

UDP循环服务器的实现方法:UDP服务器每次从套接字上读取一个客户端的请求->处理->然后将结果返回给客户机。

socket(...);

bind(...);

while(1)

{

recvfrom(...);

process(...);

sendto(...);

}

因为UDP是非面向连接的,没有一个客户端可以老是占住服务端,服务器对于每一个客户机的请求总是能够满足。

 

TCP循环服务器

TCP服务器接受一个客户端的连接,然后处理,完成了这个客户的所有请求后,断开连接。算法如下:

socket(...);

bind(...);

listen(...);

while(1)

{

accept(...);

process(...);

close(...);

}

 

TCP循环服务器一次只能处理一个客户端的请求。只有在这个客户的所有请求都满足后,服务器才可以继续后面的请求。这样如果有一个客户端占住服务器不放时,其它的客户机都不能工作了,因此,TCP服务器一般很少用循环服务器模型的。

 

 

TCP并发服务器

并发服务器的思想是每一个客户机的请求并不由服务器直接处理,而是由服务器创建一个子进程来处理。算法如下:

socket(...);

bind(...);

listen(...);

while(1) {

accept(...);

if(fork(..)==0) {

process(...);

close(...);

exit(...);

}

close(...);

}

 

TCP并发服务器可以解决TCP循环服务器客户机独占服务器的情况。但同

时也带来了问题:为了响应客户的请求,服务器要创建子进程来处理,而创

建子进程是一种非常消耗资源的操作。

 

多路复用I/O

阻塞函数在完成其指定的任务以前不允许程序继续向下执行。例如:当服务器运行到accept语句时,而没有客户请求连接,服务器就会停止在accept语句上等待连接请求的到来。这种情况称为阻塞(blocking),而非阻塞操作则可以立即完成。例如,如果你希望服务器仅仅检查是否有客户在等待连接,有就接受连接,否则就继续做其他事情,则可以通过使用select系统调用来实现。除此之外,select还可以同时监视多个套接字。

int select(int maxfd, fd_set *readfds, fd_set *writefds, fe_set *exceptfds, const struct timeval *timeout)

Maxfd: 文件描述符的范围,比待检的最大文件描述符大1

Readfds:被读监控的文件描述符集

Writefds:被写监控的文件描述符集

Exceptfds:被异常监控的文件描述符集

Timeout:定时器

 

Timeout取不同的值,该调用有不同的表现:

Timeout值为0,不管是否有文件满足要求,都立刻返回,无文件满足要求返回0,有文件满足要求返回一个正值。

TimeoutNULLselect将阻塞进程,直到某个文件

满足要求

Timeout值为正整数,就是等待的最长时间,即selecttimeout时间内阻塞进程。

 

Select调用返回时,返回值有如下情况:

1.正常情况下返回满足要求的文件描述符个数;

2.经过了timeout等待后仍无文件满足要求,返回值为0

3.如果select被某个信号中断,它将返回-1并设置errnoEINTR

4.如果出错,返回-1并设置相应的errno

 

 

多路复用I/O用法:

 

1. 设置要监控的文件

2. 调用Select开始监控

3. 判断文件是否发生变化

 

系统提供了4个宏对描述符集进行操作:

#include

void FD_SET(int fd, fd_set *fdset)

void FD_CLR(int fd, fd_set *fdset)

void FD_ZERO(fd_set *fdset)

void FD_ISSET(int fd, fd_set *fdset)

FD_SET将文件描述符fd添加到文件描述符集fdset中;

FD_CLR从文件描述符集fdset中清除文件描述符fd

FD_ZERO清空文件描述符集fdset

在调用select后使用FD_ISSET来检测文件描述符集fdset中的文件fd发生

了变化。

 

FD_ZERO(&fds); //清空集合

sock1 = socket(…);

sock2 = socket(…);

bind(sock1,…);

bind(sock2,…);

listen(sock1,…);

listen(sock1,…);

FD_SET(sock1,&fds); //设置描述符

FD_SET(sock2,&fds); //设置描述符

maxfdp=(sock1>sock2?sock1:sock2) + 1

switch(select(maxfdp,&fds,NULL,NULL,&timeout))

case -1: exit(-1);break; //select错误,退出程序

case 0:break;

default:

if(FD_ISSET(sock1,&fds)) //测试sock1是否可读

accpet(sock1,…)

阅读(920) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~