分类:
2011-06-08 09:14:18
原文地址:Linux Socket编程终极者 作者:2909157
Socket接口是TCP/IP网络的API,Socket接口定义了许多函数或例程,程序员可以用它们来开发TCP/IP网络上的应用程序。要学Internet上的TCP/IP网络编程,必须理解Socket接口。
Socket接口设计者最先是将接口放在Unix操作系统里面的。如果了解Unix系统的输入和输出的话,就很容易了解Socket了。网络的 Socket数据传输是一种特殊的I/O,Socket也是一种文件描述符。Socket也具有一个类似于打开文件的函数调用Socket(),该函数返 回一个整型的Socket描述符,随后的连接建立、数据传输等操作都是通过该Socket实现的。常用的Socket类型有两种:流式Socket (SOCK_STREAM)和数据报式Socket(SOCK_DGRAM)。流式是一种面向连接的Socket,针对于面向连接的TCP服务应用;数据 报式Socket是一种无连接的Socket,对应于无连接的UDP服务应用。
1.Socket建立
为了建立Socket,程序可以调用Socket函数,该函数返回一个类似于文件描述符的句柄。socket函数原型为:
int socket(int domain, int type, int protocol);
domain指明所使用的协议族,通常为PF_INET,表示互联网协议族(TCP/IP协议族);type参数指定socket的类型: SOCK_STREAM 或SOCK_DGRAM,Socket接口还定义了原始Socket(SOCK_RAW),允许程序使用低层协议;protocol通常赋值"0"。 Socket()调用返回一个整型socket描述符,你可以在后面的调用使用它。
Socket描述符是一个指向内部数据结构的指针,它指向描述符表入口。调用Socket函数时,socket执行体将建立一个Socket,实际上"建立一个Socket"意味着为一个Socket数据结构分配存储空间。Socket执行体为你管理描述符表。
两个网络程序之间的一个网络连接包括五种信息:通信协议、本地协议地址、本地主机端口、远端主机地址和远端协议端口。Socket数据结构中包含这五种信息。
2.Socket配置
通过socket调用返回一个socket描述符后,在使用socket进行网络传输以前,必须配置该socket。面向连接的socket客户端通过调用Connect函数在socket数据结构中保存本地和远端信息。无连接socket的客户端和服务端以及面向连接socket的服务端通过调用 bind函数来配置本地信息。
Bind函数将socket与本机上的一个端口相关联,随后你就可以在该端口监听服务请求。Bind函数原型为:
int bind(int sockfd,struct sockaddr *my_addr, int addrlen);
Sockfd是调用socket函数返回的socket描述符,my_addr是一个指向包含有本机IP地址及端口号等信息的sockaddr类型的指针;addrlen常被设置为sizeof(struct sockaddr)。
struct sockaddr结构类型是用来保存socket信息的:
struct sockaddr {
unsigned short sa_family; /* 地址族, AF_xxx */
char sa_data[14]; /* 14 字节的协议地址 */
};
sa_family一般为AF_INET,代表Internet(TCP/IP)地址族;sa_data则包含该socket的IP地址和端口号。
另外还有一种结构类型:
struct sockaddr_in {
short int sin_family; /* 地址族 */
unsigned short int sin_port; /* 端口号 */
struct in_addr sin_addr; /* IP地址 */
unsigned char sin_zero[8]; /* 填充0 以保持与struct sockaddr同样大小 */
};
这个结构更方便使用。sin_zero用来将sockaddr_in结构填充到与struct sockaddr同样的长度,可以用bzero()或memset()函数将其置为零。指向sockaddr_in 的指针和指向sockaddr的指针可以相互转换,这意味着如果一个函数所需参数类型是sockaddr时,你可以在函数调用的时候将一个指向 sockaddr_in的指针转换为指向sockaddr的指针;或者相反。
使用bind函数时,可以用下面的赋值实现自动获得本机IP地址和随机获取一个没有被占用的端口号:
my_addr.sin_port = 0; /* 系统随机选择一个未被使用的端口号 */
my_addr.sin_addr.s_addr = INADDR_ANY; /* 填入本机IP地址 */
通过将my_addr.sin_port置为0,函数会自动为你选择一个未占用的端口来使用。同样,通过将my_addr.sin_addr.s_addr置为INADDR_ANY,系统会自动填入本机IP地址。
注意在使用bind函数是需要将sin_port和sin_addr转换成为网络字节优先顺序;而sin_addr则不需要转换。
计算机数据存储有两种字节优先顺序:高位字节优先和低位字节优先。Internet上数据以高位字节优先顺序在网络上传输,所以对于在内部是以低位字节优先方式存储数据的机器,在Internet上传输数据时就需要进行转换,否则就会出现数据不一致。
下面是几个字节顺序转换函数:
·htonl():把32位值从主机字节序转换成网络字节序
·htons():把16位值从主机字节序转换成网络字节序
·ntohl():把32位值从网络字节序转换成主机字节序
·ntohs():把16位值从网络字节序转换成主机字节序
Bind()函数在成功被调用时返回0;出现错误时返回"-1"并将errno置为相应的错误号。需要注意的是,在调用bind函数时一般不要将端口号置为小于1024的值,因为1到1024是保留端口号,你可以选择大于1024中的任何一个没有被占用的端口号。
3.连接建立
面向连接的客户程序使用Connect函数来配置socket并与远端服务器建立一个TCP连接,其函数原型为:
int connect(int sockfd, struct sockaddr *serv_addr,int addrlen);
Sockfd 是socket函数返回的socket描述符;serv_addr是包含远端主机IP地址和端口号的指针;addrlen是远端地质结构的长度。 Connect函数在出现错误时返回-1,并且设置errno为相应的错误码。进行客户端程序设计无须调用bind(),因为这种情况下只需知道目的机器 的IP地址,而客户通过哪个端口与服务器建立连接并不需要关心,socket执行体为你的程序自动选择一个未被占用的端口,并通知你的程序数据什么时候到 打断口。
Connect函数启动和远端主机的直接连接。只有面向连接的客户程序使用socket时才需要将此socket与远端主机相连。无连接协议从不建立直接连接。面向连接的服务器也从不启动一个连接,它只是被动的在协议端口监听客户的请求。
Listen函数使socket处于被动的监听模式,并为该socket建立一个输入数据队列,将到达的服务请求保存在此队列中,直到程序处理它们。
int listen(int sockfd, int backlog);
Sockfd 是Socket系统调用返回的socket 描述符;backlog指定在请求队列中允许的最大请求数,进入的连接请求将在队列中等待accept()它们(参考下文)。Backlog对队列中等待 服务的请求的数目进行了限制,大多数系统缺省值为20。如果一个服务请求到来时,输入队列已满,该socket将拒绝连接请求,客户将收到一个出错信息。
当出现错误时listen函数返回-1,并置相应的errno错误码。
accept()函数让服务器接收客户的连接请求。在建立好输入队列后,服务器就调用accept函数,然后睡眠并等待客户的连接请求。
int accept(int sockfd, void *addr, int *addrlen);
sockfd是被监听的socket描述符,addr通常是一个指向sockaddr_in变量的指针,该变量用来存放提出连接请求服务的主机的信息(某 台主机从某个端口发出该请求);addrten通常为一个指向值为sizeof(struct sockaddr_in)的整型指针变量。出现错误时accept函数返回-1并置相应的errno值。
首先,当accept函数监视的 socket收到连接请求时,socket执行体将建立一个新的socket,执行体将这个新socket和请求连接进程的地址联系起来,收到服务请求的 初始socket仍可以继续在以前的 socket上监听,同时可以在新的socket描述符上进行数据传输操作。
4.数据传输
Send()和recv()这两个函数用于面向连接的socket上进行数据传输。
Send()函数原型为:
int send(int sockfd, const void *msg, int len, int flags);
Sockfd是你想用来传输数据的socket描述符;msg是一个指向要发送数据的指针;Len是以字节为单位的数据的长度;flags一般情况下置为0(关于该参数的用法可参照man手册)。
Send()函数返回实际上发送出的字节数,可能会少于你希望发送的数据。在程序中应该将send()的返回值与欲发送的字节数进行比较。当send()返回值与len不匹配时,应该对这种情况进行处理。
char *msg = "Hello!";
int len, bytes_sent;
……
len = strlen(msg);
bytes_sent = send(sockfd, msg,len,0);
……
recv()函数原型为:
int recv(int sockfd,void *buf,int len,unsigned int flags);
Sockfd是接受数据的socket描述符;buf 是存放接收数据的缓冲区;len是缓冲的长度。Flags也被置为0。Recv()返回实际上接收的字节数,当出现错误时,返回-1并置相应的errno值。
Sendto()和recvfrom()用于在无连接的数据报socket方式下进行数据传输。由于本地socket并没有与远端机器建立连接,所以在无连接的数据报发送数据时应指明目的地址。
sendto()函数原型为:
int sendto(int sockfd, const void *msg,int len,unsigned int flags,const struct sockaddr *to, int tolen);
该函数比send()函数多了两个参数,to表示目地机的IP地址和端口号信息,而tolen常常被赋值为sizeof (struct sockaddr)。Sendto 函数也返回实际发送的数据字节长度或在出现发送错误时返回-1。
Recvfrom()函数原型为:
int recvfrom(int sockfd,void *buf,int len,unsigned int flags,struct sockaddr *from,int *fromlen);
from是一个struct sockaddr类型的变量,该变量保存源机的IP地址及端口号。fromlen常置为sizeof (struct sockaddr)。当recvfrom()返回时,fromlen包含实际存入from中的数据字节数。Recvfrom()函数返回接收到的字节数或 当出现错误时返回-1,并置相应的errno。
如果你对数据报socket调用了connect()函数时,你也可以利用send()和recv()进行数据传输,但该socket仍然是数据报socket,并且利用传输层的UDP服务。但在发送或接收数据报时,内核会自动为之加上目地和源地址信息。
5.结束传输
当所有的数据操作结束以后,你可以调用close()函数来释放该socket,从而停止在该socket上的任何数据操作:
close(sockfd);
你也可以调用shutdown()函数来关闭该socket。该函数允许你只停止在某个方向上的数据传输,而一个方向上的数据传输继续进行。如你可以关闭某socket的写操作而允许继续在该socket上接受数据,直至读入所有数据。
int shutdown(int sockfd,int how);
Sockfd是需要关闭的socket的描述符。参数 how允许为shutdown操作选择以下几种方式:
·0-------不允许继续接收数据
·1-------不允许继续发送数据
·2-------不允许继续发送和接收数据,
·均为允许则调用close ()
shutdown在操作成功时返回0,在出现错误时返回-1并置相应errno。
第四章 套接口的类型与协议
4.1指定套接口的域
在函数socketpair与socket的domain参数中有AF_UNIX,AF_LOCAL,AF_INET,PF_UNIX,PF_LOCAL,PF_INET.
这几个参数有AF_UNIX=AF_LOCAL, PF_UNIX=PF_LOCAL, AF_LOCAL=PF_LOCAL, AF_INET=PF_INET.
**建议:对于socketpair与socket的domain参数,使用PF_LOCAL系列,而在初始化套接口地址结构时,则使用AF_LOCAL.
例如:
z = socket(PF_LOCAL, SOCK_STREAM, 0);
adr_unix.sin_family = AF_LOCAL;
4.3选择套接口
在函数socketpair与socket中选择代表协议族的参数domain:
-PF_LOCAL:表明指定的协议族是本地UNIX协议族
-PF_INET:表明指定的是Internet协议族
在函数socketpair与socket中type的参数:
-SOCK_STREAM:常用
-SOCK_DGRAM:常用
-SOCK_SEQPACKET:X.25,AX.25使用
-SOCK_RW:表示编程者要一个原始(raw)套接口界面.可以对通信和分组进行更直接的控制,但它要编程式者对协议和底层分组结构非常熟悉.本书没有介绍.略.....
4.3.1 SOCK_STREAM套接口
套接口中的流与UNIX中管道的概念相近.
字节流中没有分界线,也没有边界;没有记录的长度工块的大小,在接收端也不存在分组的概念,在接收端获得的所有数据都返回到调用者的缓冲区中.
例如:
1)本地进程写入25字节数据,通过套接口发到远程进程
2)本地进程再写30字节数据,发出.
3)远程进程从套接口接收数据,共收到本地进程在1)和2)中发送的55字节.
另一重要性质:有序性
SOCK_STREAM 套接口
1)不保留消息边界:接收端无法知道发送端发送数据时共执行了几次write
2)保证接收数据字节与发送时顺序一致
3)保证写入的数据在接收端被无错接收
4.3.2 SOCK_DGRAM
当我们不需要数据传输的绝对有序性时和有需要数据传输的可靠性时,可以考虑使用SOCK_DGRAM.
特性:
1)分组发送后,可能无序的到达接收端。
2)分组可以可能发生丢失。
3)数据报分组有尺寸的大小限制,如果超出,可能会无法传送。
4)分组可以在不建立连接的情况下被发送到远程进程,这就允许本地进程每次将消息发送给不同IP地址上的同样的端口。
4.3.3 SOCK_SEQPACKET
本套接口对于X.25和AX.25协议非常重要,它与SOCK_STREAM的差别:SOCK_STERAM不保留消息边界,而SOCK_SEQPACKET保留.
特性:
1)保留消息边界
2)数据字节的接收顺序与发送顺序一致
3)保证发送数据字节被无错地传送到接收端
4)数据是通过一对连接的套接口进行传送的
============================================
注意:不是每个协议族都可以使用所有的套接口类型,如:PF_INET协议族支持SOCK_STREAM类型,但不支持SOCK_SEQPACKET类型,对于PF_X25协议族则相反,支持SOCK_SEQPACKET类型,但不支持SOCK_STREAM类型
============================================
4.4 选择协议
域(Domain) 套接口类型(socket type) 协议(Protocol) 描述(Description)
PF_LOCAL SOCK_STREAM 0 本地流套接口
PF_LOCAL SOCK_DGRAM 0 本地数据报套接口
PF_INET SOCK_STREAM 0或IPPROTO_TCP TCP/IP流套接口
PF_INET SOCK_DGRAM 0或IPPROTO_UDP UDP数据报套接口
4.6 linux支持的协议
socket()参数
域(Domain) 套接口类型(Socket Type) 描述
PF_LOCAL SOCK_STREAM 本地主机上提供面向流的套接口.该服务是一各面向连接的可靠有序的服务.注意:PF_UNIX=PF_LOCAL
PF_LOCAL SOCK_DGRAM 在本地主机上提供数据服务.该服务是一种可靠的非连接的服务,但在内核缓冲耗尽时也可能会发生分组丢失
PF_INET SOCK_STREAM 为面向Internet连接套接口提供流I/O服务.这种组合表明所使用的是TCP/IP协议,因此是可靠,有序的
PF_INET SOCK_DGRAM 为面向Internet连接套接口提供数据报I/O服务,这中组合表明所使用的是UDP协议,因此是不可靠的
PF_INET6 SOCK_STREAM 为面向IPv6连接套接口提供流I/O服务,.这种组合表明所使用的是TCP/IP协议,因此是可靠,有序的
PF_INET6 SOCK_SEQPACKET 为面向IPv6连接套接口提供流I/O服务,.这种组合表明所使用的是TCP/IP协议,因此是可靠,有序的,且保留了消息的边界
PF_INET6 SOCK_DGRAM 为面向IPv6连接套接口提供数据报I/O服务,这中组合表明所使用的是UDP协议,因此是不可靠的
PF_X25 SOCK_DGRAM (????) 为X.25协议提供流I/O服务,该服务是一种面向连接的服务,是可靠的,有序的,且保留了消息边界
PF_AX25 SOCK_STREAM 为AX.25协议提供流I/O服务,该服务是一种面向连接的服务,是可靠的,有序的,且保留了消息边界
PF_AX25 SOCK_DGRAM 为面向AX.25连接套接口提供数据报I/O服务,是不可靠的
PF_APPLETALK SOCK_DGRAM (????) 为AppleTalk的套接口提供流I/O服务,该服务是一种面向连接的服务,是可靠的,有序的
PF_APPLETALK SOCK_STREAM 是一个扩展
PF_ECONET SOCK_DGRAM Acorn Econet和AUN协议的实现
PF_IPX SOCK_STREAM IPX协议,流套接口
PF_IPX SOCK_DGRAM IPX协议,数据报套接口
PF_IPX SOCK_SEQPACKET IPX协议,有序分组套接口
PF_IRDA SOCK_STREAM 支持IrDA子系统,使用流套接口(红外线通信)
PF_IRDA SOCK_SEQPACKET 支持IrDA子系统,使用保留消息边界的流套接口(红外线通信)
PF_NETROM SOCK_SEQPACKET 业余无线电NetROM协议
PF_ROSE SOCK_SEQPACKET 业余无线电X.25PLP协议