全部博文(95)
分类: C/C++
2008-07-07 19:37:21
十辨十析之析一 ―――关于IPC中的socket
socket 是IPC的一种,是解决不同计算机上进程相互通信的机制。总的来说,socket就是通信端点的逻辑代表。即然代表的是通信端点,所以就要有相关参数反映通信端点的性质。这个socket所代表的端点有什么特征呢?――这个端点在哪?通信方式是什么?怎么通信?等等,弄清楚这些问题,对socket的理解就很easy了。下边让我们先来看看:
(1)socket总述:首先什么是套接字?->套接字是通信端点的抽象,就是这个通信端点的逻辑代表。fd->文件,then, 套按字描述符->套接字->通信端点。套接字描述符在UNIX中是用文件描述符来实现的。许多处理文件描述符的函数都可以处理套按字描述符。要创建一个套接字,可以用socket函数:int socket(int domain, int type,
int protocol);若成功,则返回文件/套接字的描述符,出错返回-1。现在看看为什么这么调用?刚说了:套按字描述符->套接字->通信端点,既然套接字代表的是通信端点,那么自然会问,代表的是什么样的端点呢?即这个通信端点有什么特征?->端点在哪?通信有什么性质?
->端点在哪?->在哪个网即域?确定了通信的特征,包括地址格式。每个域有自己的格式表示地址,而表示各个域的常数都以AF_开头,意指地址族。通信域主要有:AF_INET,AF_INET6,AF_UNIX,AF_UNSPEC。哪个主机?哪个进程即端口上?这些都反映了端点的地址信息。
->通信的特征?->套接字的类型?进一步确定通信的的特征。即用什么方式通信,即SOCK_DGRAM(长度固定的,无连接的不可靠报文传递)、SOCK_RAW(IP协议的数据报接口)、SOCK_SEQPACKET(长度固定,有序,可靠的面向连接报文传递)、SOCK_STREAM(有序、可靠、双向的面向连接字节流)。->参数protocol通常是零(域和类型决定协议),表示按给定的域和套接字类型选择默认协议。当对同一域和套接字类型支持多个协议时,可以使用protocol参数选择一个特定协议。在AF_INET通信域中套接字类型SOCK_STREAM的默认协议是TCP。在AF_INET通信域中套接字类型SOCK_DGRAM的默认协议是UDP。有几点说明:(1)对于数据报SOCK_DGRAM接口,与对方通信时是不需要逻辑连接的。只需要送出一个报文,其地址是一个对方进程所使用的套接字。因此数据报提供了一个无连接的服务,另一方面,字节流SOCK_STREAM要求在交换数据之前,在本地套接字和与之通信的远程套按字之间建立一个逻辑连接。数据报是一咱自包含报文,相当于给某个人发信件,可以邮寄很多信,但不能保证投递的次序,并且可能有些信件丢失在路上。(2)使用面向连接的协议通信就像与对方打电话。首先,需要通过电话建立一个连接,连接建好了之后,彼此能向双向地通信。每个连接是端到端的通信信道。因为提前建立连接,所以会话中不包含地址信息,就像呼叫的两端存在一个点对点虚拟连接,并且连接本身暗含特定的源和目的地。(3)对于SOCK_STREAMS套接字,应用程序意识不到报文界限,因为套接字提供的是字节流服务。这意味着当从套接字读出数据时,它也许不会返回反有由发送进程所写的字节数。最终可以获得发送过来的所有数据,但也许要通过若干次函数调用得到。(4)SOCK_SEQPACKET套接字与上一个很像,但是,从该套接字得到的是基于报文的服务而不是字节流服务。这意味着从SOCK_SEQPACKET套接字接收的数据量与对方所发送的一致流控制传输协议SCTP提供了因特网域上的顺序数据包服务。(5)SOCK_RAW套按字提供一个数据报接口用于直接访问下面的网络层,使用这个接口时,应用程序负责构造自己的协议首部,这是因为传输协议TCP、UDP被绕过了。当创建一个原始套接字时需要有超级用户的特权,用以防止恶意程序绕过内建安全机制来创建报文。这么理解吧,在应用程序用调用这个函数,实际是要实现:应用层->传输层->IP层。在应用层就是要调用socket,但是要socket帮助实现传输层和IP层,这就是由内核帮助完成的,所以这个socket是系统调用。但是在应用层调用socket时,要传递相关信息告诉socket怎么完成些数据层层向下的格式转换,即在TCP层:协议(TCP/IP)、套接字类型(怎么传递这些数据,是数据报还是字节流,是连接的还是无连接的,等等)->在IP层:主要是寻址的问题,即自己和对方的通信端点在哪(在什么网中?->在哪个主机上?->在哪个进程中即端口中?)。调用socket与调用open一样,均可获得用于输入/输出的文件描述符,当不再需要该文件描述符时,调用close来关闭对文件或套接字的访问,并用释放该描述符以便重新使用。虽然套接字描述符本质上是一个文件描述符,但是不是所有的参数为文件描述符的函数都可以接受套接字描述符。套接字通信是双向的,可以采用shutdown来禁止套按字上的输入/输出。int shutdown(int sockfd,int how);如果how,是SHUT_RD,即关闭读端,那么无法从套接字读取数据,如果是SHUT_WR即关闭了写端,则无法使用套接字发送数据。使用SHUT_RDWR则将同时无法读取和发送数据。为什么使用shutdown呢,在close函数存在的情况下?首先,close只有在最后一个活动引用被关闭时才释放网络端点。这意味着如果复制一个套接字,套接字直到关闭了最后一个引用它的文件描述符之后才会被释放。而shutdown允许使一个套接字处于不活动状态,无论引用它的文件描述符数目是多少。其次,有时只关闭套接字双向传输中的一个方向会很方便。
(2)寻址问题:这是关于如何确定一个目标通信进程的问题,在什么网上?->在哪个机上?->在哪个端口上即服务或具体的进程?
由于在不同的计算机上进行通信,所以要考虑每个计算机个的数据存储的表示。先看字节序的问题:这是一个处理器架构特性,用于指示像整数这样的大数据类型的内部字节顺序(物理内存的字节序)。先看存储器:高址部分<-低址部分。大端:最大字节地址对应于数字最低有效字节上,也就是相当于从内存的最大字节序开始是数据的开始即最小位,大端简记为从大端开始是数据的开始(就是最低位)。对于数字1234,则按这种方式存放就是:4321的顺序。小端:最大的字节地址对应于数字最高有效字节上(从小端开始是数据的开始),对于数字1234,则按这种方式存放就是:1234,即最高数字1,放在最高地址部分上。换个方式,注意,不管字节如何排序,数字最高位总是在左边,最低位总是在右边。对于一个数,最高位与最低位是一定的。其实就是给你一个数字1234,这个数是定下来的,怎么为其分配存储字节?为1分配最大字节地址,就是小端(数字所在的地位与存储是一致的,最高位的数字,占据最高的字节位),其实就是大数在大字节上。如果为1分配最小的字节地址,就是大端,就是大数在最小的字节上。先定数->为数分配字节。一般UNIX用的是大端,而LINUX用的是小端。对于一个给定的内存,低->高字节序,对于大端,有顺序读,顺序存的特性,比如1234,则在读时,就可以将其按读的顺序1.2.3.4存入由低址->高址的内存中,最高的1,却放在最低的字节序上。而小端就相当于先顺序读一遍,1.2.3.4,并入栈,然后,按由低址->高址的顺序,将出栈的顺序4.3.2.1,存入由低址->高址的部分。所以1对就于高址字节序。网络协议指定了字节序,因此异构计算机能够换信息不会混淆字节序。TCI/IP协议栈采用的是大端字节序,即对于内存由低址->高址字节序,顺序读时并存入内存中。最高位放在了最低字节序上。内存:低->高 , 大端在内存中的表现为:1234,最高位1在低字节序上。 小端在内存中的表现:4321。最高位1在最高字节序上。对于TCP/IP,地址用网络字节序来表示,所以应用程序有时需要在处理器的字节序(当与网络字节序不同时)与网络字节序之间进行转换。进程1的处理器字节序<->网络字节序(根据其网络协议而定)<->进程2的处理器字节序。提供了四个函数以实施在处理器字节序与网络字节序之间的转换:uint32_t htonl(uint32_t hostint32)//处理器字节序转换为网络字节序。unit16_t htons(uint16_t hostint16); uint32_t ntohl(uint32_t
netint32); uint16_t ntohs(uint16_t netint16);注意这四个函数在使用时转换的方向,是什么向什么转换。->地址格式(地址标识了特定通信域中的套接字端点,即这个端点在哪?->在什么网/域中?->在哪个主机上?->在哪个进程中或服务端口?所以为了正确的标识一个套按字端点,这三个方面一个也不能少,这三个的整体组成了地址。为使不同的格式地址能够被传入到套接字函数,地址被强制转换成通用的地址结构sockaddr,即套接字中的地址,其表示为:
struct sockaddr
{ sa_family_t sa_family;//标识在哪个域上,或网中。
char sa_data[];
…}
套接字的实现可以自由的添加额外的成员,并定义sa_data成员的大小。)按域可分为sockaddr_in,sockaddr_in6,但是这两者在应用时,均被强制转换成sockaddr结构传入到套接字例程中。有时需要打印出能被人而不是计算机所理解的地址格式,需要要实现网络地址在二进制地址格式和点分十进制字符串表示之间的相互转换。inet_ntop()//将网络字节序的二进制地址转换成文本字符串格式。inet_pton将文本字符串格式转换成网络字节序的二进制地址。->地址查询:可以通过很多函数来访问各种网络配置信息。通过调用gethostent\sethostent\endhostent,找到与给定计算机的主机信息。当gethostent返回时,得到一个指向hostent结构的指针,该结构可能包含一个静态的数据缓冲区,每次调用gethostent将会覆盖这个缓冲区。返回的地址采用网络字节序。能够采用一套相似的接口来获得网络名字和网络号。getnetbyaddr()//通过地址获得网络的相关信息\getnetbyname()//通过名字来获得网络相关信息\getnetent()\setnetent()\endnetent()。网络号按照网络字节序返回。地址类型是一个地址族常量。可以将协议名字和协议号采用以下函数映射:getprotobyname()\getprotobynumber\getprotoent()\setprotoent()\endprotoent()。服务是由地址的端口号部分表示的,每个服务是由一个唯一的,熟知的端口号来提供。采用getservbyname可以将一 个服务名字映射到一个端口号,函数getservbyport将一个端口号映射到一个服务名,或者采用函数getservent顺序扫描服务数据库。getservbyname\getservbyport\getservent\setservent\endservent.允许将一个主机名和服务名字映射到一个地址,或者相反。getaddrinfo,如果getaddrinfo失败,不能使用perror或strerror来生成错误消息。替代地,调用gai_strerror将返回的错误码转换成错误消息。函数getnameinfo将地址转换成主机名或者服务名。总之:主机->网络->协议->服务->地址。->将套接字与地址绑定:与客户端的套接字关联的地址没有太大意义,可以让系统选一个默认的地址,然而,对于服务器,需要给一个接收客户端请求的套接字绑定一个众所周知的地址。客户端应有一种方法来发现用以连接服务器的地址,最简单的方法就是为服务器保留一个地址并且在/etc/services或某个名字服务中注册。可以用bind函数将地址绑定到一个套接字。int bind(int sockfd,const struct sockaddr *addr,socklen_t len);//相当于将套接字看成某个具体的端点的抽象代表。对于所能使用的地址有一些限制:(1)在进程所运行的机器上,指定的地址必须有效,不能指定一个其它机器的地址,即调用进程只能为本机上的进程服务与一个套接字绑定。(2)地址必须和创建套接字时的地址族所支持的格式相匹配(定义socket只是说明这个socket支持什么样性质的端点。)。(3)端口号必须不小于1024,除非该进程具有的特权。(4)一般只有套接字端点能够与地址绑定,尽管有些协议允许多重绑定。对于INTERNET,如果指定IP地址为INADDR_ANY,套接字端点可以绑定到所有的系统网络接口。这意味着可以接收到这个系统所安装的所有网卡的数据包。以后会看到,如果调用connect listen,但没有绑定地址到一个套接字,系统会选一个地址并将其绑定到套接字。socket()只是建立一个抽象的端点,并说明这个端点支持什么样性质的端点->bind(),与一个具体的地址绑定,即相当于将这个抽象的端点看成一个具体端点的代表。可以调用getsockname来发现绑定到一个套接字的地址。可以调用getpeername来找到对方的地址,如果套接字已经和对方连接的话。
(3)建立连接:如果处理的是面向连接的网络服务,在开始交换数据之前,需要在请求服务的进程套接字和提供服务的进程套接字之间建立一个连接。可以用connect建立一个连接。int connect(int sockfd, const
struct sockaddr *addr,socklen_t len);在connect中所指定的地址是想与之通信的服务器(对方的socket)。如果sockfd没有绑定到一个地址这(这个sockfd是调用进程所在主机的socket),connect会给调用者绑定一个默认地址。当连接一个服务器时,出于一些原因,连接可能失败,要连接的机器必须开启并且正在运行,服务器必须绑定到一个想与之连接的地址,并且在服务器的等待连接队形中应有足够的空间。函数connect不可以用于无连接的网络服务,实际上却是一个不错的选择。如果sock_dgram套接字上调用connect,所有发送报文的目标地址设为connect调用中所指定的地址,这样每次传送的报文时就不需要再提供地址。另外,仅能接收来自指定地址的报文。服务器调用listen来宣告可以接受的连接请求。 int listen(int dockfd,
int backlog);//sockfd是被监听的socket,而backlog是表示该进程所要入队的连接请求数量,其实际值由系统决定。一旦队列满,系统会拒绝多余连接请求,所以backlog的值应该基于服务器期望负载和接受连接请求与启动服务的处理能力来选择。一旦服务器调用了listen,套接字就能接收连接请求。使用accept获得连接请求并建立连接。int accept(int sockfd, struct
sockaddr *restrict addr, socklen_t *restrict len);//sockfd是服务器端的这个服务的端点,若成功,则返回的文件描述符是套接字描述符,该描述符连接到调用connect的客户端。这个新的套接字描述符和原始套接字sockfd具有相同的套接字类型和地址族。传给accept的原始套接字没有关联到这个连接上,而是继续保持可用状态并授其他连接请求。如果不关心客户端标识,可以将参数addr和len设为null。否则,在调用accept之前,应将参数addr设为足够大的缓冲区来存放地址,并用将len设为指向代表这个缓冲区大上的整数的指针。返回时,accept会在缓冲区填充客户端的地址并且更新指针len所指向 的整数为该地址的大小。如果没有连接请求,accept会阻塞直到一个请求的到来。如果sockfd处于非阻塞模式,accept会返回-1并将errno设置为EAGAIN或EWOURLBLOCK。也可以用poll select来等待一个请求的到来。
client: socket()->bind()->connect().
server: socket()->bind()->listen()->accept()
(4)数据传输: 既然将套接字端点表示为文件描述符,那么只要建立连接,就可以使用read和write来通过套接字通信。在套接字描述符上采用read和write是非常有意义的,因为可以传递套接字描述符到那些原先设计为处理本地文件的函数。而且可以安排传递套接字描述符到执行程序的子进程,该子进程并不了解套字。但是想指定选项、从多个客户端接收数据包或者发送带外数据,需要采用6个传递数据的套接字函数中的一个。三个函数用来发送数据:ssize_t send(int
sockfd, const void *buf, size_t nbytes, int flags);//可以指定标志来改变处理传输数据的方式,使用send时,套接字必须已经连接。如果send成功返回,并不必然表示连接另一端的进程接收数据,所保证的仅是当send成功返回时,数据已经无错误地发送到网络上。如果单个报文超过了协议所支持的最大尺寸,send失败,并将errno设为EMSGSIZE,对于字节流协议,send会阻塞直到整个数据被传输。ssize_t sendto(int sockfd,
const void *buf, size_t nbytes, int flags, const struct sockaddr *destaddr,
socklen_t destlen);对于面向连接的套接字,目标地址是忽略的,因为目标地址蕴涵在连接中,对于无连接的套接字,不能使用send,除非在调用connect时预先设定了目标地址,或者采用sendto来提供另外一种发送报文的方式。可以使用不止一个的选择来通过套接字发送数据,可以调用带有msahdr结构的sendmsg来指定多重缓冲区传输数据,这和writev很想像。ssize_t sendmsg(int sockfd, const struct msghdr *msg,
int flags);发送时有两种:(1)有connect()建立了连接,则后来可用send,sendmsg.(2)没有用connect()建立连接,则要指定目标地址,用sendto();对于写也有三个函数:recv 和read一样,但是允许指定选项来控制如何接收数据。ssize_t recv(int
sockfd,void *buf, size_t nbytes, int flags);iv 当指定MSG_PEEK标志时,可以查看上一个要读的数据但不会真正取走。当再次调用read 或recv函数时会返回刚才查看的数据。对于SOCK_STREAM套接字,接收的数据可以比请求的少。标志MSG_WAITALL阻止这种行为,除非所需数据全部收到,recv函数才会返回。对于SOCK_DGRAM和SOCK_SEQPACKET套接字,MSG_WAITALL标志没有改变什么行为,因为这些基于报文的套接字类型一次读取就返回整个报文。如果发送者已经调用shutdown来结束传输,或者网络协议支持默认的顺序关闭且发送端已经定位,那么当所有的数据接收完毕后,recv返回0。可以使用recvfrom来得到数据发送者的源地址。ssize_t recvfrom(int sockfd, void *restrict buf, size_t len,int flags, sruct sockaddr *restrict addr,
socklent_t *restrict addrlen);通常用于无连接的套接字,否则,其等同于recv,也可以使用recvmsg ssize_t recvmsg(int sockfd, struct
msghdr *msg, int flags);
(5)套接字选项:套接字机制提供了两个套接字选项接口来控制套接字行为,一个接口用来设置选项,另一个接口允许查询一个选项的状态。可以获取或设置三种选项:(1)通用选项,工作在所有套接字类型上。(2)在套接字层次管理的选项,但是依赖于下层协议的支持。(3)特定于某协议的选项,为每个协议所独有。int setsockopt(int
sockfd,int level, int option, const void *val, socklen_t len);参数level标识了选项应用的协议。可以使用getsockopt函数来发现选项的当前值。
(6)带外数据:out-of-band data,是一些通信协议所支持的可选特征,允许更高优先级的数据比普通数据优先传输。即使传输队列已经有数据,带外数据先行传输。TCP支持带外数据,但是UDP不支持。套接字接口对带外数据的支持,很大程度上受TCP带外数据具体实现的影响。TCP将带外数据称为“紧急”数据。TCP仅支持一个字节的紧急数据,但是允许紧急数据在普通数据传送机制数据流之外传输。为了产生紧急数据,在三个send函数中任何一个指定标志MSG_OOB,如果带MSG_OOB标志传输字节超过一个时,最后一个字节被看作紧急数据字节。如果安排发生套接字信号,当接收到紧急数据时,那么发送信号SIGURG。TCP支持紧急标记的概念:在普通数据流中紧急数据所在的位置。如果采用套接字选项SO_OOBINLINE,那么可以在普通数据中接收紧急数据。为帮助判断是否接收到紧急标记,可以使用函数sockatmark.int sockatmark(int sockfd);当下一个要读的字节在紧急标志所标识的位置时,sockatmark返回1。当带外数据出现在套接字读取队列时,select函数会返回一个文件描述符并且拥有一个异常状态挂起。可以在普通数据流上接受紧急数据,或者在某个recv函数中采用MSG_OOB标志在其他队列数据之前接收紧急数据。TCP队列仅有一字节的紧急数据,如果在接收当前的紧急数据字节之前又有新的紧急数据到来,那么当前的字节会被丢弃。
(7)非阻塞和异步I/O:通常recv函数没有数据可用时会阻塞等待,同样地,当套接字输出队列没有足够空间来发送消息时函数send会阻塞。在套接字的非阻塞模式下,行为会改变。在这些情况下,这些函数不会阻塞而是失败,设置errno为EWOULD或者EAGAIN。当这些发生时,可以使用poll或select来判断何时能接收或传输数据。在基于套接字的异步I/O中,当能够从套接字中读取数据,或者套接字写队列中的空间变得可用时,可以安排发送信号SIGIO。