Chinaunix首页 | 论坛 | 博客
  • 博客访问: 677203
  • 博文数量: 516
  • 博客积分: 4119
  • 博客等级: 上校
  • 技术积分: 4288
  • 用 户 组: 普通用户
  • 注册时间: 2012-10-30 17:29
文章分类

全部博文(516)

文章存档

2014年(4)

2013年(160)

2012年(352)

分类:

2012-11-01 11:13:21

原文地址:Linux下Socket编程 作者:graylocus

前言
    socket的英文原义是“孔”或“插座”。作为4BDS UNIX的进程通信机制,取后一种意思。通常也称作"套接字",用于描述IP地址和端口,是一个通信链的句柄。在Internet上的主机一般运行了多个服务软件,同时提供几种服务。每种服务都打开一个Socket,并绑定到一个端口上,不同的端口对应于不同的服务。Socket正如其英文原意那样,象一个多孔插座。一台主机犹如布满各种插座的房间,每个插座有一个编号,有的插座提供220伏交流电, 有的提供110伏交流电,有的则提供有线电视节目。 客户软件将插头插到不同编号的插座,就可以得到不同的服务。

一 、socket介绍
  socket接口是TCP/IP网络的API,socket接口定义了许多函数或例程,程序员可以用它们来开发TCP/IP网络上的应用程序。要学Internet上的TCP/IP网络编程,必须理解socket接口。
  socket接口设计者最先是将接口放在Unix操作系统里面的。如果了解Unix系统的输入和输出的话,就很容易了解socket了。网络的socket数据传输是一种特殊的I/O,socket也是一种文件描述符。socket也具有一个类似于打开文件的函数调用socket(),该函数返回一个整型的socket描述符,随后的连接建立、数据传输等操作都是通过该socket实现的。常用的socket类型有两种:流式socket (SOCK_STREAM)和数据报式socket(SOCK_DGRAM)。流式是一种面向连接的socket,针对于面向连接的TCP服务应用;数据报式socket是一种无连接的socket,对应于无连接的UDP服务应用。

二、Socket创建
  socket函数原型为:
  #include
    #include
  int socket(int domain, int type, int protocol);
  功能:调用成功,返回socket文件描述符;失败,返回-1,并设置errno
  参数说明:
  domain指明所使用的协议族,通常为PF_INET,表示互联网协议族(TCP/IP协议 族;
  type参数指定socket的类型:
  SOCK_STREAM 提供有序、可靠、双向及基于连接的字节流
  SOCK_DGRAM 支持数据报
  SOCK_SEQPACKET 提供有序、可靠、双向及基于连接的数据报通信
  SOCK_RAW 提供对原始网络协议的访问
  SOCK_RDM 提供可靠的数据报层,但是不保证有序性
  protocol通常赋值"0".
  socket描述符是一个指向内部数据结构的指针,它指向描述符表入口。调用socket函数时,socket执行体将建立一个socket,实际上"建立一个socket"意味着为一个socket数据结构分配存储空间。socket执行体为你管理描述符表。
  两个网络程序之间的一个网络连接包括五种信息:通信协议、本地协议地址、本地主机端口、远端主机地址和远端协议端口。socket数据结构中包含这五种信息。

三、Socket邦定
  Bind函数原型为:
    #include
    #include
  int bind(int sock_fd,struct sockaddr *my_addr, int addrlen);
  功能说明:将套接字和指定的端口相连。成功返回0,否则,返回-1,并置errno.
  参数说明:sock_fd是调用socket函数返回的socket描述符,
  my_addr是一个指向包含有本机IP地址及端口号等信息的sockaddr类 型的指针;
  addrlen常被设置为sizeof(struct sockaddr)。
  struct sockaddr结构类型是用来保存socket信息的:
  struct sockaddr {
  unsigned short sa_family; /* 地址族, AF_xxx */
  char sa_data[14]; /* 14 字节的协议地址 */
  };
  sa_family一般为AF_INET,代表Internet(TCP/IP)地址族;
  sa_data则包含该socket的IP地址和端口号。
  另外还有一种结构类型:
  struct sockaddr_in {
  short int sin_family; /* 地址族 */
  unsigned short int sin_port; /* 端口号 */
  struct in_addr sin_addr; /* IP地址 */
  unsigned char sin_zero[8]; /* 填充0 以保持与struct sockaddr同样大小 */
  };
  这个结构更方便使用。sin_zero用来将sockaddr_in结构填充到与struct sockaddr同样的长度,可以用bzero()或memset()函数将其置为零。指向sockaddr_in 的指针和指向sockaddr的指针可以相互转换,这意味着如果一个函数所需参数类型是sockaddr时,你可以在函数调用的时候将一个指向 sockaddr_in的指针转换为指向sockaddr的指针;或者相反。

  使用bind函数时,可以用下面的赋值实现自动获得本机IP地址和随机获取一个没有被占用的端口号:

  my_addr.sin_port = 0; /* 系统随机选择一个未被使用的端口号 */
  my_addr.sin_addr.s_addr = INADDR_ANY; /* 填入本机IP地址 */
  通过将my_addr.sin_port置为0,函数会自动为你选择一个未占用的端口来使用。同样,通过将my_addr.sin_addr.s_addr置为INADDR_ANY,系统会自动填入本机IP地址

  注意在使用bind函数时需要将sin_port和sin_addr转换成为网络字节优先顺序

  计算机数据存储有两种字节优先顺序:高位字节优先和低位字节优先(大端和小端)。Internet上数据以高位字节优先顺序在网络上传输,所以对于在内部是以低位字节优先方式存储数据的机器,在Internet上传输数据时就需要进行转换,否则就会出现数据不一致。

  下面是几个字节顺序转换函数:
  ·htonl():把32位值从主机字节序转换成网络字节序
  ·htons():把16位值从主机字节序转换成网络字节序
  ·ntohl():把32位值从网络字节序转换成主机字节序
  ·ntohs():把16位值从网络字节序转换成主机字节序

  bind()函数在成功被调用时返回0;出现错误时返回"-1"并将errno置为相应的错误号。
  需要注意的是,在调用bind函数时一般不要将端口号置为小于1024的值,因为1到1024是保留端口号,你可以选择大于1024中的任何一个没有被占用的端口号

四、连接
  面向连接的客户程序使用connect函数来配置socket并与远端服务器建立一个TCP连接,其函数原型为:
  #include
    #include
  int connect(int sock_fd, struct sockaddr *serv_addr,int addrlen);
  功能说明:客户端发送服务请求。成功返回0,否则返回-1,并置errno。
  参数说明:sock_fd 是socket函数返回的socket描述符;serv_addr是包含远端主机IP地址和端口号的指针;addrlen是远端地址结构的长度。

  进行客户端程序设计无须调用bind(),因为这种情况下只需知道目的机器的IP地址,而客户通过哪个端口与服务器建立连接并不需要关心,socket执行体为你的程序自动选择一个未被占用的端口,并通知你的程序数据什么时候到端口。
  connect函数启动和远端主机的直接连接。只有面向连接的客户程序使用socket时才需要将此socket与远端主机相连。无连接协议从不建立直接连接面向连接的服务器也从不启动一个连接,它只是被动的在协议端口监听客户的请求。

  
五、监听
  listen函数使socket处于被动的监听模式,并为该socket建立一个输入数据队列(就是一个等待队列),将到达的服务请求保存在此队列中,直到程序处理它们。

    #include
    #include
  int listen(int sock_fd, int backlog);
  功能说明:等待指定的端口的出现客户端连接。调用成功返回0,否则,返回-1,并置errno。
  参数说明:sock_fd 是socket系统调用返回的socket 描述符;
  backlog指定在请求队列中允许的最大请求数,进入的连接请求将在队列中等待accept()它们(参考下文)。
  Backlog对队列中等待服务的请求的数目进行了限制,大多数系统缺省值为20。如果一个服务请求到来时,输入队列已满,该socket将拒绝连接请求,客户将收到一个出错信息。

六、接受
  accept()函数让服务器接收客户的连接请求。在建立好输入队列后,服务器就调用accept函数,然后睡眠并等待客户的连接请求。所以,accept函数处理的是来自输入队列中的连接请求。

    #include
    #include
  int accept(int sock_fd, void *addr, int *addrlen);
  功能说明:用于接受客户端的服务请求,成功返回新的套接字描述符,失败返回-1,并置errno。
  参数说明:sock_fd是被监听的socket描述符,addr通常是一个指向sockaddr_in变量的指针,该变量用来存放提出连接请求服务的主机的信息(某台主机从某个端口发出该请求);addrten通常为一个指向值为sizeof(struct sockaddr_in)的整型指针变量。出现错误时accept函数返回-1并置相应的errno值。

  首先,当accept函数监视的 socket收到连接请求时,socket执行体将建立一个新的socket,执行体将这个新socket和请求连接进程的地址联系起来,收到服务请求的初始socket仍可以继续在以前的 socket上监听,同时可以在新的socket描述符上进行数据传输操作。

七、数据传输
  send()和recv()这两个函数用于面向连接的socket上进行数据传输

  send()函数原型为:
    #include
    #include
  size_t send(int sock_fd, const void *msg, int len, int flags);
  功能说明:发送数据。成功返回实际反送的数据的字节数。失败返回-1,并置errno.
  参数说明: sock_fd是你想用来传输数据的socket描述符;msg是一个指向要发送数据的指针;len是以字节为单位的数据的长度;flags一般情况下置为0(关于该参数的用法可参照man手册)。
  send()函数返回实际上发送出的字节数,可能会少于你希望发送的数据。在程序中应该将send()的返回值与欲发送的字节数进行比较。当send()返回值与len不匹配时,应该对这种情况进行处理
  char *msg = "Hello!";
  int len, bytes_sent;
  ……
  len = strlen(msg);
  bytes_sent = send(sockfd, msg,len,0);
  ……

  recv()函数原型为:
  include
  include
  int recv(int sock_fd,void *buf,int len,unsigned int flags);
  功能说明:接受数据,成功返回0,否则,返回-1,并设置errno。
  参数说明:sock_fd是接受数据的socket描述符;buf 是存放接收数据的缓冲区;len是缓冲的长度。flags也被置为0。recv()返回实际上接收的字节数.

  sendto()和recvfrom()用于在无连接的数据报socket方式下进行数据传输。由于本地socket并没有与远端机器建立连接,所以在发送数据时应指明目的地址。

  sendto()函数原型为:
  int sendto(int sockfd, const void *msg,int len,unsigned int flags,const struct sockaddr *to, int tolen);
  该函数比send()函数多了两个参数,to表示目地机的IP地址和端口号信息,而tolen常常被赋值为sizeof (struct sockaddr)。sendto 函数也返回实际发送的数据字节长度或在出现发送错误时返回-1。

  recvfrom()函数原型为:
  int recvfrom(int sockfd,void *buf,int len,unsigned int flags,struct sockaddr *from,int *fromlen);
  from是一个struct sockaddr类型的变量,该变量保存源机的IP地址及端口号。fromlen常置为sizeof (struct sockaddr)。当recvfrom()返回时,fromlen包含实际存入from中的数据字节数。Recvfrom()函数返回接收到的字节数或当出现错误时返回-1,并置相应的errno。

  如果你对数据报socket调用了connect()函数时,你也可以利用send()和recv()进行数据传输,但该socket仍然是数据报socket,并且利用传输层的UDP服务。但在发送或接收数据报时,内核会自动为之加上目的地址和源地址信息

八、结束传输
  当所有的数据操作结束以后,你可以调用close()函数来释放该socket,从而停止在该socket上的任何数据操作:
  int close(sock_fd);
  你也可以调用shutdown()函数来关闭该socket。
    该函数允许你只停止在某个方向上的数据传输,而一个方向上的数据传输继续进行。如你可以关闭某socket的写操作而允许继续在该socket上接受数据,直至读入所有数据

  int shutdown(int sock_fd,int how);
  sockfd是需要关闭的socket的描述符。参数 how允许为shutdown操作选择以下几种方式:
  ·0-------不允许继续接收数据
  ·1-------不允许继续发送数据
  ·2-------不允许继续发送和接收数据
  ·均为允许则调用close()
  shutdown在操作成功时返回0,在出现错误时返回-1并置相应errno。

  socket编程实例
  代码实例中的服务器通过socket连接向客户端发送字符串"Hello, you are connected!"。只要在服务器上运行该服务器软件,在客户端运行客户软件,客户端就会收到该字符串。
  该服务器软件代码如下:
  #include
  #include
  #include
  #include
  #include
  #include
  #include
  #include
  #define SERVPORT 3333 /*服务器监听端口号 */
  #define BACKLOG 10 /* 最大同时连接请求数 */
  int main()
  {
      int sock_fd,client_fd; /*sock_fd:监听socket;client_fd:数据传输socket */
      struct sockaddr_in my_addr; /* 本机地址信息 */
      struct sockaddr_in remote_addr; /* 客户端地址信息 */
      if ((sock_fd = socket(AF_INET, SOCK_STREAM, 0)) == -1) 
        {
          perror("socket创建出错!");
       exit(1);
      }

      my_addr.sin_family=AF_INET;
      my_addr.sin_port=htons(SERVPORT);
      my_addr.sin_addr.s_addr = INADDR_ANY;
      bzero(&(my_addr.sin_zero),8);

      if (bind(sock_fd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr)) == -1)  {
       perror("bind出错!");
       exit(1);
   }

      if (listen(sock_fd, BACKLOG) == -1) 
{
       perror("listen出错!");
          exit(1);
      }

      while(1) {
       sin_size = sizeof(struct sockaddr_in);
       if ((client_fd = accept(sock_fd, (struct sockaddr *)&remote_addr, &sin_size)) == -1) {
   perror("accept出错");
   continue;
       }

       printf("received a connection from %s\n", inet_ntoa(remote_addr.sin_addr));

       if (!fork()) //fork()返回0,子进程执行下面的代码
    { /* 子进程代码段 */
       if (send(client_fd, "Hello, you are connected!\n", 26, 0) == -1)
   perror("send出错!");
   close(client_fd);
   exit(0);
       }

       close(client_fd); //子进程关闭client_fd,这只是父进程处理客户连接的套接字的一个拷贝
   }//while(1)
  
  return 0;
  }

  服务器的工作流程是这样的:
  1.调用socket函数创建一个socket;
  2.然后调用bind函数将其与本机地址以及一个本地端口号绑定;
  3.然后调用 listen在相应的socket上监听,当accpet接收到一个连接服务请时,将生成一个新的socket。服务器显示该客户机的IP地址,并通过新的socket向客户端发送字符串"Hello,you are connected!"。最后关闭该socket。


  客户端程序代码如下:
  #include
  #include
  #include
  #include
  #include
  #include
  #include
  #include
  #define SERVPORT 3333
  #define MAXDATASIZE 100 /*每次最大数据传输量 */
  int main(int argc, char *argv[])
  {
      int sock_fd, recvbytes;
      char buf[MAXDATASIZE];
      struct hostent *host;
      struct sockaddr_in serv_addr;
      
if (argc==1)
        {
    printf("argument error!\n");
    exit(1);
    }

      if((host=gethostbyname(argv[1]))==NULL) {
       herror("gethostbyname出错!");
       exit(1);
      }

      if ((sock_fd = socket(AF_INET, SOCK_STREAM, 0)) == -1)
{
       perror("socket创建出错!");
          exit(1);
   }

      serv_addr.sin_family=AF_INET;
      serv_addr.sin_port=htons(SERVPORT);
      serv_addr.sin_addr = *((struct in_addr *)host->h_addr);
   bzero(&(serv_addr.sin_zero),8);

   if (connect(sock_fd, (struct sockaddr *)&serv_addr, \
  sizeof(struct sockaddr)) == -1) 
{
       perror("connect出错!");
          exit(1);
   }

   if ((recvbytes=recv(sock_fd, buf, MAXDATASIZE, 0)) ==-1) 
{
       perror("recv出错!");
       exit(1);
      }

      buf[recvbytes] = '\0';
      printf("Received: %s",buf);
      close(sock_fd);
  }
  客户端程序首先通过服务器域名获得服务器的IP地址,然后创建一个socket,调用connect函数与服务器建立连接,连接成功之后接收从服务器发送过来的数据,最后关闭socket。

  struct hostent *gethostbyname(const char *name);
  功能:完成域名转换,将域名转化为IP地址;
  参数说明:name为需要转换的域名
  返回值:调用成功时,hosten结构类型指针;失败时,返回-1,可用herror()函数输出错误原因。
  hosten结构为:
  struct hostent 
    {
      char *h_name; /* 主机的官方域名 */
      char **h_aliases; /* 一个以NULL结尾的主机别名数组 */
      int h_addrtype; /* 返回的地址类型,在Internet环境下为AF-INET */
      int h_length; /* 地址的字节长度 */
      char **h_addr_list; /* 一个以0结尾的数组,包含该主机的所有地址*/
  };
  #define h_addr h_addr_list[0] /*在h-addr-list中的第一个地址*/

  无连接的客户/服务器程序的在原理上和连接的客户/服务器是一样的,两者的区别在于无连接的客户/服务器中的客户一般不需要建立连接,而且在发送接收数据时,需要指定远端机的地址

  阻塞和非阻塞
  阻塞函数在完成其指定的任务以前不允许程序调用另一个函数。例如,程序执行一个读数据的函数调用时,在此函数完成读操作以前将不会执行下一程序语句。当服务器运行到accept语句时,而没有客户连接服务请求到来,服务器就会停止在accept语句上等待连接服务请求的到来。这种情况称为阻塞(blocking)。而非阻塞操作则可以立即完成。比如,如果你希望服务器仅仅注意检查是否有客户在等待连接,有就接受连接,否则就继续做其他事情,则可以通过将socket设置为非阻塞方式来实现。非阻塞socket在没有客户在等待时就使accept调用立即返回。

    #include
    #include
  ……
  sock_fd = socket(AF_INET,SOCK_STREAM,0);
  fcntl(sock_fd,F_SETFL,O_NONBLOCK);
  ……
  通过设置socket为非阻塞方式,可以实现"轮询"若干socket。当企图从一个没有数据等待处理的非阻塞socket读入数据时,函数将立即返回-1,并置errno值为EWOULDBLOCK.但是这种"轮询"会使CPU处于忙等待方式,从而降低性能,浪费系统资源。而调用 select()会有效地解决这个问题,它允许你把进程本身挂起来,而同时使系统内核监听所要求的一组文件描述符的任何活动,只要确认在任何被监控的文件描述符上出现活动,select()调用将返回指示该文件描述符已准备好的信息,从而实现了为进程选出随机的变化,而不必由进程本身对输入进行测试而浪费 CPU开销。Select函数原型为:

  int select(int numfds,fd_set *readfds,fd_set *writefds,
  fd_set *exceptfds,struct timeval *timeout);
  其中readfds、writefds、exceptfds分别是被select()监视的读、写和异常处理的文件描述符集合。如果你希望确定是否可以从标准输入和某个socket描述符读取数据,你只需要将标准输入的文件描述符0和相应的socket_fd加入到readfds集合中;numfds的值是需要检查的号码最高的文件描述符加1,这个例子中numfds的值应为sockfd+1;当select返回时,readfds将被修改,指示某个文件描述符已经准备被读取,你可以通过FD_ISSSET()来测试。为了实现fd_set中对应的文件描述符的设置、复位和测试,它提供了一组宏:
  FD_ZERO(fd_set *set)----清除一个文件描述符集;
  FD_SET(int fd,fd_set *set)----将一个文件描述符加入文件描述符集中;
  FD_CLR(int fd,fd_set *set)----将一个文件描述符从文件描述符集中清除;
  FD_ISSET(int fd,fd_set *set)----试判断是否文件描述符被置位。
  timeout参数是一个指向struct timeval类型的指针,它可以使select()在等待timeout长时间后没有文件描述符准备好即返回。struct timeval数据结构为:
  struct timeval {
  int tv_sec; /* seconds */
  int tv_usec; /* microseconds */
  };
阅读(496) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~