Linux高性能服务器编程　第五章（Linux网络编程基础API）-suiyuemanbu-ChinaUnix博客

suiyuemanbu的ChinaUnix博客

首页　| 　博文目录　| 　关于我

suiyuemanbu

博客访问： 264832
博文数量： 94
博客积分： 0
博客等级：民兵
技术积分： 80
用户组：普通用户
注册时间： 2014-10-16 09:08

文章分类

全部博文（94）

书籍（3）
shell（3）
代码集锦（9）
命令行/命令（13）
面试题（1）
经验之谈（16）
工具妙用（2）
电脑技巧（1）
精彩文章（8）
TCP网络（8）
C语言（2）
linux（10）
未分配的博文（18）

文章存档

2016年（3）

2015年（86）

2014年（5）

我的朋友

相关博文

Linux高性能服务器编程　第五章（Linux网络编程基础API）

分类：网络与安全

2015-03-04 22:29:38

原文地址：Linux高性能服务器编程　第五章（Linux网络编程基础API）作者：tianyashuibin

5 Linux网络编程基础API

１、socket地址API。
２、socket基础API。主要定义在sys/socket.h头文件中，包括创建socket、命名socket、监听socket、接收连接、发起连接、读写数据、获取地址信息、检测带外标记，以及读取和设置socket选项。
３、网络信息API。Linux提供了一套网络信息API,实现主机名和ip地址之间的转换，以及服务名称和端口号之间的转换。这些api都定义在netdb.h头文件中。

主机字节序和网络字节序
大端模式和小端模式。
问题：编程判断大小端模式？

４个函数来完成主机字节序和网络字节序之间的转换：
#include
unsigned long int htonl(unsigned long int hostlong);
unsigned short int htons(unsigned short int hostshort);
unsigned long int ntohl(unsigned long int netlong);
unsigned short int ntohs(unsigned short int netshort);
这４个函数，长整型函数通常用来转换ip地址，短整型函数用来转换端口号，当然不限于此。

通用socket地址：
#include
struct sockaddr{
sa_family_t sa_family;
char sa_data[14];
};

sa_family类型如下：
协议簇　　　地址簇
PF_UNIX AF_UNIX
PF_INET AF_INET
PF_INET6 AF_INET6
sa_data用于存放socket地址值：
协议簇　　　地址含义和长度
PF_UNIX 文件的路径名，长度可达108字节
PF_INET　　　16bit端口号和32bit ipv4地址，共6字节
PF_INET6　　...
14字节的sa_data根本无法完全容纳多数协议簇的地址值。因此Linux定义了下面这个新的通用的socket地址结构体：
#include
struct sockaddr_storage{
sa_family_t sa_family;
unsigned long int __ss_align;
char __ss_padding[128-sizeof(__sa_align)];
};
这个结构体不仅提供了足够大的空间用于存放地址值，而且是内存对齐的（这是__ss_align成员的作用）。

专用socket地址：
#include
struct sockaddr_un{
sa_famlily_t sin_family;//地址簇：AF_UNIX
char sun_path[108];//文件路径名
};

struct sockaddr_in{
sa_family_t sin_family;
u_int16_t sin_port;
struct in_addr sin_addr;
};
struct in_addr{
u_int32_t s_addr;
};

struct sockaddr_in6{
sa_family_t sin6_family;
u_int16_t sin6_port;
u_int32_t sin6_flowinfo;
struct in6_addr sin6_addr;
u_int32_t sin6_scope_id;
};
struct in6_addr{
unsigned char sa_addr[16];
};

所有专用的socket地址(以及sockaddr_storage)类型的变量在实际使用时都需要转化为通用的socket地址类型sockaddr(强制转换即可)，因为所有socket编程接口使用的地址参数的类型都是sockaddr。

ip地址转换函数：
#include
in_addr_t inet_addr(const char* strptr);
int inet_aton(const char* cp, struct in_addr* inp);
char* inet_ntoa(struct in_addr in);//内部使用静态变量，不可重入
inet_addr函数将用点分十进制字符串表示的ipv4地址转化为用网络字节序整数表示的ipv4地址。失败时返回INADDR_NONE。

#include
int inet_pton(int af, const char* src, void* dst);
const char* inet_ntop(int af, const void* src, char* dst, socklen_t cnt);
cnt参数指定目标存储单元的大小。下面的两个宏能帮助我们指定这个大小：
#include
#define INET_ADDRSTRLEN 16
#define INET6_ADDRSTRLEN 46

#include
#include
int socket(int domain, int type, int protocol);

int bind(int sockfd, const struct sockaddr* my_addr, socklen_t addrlen);
bind成功返回０，失败返回-1并设置errno。其中两中常见的errno是EACCES和EADDRINUSE，含义分别是：
EACCES:被绑定的地址是受保护的地址，仅超级用户能访问。比如普通用户将socket绑定到知名服务端口（端口号为0-1023）。
EADDRINUSE:被绑定的地址正在使用。如将socket绑定到一个处于TIME_WAIT状态的socket地址。

int listen(int sockfd, int backlog);
指示内核监听队列的最大长度。监听队列长度如果超过backlog，服务器将不受理新的客户连接，客户端也将收到ECONNREFUSED错误信息。
监听队列中完整连接的上线通常比backlog值略大。

int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);

int connect(int sockfd, const struct sockaddr *serv_addr, socklen_t addrlen);
出错返回时两种常见的errno是ECONNREFUSED(目标端口不存在，连接被拒绝)ETIMEDOUT(连接超时)

int close(fd);
close系统调用并非总是关闭一个连接，而是将fd的引用计数减1.只有当fd的引用计数为0时，才真正关闭连接。多进程程序中，一次fork系统调用默认将使父进程中打开的socket的引用计数加1，因此我们必须在父进程和子进程中都对该socket执行close调用才能将连接关闭。
如果无论如何都要立即终止连接（而不是将socket引用计数减1），可以使用shutdown系统调用(专为网络编程设计的)
#include
int shutdonw(int sockfd, int howto);
howto参数：
SHUT_RD//关闭sockfd上读的这一半。该socket接收缓冲区中的数据都被丢弃
SHUT_WR//关闭sockfd上写的这一半。发送缓冲区中的数据会在真正关闭连接之前全部发送出去，应用程序不可再对该socket文件描述符执行写操作。连接处于半关闭状态。
SHUT_RDWR//同时关闭读写。
由此可见，shutdown能够分别关闭socket上的读或写，或者都关闭。而close在关闭连接时只能将socket上的读和写同时关闭。

数据读写：
tcp数据读写：
#include
#include
ssize_t recv(int sockfd, void *buf, size_t len, int flags);
ssize_t send(int sockfd, const void *buf, size_t len, int flags);
recv成功时返回实际读取到的数据的长度，它可能小于我们期望的长度len。因此我们可能要多次调用recv，才能读取到完整的数据。recv可能返回0，这意味着通信对方已经关闭连接了。
flags参数：
MSG_CONFIRM//...
MSG_DONTROUTE//不查看路由表，直接将数据发送到本地局域网内的主机
MSG_DONTWAIT//对socket的此次操作将是非阻塞的
MSG_MORE//告诉内核应用程序还有更多数据要发送，内核将超时等待新数据写入tcp发送缓冲区后一并发送。这样可以防止tcp发送过多小的报文段，从而提高传输效率
MSG_WAITALL//读操作仅在读取到指定数量的字节后才返回
MSG_PEEK//窥探读缓存中的数据，此次读操作不会导致这些数据被清除
MSG_OOB//发送或接收紧急数据
MSG_NOSIGNAL//往读端关闭的管道或者socket连接中写数据时不引发SIGPIPE信号

服务器对正常数据的接收会被带外数据截断，即前一部分正常数据和后续正常数据是不能被一个recv调用全部读出的。

udp数据读写：
#include
#include
ssize_t recvfrom(int sockfd, void* buf, size_t len, int flags, struct sockaddr* src_addr, socklen_t* addrlen);
ssize_t sendto(int sockfd, void* buf, size_t len, int flags, const struct sockaddr* dest_addr, socklen_t addrlen);

通用数据读写函数：
#include
ssize_t recvmsg(int sockfd, struct msghdr* msg, int flags);
ssize_t sendmsg(int sockfd, struct msghdr* msg, int flags);
struct msghdr{
void* msg_name;//socket地址
socklen_t msg_namelen;
struct iovec* msg_iov;
int msg_iovlen;
void* msg_control;//指向辅助数据的起始位置
socklen_t msg_controllen;
int msg_flags;//复制函数中flsgs参数，并在调用过程中更新
};
struct iovec{
void* iov_base;//内存起始地址
size_t iov_len;//这块内存的长度
};

带外标记：
Linux内核检测到tcp紧急标志时，将通知应用程序有带外数据需要接收。内核通知应用程序带外数据到达的两种常见方式：IO复用产生的异常事件和SIGURG信号。但是，即使应用程序得到了有带外数据需要接收的通知，还需要知道带外数据在数据流中的具体位置，才能准确接收带外数据。
#include
int sockatmark(int sockfd);
sockatmark判断sockfd是否处于带外标记，即下一个被读取到的数据是否是带外数据。如果是，sockatmark返回1，此时我们就可以利用带MSG_OOB标志的recv调用来接收带外数据。

地址信息函数：
#include
int getsockname(int sockfd, struct sockaddr* address, socklen_t* address_len);
int getpeername(int sockfd, struct sockaddr* address, socklen_t* address_len);

socket选项：
#include
int getsockopt(int sockfd, int level, int option_name, void* option_value, socklen_t* restrict option_len);
int setsockopt(int sockfd, int level, int option_name, const void* option_value, socklen_t option_len);

选项列表：
SOL_SOCKET: SO_REUSEADDR\SO_TYPE\SO_DONTROUTE\SO_RCVBUF\SO_SNDBUF\SO_KEEPALIVE\SO_OOBINLIEN\SO_LINGER\SO_RCVLOWAT\SO_SNDLOWAT\SO_RCVTIMEO\SO_SNDTIMEO;

IPPROTO_IP:IP_TOS\IP_TTL

IPPROTO_IPV6:IPV6_NEXTHOP\...

IPPROTO_TCP:TCP_MAXSEG\TCP_NODELAY

对服务器而言，有部分socket选项只能在调用listen前针对监听socket设置才有效。

SO_REUSEADDR选项：可以设置该选项来强制使用被处于TIME_WAIT状态的连接占用的socket地址。

SO_RCVBUF SO_SNDBUF选项：当我们用setsockopt来设置tcp的接收缓冲区和发送缓冲区的大小时，系统都会将其值加倍，并且不得小于某个最小值。tcp接收缓冲区的最小值是256字节，而发送缓冲区的最小值是2048字节（不同系统可能不同）。这样做的目的是确保一个tcp连接拥有足够的空闲缓冲区来处理拥塞（比如快速重传算法就期望tcp接收缓冲区能至少容纳4个大小为SMSS的tcp报文段）。

tcpdump输出中的wscale窗口扩大因子m,则窗口为当前值 × 2的m次方。

SO_LINGER选项：
用于控制close系统调用在关闭tcp连接时的行为。默认情况下，当使用close调用来关闭一个socket时，close将立即返回，tcp模块负责把该socket对应的tcp发送缓冲区中残留的数据发送给对方。使用时需要传递一个linger类型的结构体：
#include
struct linger{
int l_onoff;//开启（非0）还是关闭（0）
int l_linger;//滞留时间
};

l_onoff不为0，l_linger=0。此时close调用立即返回，tcp模块将丢弃被关闭的socket对应的tcp发送缓冲区中残留的数据，同时给发送方一个复位报文段。因此，这种情况给服务器提供了异常终止一个连接的方法。
l_onoff不为0，l_linger>0。

网络信息API：
#include
struct hostent* gethostbyname(const char* name);
struct hostent* gethostbyaddr(const void* addr, size_t len, int type);
struct hostent{
char* h_name;
char** h_aliases;
int h_addrtype;
int h_length;
char** h_addr_list;
};

通过读取/etc/services文件来获取服务的信息。
#include
struct servent* getservbyname(const char* name, const char* proto);
struct servent* getservbyport(int port, const char* proto);
struct servent{
char* s_name;
char** s_aliases;
int s_port;
char* s_proto;
};
以上4个函数都是不可重入的，即非线程安全的。不过netdb.h头文件给出了它们的可重入版本（在原函数名尾部加上_r）。

#include
int getaddrinfo(const char* hostname, const char* service, const struct addrinfo* hints, struct addrinfo** result);
struct addrinfo{
int ai_flags;
int ai_family;
int ai_socktype;
int ai_protocol;
socklen_t ai_addrlen;
char* ai_canonname;
struct sockaddr* ai_addr;
struct addrinfo* ai_next;
};
result指针原本是没有指向一块合法内存的，所以，getaddrinfo调用结束后，我们必须使用如下配对函数来释放这块内存：
#include
void freeaddrinfo(struct addrinfo* res);

getnameinfo函数通过socket地址同时获得以字符串表示的主机名和服务名。它是否可重入取决于其内部调用的gethostbyaddr和getservbyport函数是否是它们的可重入版本。
#include
int getnameinfo(const struct sockaddr* sockaddr, socklen_t addrlen, char* host, socklen_t hostlen, char* serv, socklen_t servlen, int flags);

Linux下strerror能将数值错误码errno转换成易读的字符串形式。同样，下面的函数可将错误码转换成其字符串形式：
#include
const char* gai_strerror(int error);

阅读(1041) | 评论(0) | 转发(0) |

上一篇：Linux网络编程：原始套接字的魔力【上】

下一篇：（转）Linux下/proc目录简介

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6