由上面的执行结果可以看到,ping命令执行后显示出被测试系统主机名和相应IP地址、返回给当前主机的ICMP报文顺序号、ttl生存时间和往返时间rtt(单位是毫秒,即千分之一秒)。要写一个模拟ping命令,这些信息有启示作用。
关于数字56、84、64的含义:
84 - 64 = 20, 84 - 56 = 28, 64 - 56 = 8,而sizeof(struct ip)==20,sizeof(struct icmp)==28。
所以:56(84)的含义是,icmp的总长度位84字节,其中ip部分为20字节,剩下的64字节为icmp的报头和数据,其中28字节位icmp的报头,剩下的54字节位数据部分。64字节说明,目的地址方在接收到我们的icmp查询时,在解包时,将20字节的ip头去掉了,所以对于目的地址方来说,它收到了64字符的内容。
要真正了解ping命令实现原理,就要了解ping命令所使用到的TCP/IP协议。
ICMP(Internet Control Message,网际控制报文协议)是为网关和目标主机而提供的一种差错控制机制,使它们在遇到差错时能把错误报告给报文源发方。ICMP协议是IP层的一个协议,但是由于差错报告在发送给报文源发方时可能也要经过若干子网,因此牵涉到路由选择等问题,所以ICMP报文需通过IP协议来发送。ICMP数据报的数据发送前需要两级封装:首先添加ICMP报头形成ICMP报文,再添加IP报头形成IP数据报。如下图所示
由于IP层协议是一种点对点的协议,而非端对端的协议,它提供无连接的数据报服务,没有端口的概念,因此很少使用bind()和connect()函数,若有使用也只是用于设置IP地址。发送数据使用sendto()函数,接收数据使用recvfrom()函数。IP报头格式如下图:
在Linux中,IP报头格式数据结构()定义如下:(Linux ubuntu 2.6.38-8-generic下同)
- struct timestamp
- {
- u_int8_t len;
- u_int8_t ptr;
- #if __BYTE_ORDER == __LITTLE_ENDIAN
- unsigned int flags:4;
- unsigned int overflow:4;
- #elif __BYTE_ORDER == __BIG_ENDIAN
- unsigned int overflow:4;
- unsigned int flags:4;
- #else
- # error "Please fix "
- #endif
- u_int32_t data[9];
- };
- struct iphdr
- {
- #if __BYTE_ORDER == __LITTLE_ENDIAN
- unsigned int ihl:4;
- unsigned int version:4;
- #elif __BYTE_ORDER == __BIG_ENDIAN
- unsigned int version:4;
- unsigned int ihl:4;
- #else
- # error "Please fix "
- #endif
- u_int8_t tos;
- u_int16_t tot_len;
- u_int16_t id;
- u_int16_t frag_off;
- u_int8_t ttl;
- u_int8_t protocol;
- u_int16_t check;
- u_int32_t saddr;
- u_int32_t daddr;
- /*The options start here. */
- };
- #ifdef __USE_BSD
- struct ip
- {
- #if __BYTE_ORDER == __LITTLE_ENDIAN
- unsigned int ip_hl:4; /* header length */
- unsigned int ip_v:4; /* version */
- #endif
- #if __BYTE_ORDER == __BIG_ENDIAN
- unsigned int ip_v:4; /* version */
- unsigned int ip_hl:4; /* header length */
- #endif
- u_int8_t ip_tos; /* type of service */
- u_short ip_len; /* total length */
- u_short ip_id; /* identification */
- u_short ip_off; /* fragment offset field */
- #define IP_RF 0x8000 /* reserved fragment flag */
- #define IP_DF 0x4000 /* dont fragment flag */
- #define IP_MF 0x2000 /* more fragments flag */
- #define IP_OFFMASK 0x1fff /* mask for fragmenting bits */
- u_int8_t ip_ttl; /* time to live */
- u_int8_t ip_p; /* protocol */
- u_short ip_sum; /* checksum */
- struct in_addr ip_src, ip_dst; /* source and dest address */
- };
- /*
- * Time stamp option structure.
- */
- struct ip_timestamp
- {
- u_int8_t ipt_code; /* IPOPT_TS */
- u_int8_t ipt_len; /* size of structure (variable) */
- u_int8_t ipt_ptr; /* index of current entry */
- #if __BYTE_ORDER == __LITTLE_ENDIAN
- unsigned int ipt_flg:4; /* flags, see below */
- unsigned int ipt_oflw:4; /* overflow counter */
- #endif
- #if __BYTE_ORDER == __BIG_ENDIAN
- unsigned int ipt_oflw:4; /* overflow counter */
- unsigned int ipt_flg:4; /* flags, see below */
- #endif
- u_int32_t data[9];
- };
- #endif /* __USE_BSD */
其中ping程序只使用以下数据:
- IP报头长度IHL(Internet Header Length)以4字节为一个单位来记录IP报头的长度,是上述IP数据结构的ihl变量。
- 生存时间TTL(Time To Live)以秒为单位,指出IP数据报能在网络上停留的最长时间,其值由发送方设定,并在经过路由的每一个节点时减一,当该值为0时,数据报将被丢弃,是上述IP数据结构的ttl变量。
ICMP报文分为两种,一是错误报告报文,二是查询报文。每个ICMP报头均包含类型、编码和校验和这三项内容,长度分别为8位,8位和16位,其余选项则随ICMP的功能不同而不同。
Ping命令只使用众多ICMP报文中的两种:"请求回送'(ICMP_ECHO)和"请求回应'(ICMP_ECHOREPLY)。在Linux中定义如下:
- #define ICMP_ECHO 8 /* Echo Request */
- #define ICMP_ECHOREPLY 0 /* Echo Reply */
这两种ICMP类型报头格式如下:
在Linux中ICMP数据结构()定义如下:
- struct icmphdr
- {
- u_int8_t type; /* message type */
- u_int8_t code; /* type sub-code */
- u_int16_t checksum;
- union
- {
- struct
- {
- u_int16_t id;
- u_int16_t sequence;
- } echo; /* echo datagram */
- u_int32_t gateway; /* gateway address */
- struct
- {
- u_int16_t __unused;
- u_int16_t mtu;
- } frag; /* path mtu discovery */
- } un;
- };
- #ifdef __USE_BSD
- #include <netinet/in.h>
- #include <netinet/ip.h>
- /*
- * Internal of an ICMP Router Advertisement
- */
- struct icmp_ra_addr
- {
- u_int32_t ira_addr;
- u_int32_t ira_preference;
- };
- struct icmp
- {
- u_int8_t icmp_type; /* type of message, see below */
- u_int8_t icmp_code; /* type sub code */
- u_int16_t icmp_cksum; /* ones complement checksum of struct */
- union
- {
- u_char ih_pptr; /* ICMP_PARAMPROB */
- struct in_addr ih_gwaddr; /* gateway address */
- struct ih_idseq /* echo datagram */
- {
- u_int16_t icd_id;
- u_int16_t icd_seq;
- } ih_idseq;
- u_int32_t ih_void;
- /* ICMP_UNREACH_NEEDFRAG -- Path MTU Discovery (RFC1191) */
- struct ih_pmtu
- {
- u_int16_t ipm_void;
- u_int16_t ipm_nextmtu;
- } ih_pmtu;
- struct ih_rtradv
- {
- u_int8_t irt_num_addrs;
- u_int8_t irt_wpa;
- u_int16_t irt_lifetime;
- } ih_rtradv;
- } icmp_hun;
- #define icmp_pptr icmp_hun.ih_pptr
- #define icmp_gwaddr icmp_hun.ih_gwaddr
- #define icmp_id icmp_hun.ih_idseq.icd_id
- #define icmp_seq icmp_hun.ih_idseq.icd_seq
- #define icmp_void icmp_hun.ih_void
- #define icmp_pmvoid icmp_hun.ih_pmtu.ipm_void
- #define icmp_nextmtu icmp_hun.ih_pmtu.ipm_nextmtu
- #define icmp_num_addrs icmp_hun.ih_rtradv.irt_num_addrs
- #define icmp_wpa icmp_hun.ih_rtradv.irt_wpa
- #define icmp_lifetime icmp_hun.ih_rtradv.irt_lifetime
- union
- {
- struct
- {
- u_int32_t its_otime;
- u_int32_t its_rtime;
- u_int32_t its_ttime;
- } id_ts;
- struct
- {
- struct ip idi_ip;
- /* options and then 64 bits of data */
- } id_ip;
- struct icmp_ra_addr id_radv;
- u_int32_t id_mask;
- u_int8_t id_data[1];
- } icmp_dun;
- #define icmp_otime icmp_dun.id_ts.its_otime
- #define icmp_rtime icmp_dun.id_ts.its_rtime
- #define icmp_ttime icmp_dun.id_ts.its_ttime
- #define icmp_ip icmp_dun.id_ip.idi_ip
- #define icmp_radv icmp_dun.id_radv
- #define icmp_mask icmp_dun.id_mask
- #define icmp_data icmp_dun.id_data
- };
struct icmphdr的定义可知,sizeof(struct icmphdr) == 8字节。即ICMP报头为8字节,数据报长度最大为64K字节。
- 校验和算法:这一算法称为网际校验和算法,把被校验的数据16位进行累加,然后取反码,若数据字节长度为奇数,则数据尾部补一个字节的0以凑成偶数。此算法适用于IPv4、ICMPv4、IGMPV4、ICMPv6、UDP和TCP校验和,更详细的信息请参考RFC1071,校验和字段为上述ICMP数据结构的icmp_cksum变量。
- 标识符:用于唯一标识ICMP报文, 为上述ICMP数据结构中的id。
- 顺序号:ping命令的icmp_seq便由这里读出,代表ICMP报文的发送顺序,为上述ICMP数据结构的seq宏所指的变量。
Ping命令中需要显示的信息,包括icmp_seq和ttl都已有实现的办法,但还缺rtt往返时间。为了实现这一功能,可利用ICMP数据报携带一个时间戳。使用以下函数生成时间戳:
- #include
- int gettimeofday(struct timeval *tp,void *tzp);
- struct timeval{
- long tv_sec; /* seconds */
- long tv_usec; /* micrseconds */
- };
其中tv_sec为秒数,tv_usec微秒数。在发送和接收报文时由gettimeofday分别生成两个timeval结构,两者之差即为往返时间,即ICMP报文发送与接收的时间差,而timeval结构由ICMP数据报携带,tzp指针表示时区,一般都不使用,赋NULL值。
系统自带的ping命令当它接送完所有ICMP报文后,会对所有发送和所有接收的ICMP报文进行统计,从而计算ICMP报文丢失的比率。为达此目的,定义两个全局变量:接收计数器和发送计数器,用于记录ICMP报文接受和发送数目。丢失数目=发送总数-接收总数,丢失比率=丢失数目/发送总数。
现给出模拟Ping程序功能的代码如下:
- #include <stdio.h>
- #include <stdlib.h>
- #include <string.h>
- #include <strings.h> /* for bzero */
- #include <signal.h>
- #include <sys/time.h>
- #include <arpa/inet.h>
- #include <sys/types.h>
- #include <sys/socket.h>
- #include <unistd.h>
- #include <netinet/in.h>
- #include <netinet/ip.h>
- #include <netinet/ip_icmp.h>
- #include <netdb.h>
- #include <setjmp.h>
- #include <errno.h>
- #define MAX_WAIT_TIME 5
- #define PACKET_SIZE 4096 /* 数据包的大小 */
- #define MAX_NO_PACKETS 3 /* 发送3个ICMP报文 */
- char sendpacket[PACKET_SIZE]; /* 发送的数据包 */
- char recvpacket[PACKET_SIZE]; /* 接收的数据包 */
- pid_t pid;
- int sockfd;
- int datalen = 56; /* icmp数据包中数据的长度 */
- int nsend = 0; /* 发送的次数 */
- int nreceived = 0; /* 接收的次数 */
- struct sockaddr_in dest_addr; /* icmp包目的地址 */
- struct sockaddr_in from; /* icmp包源地址 */
- struct timeval tvrecv;
- void statistics(int signo);
- unsigned short cal_chksum(unsigned short *addr,int len);
- int pack(int pack_no);
- void send_packet(void);
- void recv_packet(void);
- int unpack(char *buf,int len);
- void tv_sub(struct timeval *out,struct timeval *in);
- void statistics(int signo)
- {
- printf("\n--------------------PING statistics-------------------\n");
- /*
- * 总共发送nsend个icmp包,总共接收到返回的nreceived个包,
- * icmp包的丢失率(nsend-nreceived)/nsend
- */
- printf("%d packets transmitted, %d received , %%%d lost\n",
- nsend, nreceived, (nsend-nreceived)/nsend*100);
- close(sockfd);
- exit(1);
- }
- /* 计算校验和的算法 */
- unsigned short cal_chksum(unsigned short *addr,int len)
- {
- int sum=0;
- int nleft = len;
- unsigned short *w = addr;
- unsigned short answer = 0;
- /* 把ICMP报头二进制数据以2字节为单位累加起来 */
- while(nleft > 1){
- sum += *w++;
- nleft -= 2;
- }
- /*
- * 若ICMP报头为奇数个字节,会剩下最后一字节。
- * 把最后一个字节视为一个2字节数据的高字节,
- * 这2字节数据的低字节为0,继续累加
- */
- if(nleft == 1){
- *(unsigned char *)(&answer) = *(unsigned char *)w;
- sum += answer; /* 这里将 answer 转换成 int 整数 */
- }
- sum = (sum >> 16) + (sum & 0xffff); /* 高位低位相加 */
- sum += (sum >> 16); /* 上一步溢出时,将溢出位也加到sum中 */
- answer = ~sum; /* 注意类型转换,现在的校验和为16位 */
- return answer;
- }
- /* 设置ICMP报头,以及将发送的时间设置为ICMP的末尾的数据部分和校验和 */
- int pack(int pack_no)
- {
- int packsize;
- struct icmp *icmp;
- struct timeval *tval;
- icmp = (struct icmp*)sendpacket;
- icmp->icmp_type = ICMP_ECHO; /* icmp的类型 */
- icmp->icmp_code = 0; /* icmp的编码 */
- icmp->icmp_cksum = 0; /* icmp的校验和 */
- icmp->icmp_seq = pack_no; /* icmp的顺序号 */
- icmp->icmp_id = pid; /* icmp的标志符 */
- packsize = 8 + datalen; /* icmp8字节的头 加上数据的长度(datalen=56), packsize = 64 */
- tval = (struct timeval *)icmp->icmp_data; /* 获得icmp结构中最后的数据部分的指针 */
- gettimeofday(tval, NULL); /* 将发送的时间填入icmp结构中最后的数据部分 */
- icmp->icmp_cksum = cal_chksum((unsigned short *)icmp, packsize);/*填充发送方的校验和*/
- return packsize;
- }
- /* 发送三个ICMP报文 */
- void send_packet()
- {
- int packetsize;
- /* 每一次发送3个icmp包 */
- while(nsend < MAX_NO_PACKETS){ // #define MAX_NO_PACKETS 3
- nsend++;
- packetsize = pack(nsend); /* 设置ICMP报头 */
- if(sendto(sockfd, sendpacket, packetsize, 0,
- (struct sockaddr *)&dest_addr, sizeof(dest_addr)) < 0){
- perror("sendto error");
- continue;
- }
- sleep(1); /* 每隔一秒发送一个ICMP报文 */
- }
- }
- /* 接收所有ICMP报文 */
- void recv_packet()
- {
- int n, fromlen;
- extern int errno;
- signal(SIGALRM,statistics);
- fromlen = sizeof(from); /* icmp包源地址的大小*/
- while(nreceived < nsend){
- alarm(MAX_WAIT_TIME);
- if((n = recvfrom(sockfd, recvpacket, sizeof(recvpacket), 0,
- (struct sockaddr *)&from, (socklen_t *)&fromlen)) < 0)
- {
- if(errno == EINTR)
- continue;
- perror("recvfrom error");
- continue;
- }
- gettimeofday(&tvrecv, NULL); /* 记录接收到icmp包时的时间 */
- if(unpack(recvpacket, n) == -1)
- continue;
- nreceived++;
- }
- }
- /* 对ICMP报头解包 */
- int unpack(char *buf, int len)
- {
- int iphdrlen;
- struct ip *ip;
- struct icmp *icmp;
- struct timeval *tvsend;
- double rtt;
- ip = (struct ip *)buf;
- iphdrlen = ip->ip_hl << 2; /* 求ip报头长度,即ip报头的长度标志乘4 */
- icmp = (struct icmp *)(buf + iphdrlen); /* 越过ip报头,指向ICMP报头 */
- len -= iphdrlen; /* ICMP报头及ICMP数据报的总长度 */
- if(len < 8){ /* 小于ICMP报头长度则不合理 */
- printf("ICMP packets\'s length is less than 8\n");
- return -1;
- }
- /* 确保所接收的是我所发的的ICMP的回应 */
- if((icmp->icmp_type == ICMP_ECHOREPLY) && (icmp->icmp_id == pid)){
- tvsend = (struct timeval *)icmp->icmp_data;
- tv_sub(&tvrecv, tvsend); /* 接收和发送的时间差 */
- /* 以毫秒为单位计算发送和接收的时间差rtt */
- rtt = tvrecv.tv_sec * 1000 + tvrecv.tv_usec / 1000;
- /* 显示相关信息 */
- printf("%d byte from %s: icmp_seq=%u ttl=%d time=%.3f ms\n",
- len, /* ICMP报头及ICMP数据报的总长度 */
- inet_ntoa(from.sin_addr), /* ICMP的源地址 */
- icmp->icmp_seq, /* icmp包发送的顺序 */
- ip->ip_ttl, /* icmp存活的时间 */
- rtt); /* 以毫秒为单位计算发送和接收的时间差rtt */
- return 0;
- }
- else
- return -1;
- }
- int main(int argc,char *argv[])
- {
- struct hostent *host;
- struct protoent *protocol;
- unsigned long inaddr = 0l;
- int size = 50*1024; //50k
- if(argc < 2){
- printf("usage:%s hostname/IP address\n",argv[0]);
- exit(1);
- }
- if((protocol = getprotobyname("icmp")) == NULL){
- perror("getprotobyname");
- exit(1);
- }
- /* 生成使用ICMP的原始套接字,这种套接字只有root才能生成 */
- if((sockfd = socket(AF_INET, SOCK_RAW, protocol->p_proto)) < 0){
- perror("socket error");
- exit(1);
- }
- setuid(getuid()); /* 回收root权限,设置当前用户权限 */
- /*
- * 扩大套接字接收缓冲区到50K这样做主要为了减小接收缓冲区溢出的
- * 的可能性,若无意中ping一个广播地址或多播地址,将会引来大量应答
- */
- setsockopt(sockfd, SOL_SOCKET, SO_RCVBUF, &size, sizeof(size) );
- bzero(&dest_addr, sizeof(dest_addr));
- dest_addr.sin_family = AF_INET;
- /* 判断argv[1]是主机名还是ip地址 */
- if((inaddr=inet_addr(argv[1])) == INADDR_NONE){
- if((host = gethostbyname(argv[1])) == NULL){ /* 是主机名 */
- perror("gethostbyname error");
- exit(1);
- }
- memcpy((char*)&dest_addr.sin_addr, host->h_addr, host->h_length);
- }else /* 是ip地址 */
- memcpy((char*)&dest_addr.sin_addr, (char*)&inaddr, sizeof(inaddr));
- pid = getpid(); /*获取main的进程id,用于设置ICMP的标志符*/
- printf("PING %s(%s): %d bytes data in ICMP packets.\n",
- argv[1], inet_ntoa(dest_addr.sin_addr), datalen);
- send_packet(); /* 发送所有ICMP报文 */
- recv_packet(); /* 接收所有ICMP报文 */
- statistics(SIGALRM); /* 进行统计 */
- return 0;
- }
- /* 两个timeval结构相减 */
- void tv_sub(struct timeval *recv, struct timeval *send){
- if((recv->tv_usec -= send->tv_usec) < 0){
- --recv->tv_sec;
- recv->tv_usec += 1000000;
- }
- recv->tv_sec -= send->tv_sec;
- }
只有root用户才能利用socket()函数生成原始套接字,要让Linux的一般用户能执行以上程序,需进行如下的特别操作:
用root登陆,编译以上程序:gcc -o myping myping.c,其目的有二:一是编译,二是让myping属于root用户。
再执行chmod u+s myping,目的是把myping程序设成SUID的属性。
- PING www.google.com.hk(74.125.71.104): 56 bytes data in ICMP packets.
- 64 byte from 74.125.71.104: icmp_seq=1 ttl=52 time=3000.000 ms
- 64 byte from 74.125.71.104: icmp_seq=2 ttl=52 time=2000.000 ms
- 64 byte from 74.125.71.104: icmp_seq=3 ttl=52 time=1000.000 ms
- --------------------PING statistics-------------------
- 3 packets transmitted, 3 received , %0 lost
由于myping.c是发送完所有的ICMP报文才去接收,因此第一、第二和第三个ICMP报文的往返时间依此是3秒,2秒,1秒,上述结果中time信息正反映这一事实。