Chinaunix首页 | 论坛 | 博客
  • 博客访问: 717801
  • 博文数量: 161
  • 博客积分: 2998
  • 博客等级: 少校
  • 技术积分: 1697
  • 用 户 组: 普通用户
  • 注册时间: 2010-10-28 09:39
文章分类

全部博文(161)

文章存档

2012年(6)

2011年(120)

2010年(35)

分类: LINUX

2011-05-07 18:41:34

  1. #include
  2. #include
  3. #include
  4. #include
  5. #include
  6. #include
  7. int create_tcp_socket();
  8. char *get_ip(char *host);
  9. char *build_get_query(char *host, char *page);
  10. void usage();
  11.  
  12. #define HOST "coding.debuntu.org"
  13. #define PAGE "/"
  14. #define PORT 80
  15. #define USERAGENT "HTMLGET 1.0"
  16.  
  17. int main(int argc, char **argv)
  18. {
  19.   struct sockaddr_in *remote;
  20.   int sock;
  21.   int tmpres;
  22.   char *ip;
  23.   char *get;
  24.   char buf[BUFSIZ+1];
  25.   char *host;
  26.   char *page;
  27.  
  28.   if(argc == 1){
  29.     usage();
  30.     exit(2);
  31.   }  
  32.   host = argv[1];
  33.   if(argc > 2){
  34.     page = argv[2];
  35.   }else{
  36.     page = PAGE;
  37.   }
  38.   sock = create_tcp_socket();
  39.   ip = get_ip(host);
  40.   fprintf(stderr, "IP is %s\n", ip);
  41.   remote = (struct sockaddr_in *)malloc(sizeof(struct sockaddr_in *));
  42.   remote->sin_family = AF_INET;
  43.   tmpres = inet_pton(AF_INET, ip, (void *)(&(remote->sin_addr.s_addr)));
  44.   if( tmpres < 0)  
  45.   {
  46.     perror("Can't set remote->sin_addr.s_addr");
  47.     exit(1);
  48.   }else if(tmpres == 0)
  49.   {
  50.     fprintf(stderr, "%s is not a valid IP address\n", ip);
  51.     exit(1);
  52.   }
  53.   remote->sin_port = htons(PORT);
  54.  
  55.   if(connect(sock, (struct sockaddr *)remote, sizeof(struct sockaddr)) < 0){
  56.     perror("Could not connect");
  57.     exit(1);
  58.   }
  59.   get = build_get_query(host, page);
  60.   fprintf(stderr, "Query is:\n<>\n%s<>\n", get);
  61.  
  62.   //Send the query to the server
  63.   int sent = 0;
  64.   while(sent < strlen(get))
  65.   {
  66.     tmpres = send(sock, get+sent, strlen(get)-sent, 0);
  67.     if(tmpres == -1){
  68.       perror("Can't send query");
  69.       exit(1);
  70.     }
  71.     sent += tmpres;
  72.   }
  73.   //now it is time to receive the page
  74.   memset(buf, 0, sizeof(buf));
  75.   int htmlstart = 0;
  76.   char * htmlcontent;
  77.   while((tmpres = recv(sock, buf, BUFSIZ, 0)) > 0){
  78.     if(htmlstart == 0)
  79.     {
  80.       /* Under certain conditions this will not work.
  81.       * If the \r\n\r\n part is splitted into two messages
  82.       * it will fail to detect the beginning of HTML content
  83.       */
  84.       htmlcontent = strstr(buf, "\r\n\r\n");
  85.       if(htmlcontent != NULL){
  86.         htmlstart = 1;
  87.         htmlcontent += 4;
  88.       }
  89.     }else{
  90.       htmlcontent = buf;
  91.     }
  92.     if(htmlstart){
  93.       fprintf(stdout, htmlcontent);
  94.     }
  95.  
  96.     memset(buf, 0, tmpres);
  97.   }
  98.   if(tmpres < 0)
  99.   {
  100.     perror("Error receiving data");
  101.   }
  102.   free(get);
  103.   free(remote);
  104.   free(ip);
  105.   close(sock);
  106.   return 0;
  107. }
  108.  
  109. void usage()
  110. {
  111.   fprintf(stderr, "USAGE: htmlget host [page]\n\
  112. \thost: the website hostname. ex: coding.debuntu.org\n\
  113. \tpage: the page to retrieve. ex: index.html, default: /\n");
  114. }
  115.  
  116.  
  117. int create_tcp_socket()
  118. {
  119.   int sock;
  120.   if((sock = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP)) < 0){
  121.     perror("Can't create TCP socket");
  122.     exit(1);
  123.   }
  124.   return sock;
  125. }
  126.  
  127.  
  128. char *get_ip(char *host)
  129. {
  130.   struct hostent *hent;
  131.   int iplen = 15; //XXX.XXX.XXX.XXX
  132.   char *ip = (char *)malloc(iplen+1);
  133.   memset(ip, 0, iplen+1);
  134.   if((hent = gethostbyname(host)) == NULL)
  135.   {
  136.     herror("Can't get IP");
  137.     exit(1);
  138.   }
  139.   if(inet_ntop(AF_INET, (void *)hent->h_addr_list[0], ip, iplen) == NULL)
  140.   {
  141.     perror("Can't resolve host");
  142.     exit(1);
  143.   }
  144.   return ip;
  145. }
  146.  
  147. char *build_get_query(char *host, char *page)
  148. {
  149.   char *query;
  150.   char *getpage = page;
  151.   char *tpl = "GET /%s HTTP/1.0\r\nHost: %s\r\nUser-Agent: %s\r\n\r\n";
  152.   if(getpage[0] == '/'){
  153.     getpage = getpage + 1;
  154.     fprintf(stderr,"Removing leading \"/\", converting %s to %s\n", page, getpage);
  155.   }
  156.   // -5 is to consider the %s %s %s in tpl and the ending \0
  157.   其意思是%s占两个字节,一起就是6个字节,然后后面要有一个\0结尾,所以为5个字节
  158.   query = (char *)malloc(strlen(host)+strlen(getpage)+strlen(USERAGENT)+strlen(tpl)-5);
  159.   sprintf(query, tpl, getpage, host, USERAGENT);
  160.   return query;
  161. }
相关解析:
sprintf用法解析 作者 :晨星 1: sprintf 最常见的应用之一莫过于把整数打印到字符串中,所以,spritnf 在大多数场合可以替代itoa。 这样,一个整数的16 进制字符串就很容易得到,但我们在打印16 进制内容 时,通常想要一种左边补0 的等宽格式,那该怎么做呢?很简单,在表示宽 度的数字前面加个0 就可以了。 sprintf(s, "%08X", 4567); //产生:"000011D7" 上面以”%d”进行的10 进制打印同样也可以使用这种左边补0 的方式。 这里要注意一个符号扩展的问题:比如,假如我们想打印短整数(short)-1 的内存16 进制表示形式,在Win32 平台上,一个short 型占2 个字节,所 以我们自然希望用4 个16 进制数字来打印它: short si = -1; sprintf(s, "%04X", si); 产生“FFFFFFFF”,怎么回事?因为spritnf 是个变参函数,除了前面两个 参数之外,后面的参数都不是类型安全的,函数更没有办法仅仅通过一个 “%X”就能得知当初函数调用前参数压栈时被压进来的到底是个4 字节的整 数还是个2 字节的短整数,所以采取了统一4 字节的处理方式,导致参数压 栈时做了符号扩展,扩展成了32 位的整数-1,打印时4 个位置不够了,就 把32 位整数-1 的8 位16 进制都打印出来了。如果你想看si 的本来面目, 那么就应该让编译器做0 扩展而不是符号扩展(扩展时二进制左边补0 而不 是补符号位): sprintf(s, "%04X", (unsigned short)si); 就可以了。或者: unsigned short si = -1; sprintf(s, "%04X", si); 2: 浮点数的打印和格式控制是sprintf 的又一大常用功能,浮点数使用格式符” %f”控制,默认保留小数点后6 位数字,比如: sprintf(s, "%f", 3.1415926); //产生"3.141593" 但有时我们希望自己控制打印的宽度和小数位数,这时就应该使用:” %m.nf”格式,其中m 表示打印的宽度,n 表示小数点后的位数。比如: sprintf(s, "%10.3f", 3.1415626); //产生:" 3.142" sprintf(s, "%-10.3f", 3.1415626); //产生:"3.142 " sprintf(s, "%.3f", 3.1415626); //不指定总宽度,产生:"3.142" 注意一个问题,你猜 int i = 100; sprintf(s, "%.2f", i); 会打出什么东东来?“100.00”?对吗?自己试试就知道了,同时也试试下面这个: sprintf(s, "%.2f", (double)i); 第一个打出来的肯定不是正确结果,原因跟前面提到的一样,参数压栈时调 用者并不知道跟i相对应的格式控制符是个”%f”。而函数执行时函数本身 则并不知道当年被压入栈里的是个整数,于是可怜的保存整数i 的那4 个字 节就被不由分说地强行作为浮点数格式来解释了,整个乱套了。 3: 连接字符串 sprintf 的格式控制串中既然可以插入各种东西,并最终把它们“连成一 串”,自然也就能够连接字符串,从而在许多场合可以替代strcat,但 sprintf 能够一次连接多个字符串(自然也可以同时在它们中间插入别的内 容,总之非常灵活)。比如: char* who = "I"; char* whom = "CSDN"; sprintf(s, "%s love %s.", who, whom); //产生:"I love CSDN. " strcat 只能连接字符串(一段以’\0’结尾的字符数组或叫做字符缓冲, null-terminated-string), 但有时我们有两段字符缓冲区,他们并不是以’\0’结尾。比如许多从第三 方库函数中返回的字符数组,从硬件或者网络传输中读进来的字符流,它们 未必每一段字符序列后面都有个相应的’\0’来结尾。如果直接连接,不管 是sprintf 还是strcat 肯定会导致非法内存操作,strncat 也至少要求第 一个参数是个null-terminated-string,那该怎么办呢?我们自然会想起前 面介绍打印整数和浮点数时可以指定宽度,字符串也一样的。比如: char a1[] = {'A', 'B', 'C', 'D', 'E', 'F', 'G'}; char a2[] = {'H', 'I', 'J', 'K', 'L', 'M', 'N'}; 如果: sprintf(s, "%s%s", a1, a2); //Don't do that! 十有八九要出问题了。是否可以改成: sprintf(s, "%7s%7s", a1, a2); 也没好到哪儿去,正确的应该是: sprintf(s, "%.7s%.7s", a1, a2);//产生:"ABCDEFGHIJKLMN" 这可以类比打印浮点数的”%m.nf”,在”%m.ns”中,m 表示占用宽度(字 符串长度不足时补空格,超出了则按照实际宽度打印),n 才表示从相应的 字符串中最多取用的字符数。通常在打印字符串时m 没什么大用,还是点号 后面的n 用的多。自然,也可以前后都只取部分字符: sprintf(s, "%.6s%.5s", a1, a2);//产生:"ABCDEFHIJKL" (因为sprintf函数将输出写入到字符串s中,并以'\0'结束,所以生成的s 中有'\0',所以可以用printf(s),而不用担心会出错) 在许多时候,我们或许还希望这些格式控制符中用以指定长度信息的数字是 动态的,而不是静态指定的,因为许多时候,程序要到运行时才会清楚到底 需要取字符数组中的几个字符,这种动态的宽度/精度设置功能在sprintf 的实现中也被考虑到了,sprintf 采用”*”来占用一个本来需要一个指定 宽度或精度的常数数字的位置,同样,而实际的宽度或精度就可以和其它被 打印的变量一样被提供出来,于是,上面的例子可以变成: sprintf(s, "%.*s%.*s", 7, a1, 7, a2); 或者: sprintf(s, "%.*s%.*s", sizeof(a1), a1, sizeof(a2), a2); 实际上,前面介绍的打印字符、整数、浮点数等都可以动态指定那些常量值, 比如: sprintf(s, "%-*d", 4, 'A'); //产生"65 " sprintf(s, "%#0*X", 8, 128); //产生"0X000080","#"产生0X sprintf(s, "%*.*f", 10, 2, 3.1415926); //产生" 3.14"

strstr(在一字符串中查找指定的字符串)
相关函数
index,memchr,rindex,strchr,strpbrk,strsep,strspn,strtok
表头文件
#include
定义函数
char *strstr(const char *haystack,const char *needle);
函数说明
strstr()会从字符串haystack 中搜寻字符串needle,并将第一次出现的地址返回。
返回值
返回指定字符串第一次出现的地址,否则返回0。
范例
#include
main()
{
char * s="012345678901234567890123456789";
char *p;
p= strstr(s,"901");
printf("%s\n",p);
}
执行
9.01E+21

阅读(1457) | 评论(0) | 转发(0) |
0

上一篇:HTTP协议(收藏)

下一篇:hostent结构体

给主人留下些什么吧!~~