Chinaunix首页 | 论坛 | 博客
  • 博客访问: 303157
  • 博文数量: 94
  • 博客积分: 2163
  • 博客等级: 大尉
  • 技术积分: 932
  • 用 户 组: 普通用户
  • 注册时间: 2010-12-20 09:23
文章存档

2012年(2)

2011年(92)

分类: LINUX

2011-10-12 17:31:13

  1. 1225   url = alloca_array (char *, nurl + 1);/*alloca有多少个url地址,就分配几个指针*/
  2. 1226   for (i = 0; i < nurl; i++, optind++)
  3. 1227     {   
  4. 1228       char *rewritten = rewrite_shorthand_url (argv[optind]);
  5. 1229       if (rewritten)
  6. 1230         url[i] = rewritten;
  7. 1231       else
  8. 1232         url[i] = xstrdup (argv[optind]);
  9. 1233     }
  10. 1234   url[i] = NULL;
  11. /*这里返回后,url指向的就是实际意义上的 或者 ftp://xxx.xxx.xxx:23端口,这里函数的作用是判断哪一种协议。*/
复制代码
  1. 1237   log_init (opt.lfilename, append_to_log); /*打开设定的日志文件,准备写*/
复制代码
  1. opt.output_document /*有输出打印到的文件*/
复制代码
  1. 1330   for (t = url; *t; t++)
  2. 1331     {
  3. 1332       char *filename = NULL, *redirected_URL = NULL;
  4. 1333       int dt, url_err;
  5. 1337       struct iri *iri = iri_new ();   /*这个数据结构储存检查要获取编码格式,文件编码格式,是否这url是用utf8编码,这里是分配一个新的1、_______--------->*/
  6. 1338       struct url *url_parsed;
  7. 1339
  8. 1340       set_uri_encoding (iri, opt.locale, true);
  9. 1341       url_parsed = url_parse (*t, &url_err, iri, true); 2、________----------->
  10.       
  11. 1、________--------------->
  12. 302 struct iri *
  13. 303 iri_new (void)
  14. 304 {
  15. 305   struct iri *i = xmalloc (sizeof *i);  /*分配一个空间*/
  16. 306   i->uri_encoding = opt.encoding_remote ? xstrdup (opt.encoding_remote) : NULL; /*是否有远程编码格式没有就初始化为NULL*/
  17. 307   i->content_encoding = NULL; /*内容编码为NULL*/
  18. 308   i->orig_url = NULL;    /*url也是0*/
  19. 309   i->utf8_encode = opt.enable_iri;  /*
  20. 310   return i;
  21. 311 }
  22. <------------_______________
复制代码
  1. 1340       set_uri_encoding (iri, opt.locale, true); /*检查是否被设置编码,如果没有,就有本地编码进行初始化*/
复制代码

  1. 2、______________---------->
  2. [code]
  3. /*url 解析*/
  4. 1341       url_parsed = url_parse (*t, &url_err, iri, true); /*t为 url, &url_err (int*类型),iri储存编码格式.bool 常量 ture*/
  5. 函数作用是解析一个url地址,返回一个新的url地址如果成功。否则就返回NULL或者error。
  6. 此函数中调用了url_scheme()又一次判断,地址类型,这里略去不分析*/

  7. 698   if (iri && iri->utf8_encode)
  8. 699     {
  9. 700       iri->utf8_encode = remote_to_utf8 (iri, iri->orig_url ? iri->orig_url : url, (co     nst char **) &new_url);  /*new_url 强制转化为 const char **类型 *这个函数作用是:如果发现远处的编码格式不是utf-8格式,那么就将其转化成utf-8格式 *new中保存这个转化后的地址。调用的外部函数/
  10. 701       if (!iri->utf8_encode)
  11. 702         new_url = NULL;  
  12. 703       else
  13. 704         iri->orig_url = xstrdup (url); /*将源地址同化*/
  14. 705     }
复制代码
  1.            src/url.c*/
  2. 708   if (percent_encode)
  3. 709     url_encoded = reencode_escapes (new_url ? new_url : url); /*用utf-8格式将url进行格式化*/
  4. 713   p = url_encoded;   
  5. 718   p += strlen (supported_schemes[scheme].leading_string);  /*计算http://的长度*/
  6. 719   uname_b = p;  /*算出真正url的地址,是转化后的*/
  7. 720   p = url_skip_credentials (p);  /*去掉不规则的结束符比如 @ # 等。
  8. 721   uname_e = p;  /*指向结束地址*/
  9.                 scheme://host[:port][/path][;params][?query][#fragment]  
  10. 格式
  11. 731   path_b     = path_e     = NULL;
  12. 732   params_b   = params_e   = NULL;
  13. 733   query_b    = query_e    = NULL;
  14. 734   fragment_b = fragment_e = NULL;
  15. 739   seps = init_seps (scheme); /*加入分隔字符,比如ftp 有参数,http和https有请求字符和片段 2、__________------------>*/
  16. 741   host_b = p;
复制代码
  1. 2、__-------------->
  2. 620 static const char *
  3. 621 init_seps (enum url_scheme scheme)
  4. 622 {
  5. 623   static char seps[8] = ":/";  /*固定的开始是:/字符
  6. 624   char *p = seps + 2;  
  7. 625   int flags = supported_schemes[scheme].flags; /这里看这个scheme支持的格式*/
  8. 626
  9. 627   if (flags & scm_has_params)  判断*/
  10. 628     *p++ = ';';  
  11. 629   if (flags & scm_has_query)
  12. 630     *p++ = '?';
  13. 631   if (flags & scm_has_fragment)
  14. 632     *p++ = '#';
  15. 633   *p = '\0';
  16. 634   return seps;  /*返回格式*/
  17. 635 }
复制代码
  1. <--------------____________
  2. src/url.c*/
  3. 741   host_b = p; /*
  4. 742
  5. 743   if (*p == '[')
  6. 744     {
  7. 745       /* Handle IPv6 address inside square brackets.  Ideally we'd
  8. 746          just look for the terminating ']', but rfc2732 mandates
  9. 747          rejecting invalid IPv6 addresses.  */
  10. 748
  11. 749       /* The address begins after '['. */
  12. 750       host_b = p + 1;
  13. 751       host_e = strchr (host_b, ']');  /*ipv6格式*/
  14. 752
  15. 753       if (!host_e)
  16. 754         {
  17. 755           error_code = PE_UNTERMINATED_IPV6_ADDRESS;
  18. 756           goto error;
  19. 757         }
  20. /*不说ipv6先*/
  21. /*后面的一些判断很简单*/
  22. 798   port = scheme_default_port (scheme); /*根据scheme的default_prot来初始化port*/

  23. 799   if (*p == ':')  /*来确定端口,并赋给port_b和port_e;
  24. 800     {
  25. 801       const char *port_b, *port_e, *pp;
  26. 802
  27. 803       /* scheme://host:port/tralala */
  28. 804       /*              ^             */  
  29. 805       ++p;
  30. 806       port_b = p;
  31. 807       p = strpbrk_or_eos (p, seps);
  32. 808       port_e = p;
  33. /*比较简单*/
  34. /*获得含有第一个字符串的指针返回,过程中还有赋值操作,这是按照顺序依次来赋值的*/
  35. 837 #define GET_URL_PART(sepchar, var) do {                         \
  36. 838   if (*p == sepchar)                                            \
  37. 839     var##_b = ++p, var##_e = p = strpbrk_or_eos (p, seps);      \
  38. 840   ++seps;                                                       \
  39. 841 } while (0)

  40. 843   GET_URL_PART ('/', path);
  41. 844   if (supported_schemes[scheme].flags & scm_has_params)
  42. 845     GET_URL_PART (';', params);
  43. 846   if (supported_schemes[scheme].flags & scm_has_query)

  44. 866   u = xnew0 (struct url);      
  45. 867   u->scheme = scheme;         
  46. 868   u->host   = strdupdelim (host_b, host_e);
  47. 869   u->port   = port;
  48. 870   u->user   = user;
  49. 871   u->passwd = passwd;
  50. 873   u->path = strdupdelim (path_b, path_e);
  51. 874   path_modified = path_simplify (scheme, u->path); /*矫正后的path*/
  52. 875   split_path (u->path, &u->dir, &u->file);  /*将路径和文件分别存储,并且用格式化编码*/
  53. 876  
  54. 877   host_modified = lowercase_str (u->host);  /*将主机名称格式化成小写*/

  55. /*将url结构对应初始化*/

  56. 847     GET_URL_PART ('?', query);
  57. 848   if (supported_schemes[scheme].flags & scm_has_fragment)
  58. 849     GET_URL_PART ('#', fragment);
  59. 883   if (strchr (u->host, '%'))  /*将主机名也格式化*/
  60. 884     {
  61. 885       url_unescape (u->host);
  62. 886       host_modified = true;
  63. 887
  64. 888       /* Apply IDNA regardless of iri->utf8_encode status */
  65. 889       if (opt.enable_iri && iri)  
  66. 890         {
  67. 891           char *new = idn_encode (iri, u->host);/*参有IDNAN格式格式化,如果没有采用utf-8格式,那么就用ascii码格式*/
  68. 892           if (new)
  69. 893             {
  70. 894               xfree (u->host);
  71. 895               u->host = new;
  72. 896               host_modified = true;
  73. 897             }
  74. 898         }
  75. 899     }
  76. 剩下就是其他的格式化*/
  77. 最后是return u;
  78. }
  79. 失败的话,当然是打印错误,不分析了*/
阅读(1486) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~