从今天开始,在这里记录自己做wget源码分析的工作,今天主要看了/lib/quotearg.c和iri.c两个文件。由于自己对c和linux不是很熟悉,于是一边google一边百度一边看代码。
quotearg.h和quotearg.c
这两个文件也就明白了20%吧,对wget的整体也不是很清楚,对这个文件的了解也只能是管中窥豹,姑且明白这个文件的大体作用,源码大体浏览一下以后再细究一下这个文件的作用。这两个文件应该是负责引用参数的格式化工作的,有几种不同格式的引用形式,形式说明在quotearg.h中给出了,可是是在是没看明白那些格式是什么意思,quotearg_buffer_restyled函数是quotearg.c中的核心其他的函数基本是间接调用该函数,如果这个函数弄明白了,整个quotearg.c文件也就了然于胸了,这是我见过代码最多的一个函数,跟quotearg.h中定义的引用格式关系,实在没看明白函数如何运行。
iri.h和iri.c
对url编码方式的解析、转换的文件。结构iri表示url及其编码方式,通过使用iconv来进行编码字符集的转换,涉及到iconv的几个重要函数,iconv_open(),iconv(),iconv_close(),具体使用方式可见http://hi.baidu.com/bevan_007/blog/item/ba3fcf9b5d112fbdc9eaf45b.html
http://blog.csdn.net/chengxu0921/archive/2009/12/06/4950957.aspx
其次使用了#include ,使用了两个域名编码方式转换的函数,idna_to_ascii_8z,idna_to_unicode_8zlz,网上关于idna.h文件的介绍很少,应该是关于域名操作方面的函数文件。
阅读(2120) | 评论(0) | 转发(0) |