全部博文(471)
发布时间:2013-02-28 22:50:42
htmllib 模块提供了一种标签驱动的HTML文档解析方式。解析后的数据将发送给formatter对象进行处理。在此模块中包含HTMLParser类。通过继承HTMLParser类可以有效地对HTML文档进行处理。需要注意的是,此类中没有包含数据资源的获取过程,所以在使用的时候,需要由文件对象获取数据资源。 此模块是基于sgmllib模块,所.........【阅读全文】
发布时间:2013-02-28 22:19:45
urllib 和urllib2(python3已经合并成一个了)都是接受URL请求的相关模块,但是提供了不同的功能。(老外写的)HTTP是基于请求和应答机制的--客户端提出请求,服务端提供应答。urllib2用一个Request对象来映射你提出的HTTP请求,在它最简单的使用形式中你将用你要请求的地址创建一个Request对象,通过调用urlopen并传入Requ.........【阅读全文】