发布时间:2013-07-24 12:47:14
用urllib2 和BeautifulSoup抓取分析网页以抓取豆瓣电影Top250的排行信息为例,本以为还要做个爬虫,后来发现那排行有文本列表显示的选项,直接把Top250个电影信息在一个页面显示出来了,所以只要用urllib2下载页面,再用BeautifulSoup分析就行了。 Beautiful Soup第三方库的下载地.........【阅读全文】
发布时间:2013-07-24 12:45:43
下面的内容节选自http://www.crummy.com/software/BeautifulSoup/bs3/documentation.zh.htmlBeautiful Soup 是用Python写的一个HTML/XML的解析器,它可以很好的处理不规范标记并生成剖析树(parse tree)。 它提供简单又常用的导航(navigating),搜索以及修改剖析树的操作。它可以大大节省你的编程时间。 对于Ruby,使用R.........【阅读全文】