发布时间:2014-05-27 11:00:10
mechanize是对urllib2的部分功能的替换,能够更好的模拟浏览器行为,在web访问控制方面做得更全面。结合beautifulsoup和re模块,可以有效的解析web页面,我比较喜欢这种方法。 下面主要总结了使用mechanize模拟浏览器的行为和几个例子(谷歌搜索,百度搜索和人人网登录等)1.初.........【阅读全文】
发布时间:2014-05-27 10:55:32
BeautifulSoup是Python的一个第三方库,可用于帮助解析html/XML等内容,以抓取特定的网页信息。目前最新的是v4版本,这里主要总结一下我使用的v3版本解析html的一些常用方法。1.初始化 导入模块#!/usr/bin/env pythonfrom BeautifulSoup import BeautifulSoup  .........【阅读全文】
发布时间:2014-05-27 10:53:04
好久没写技术相关的博文,这次写篇有意思的,关于一个有意思的游戏——QQ找茬,关于一种有意思的语音——Python,关于一个有意思的库——Qt。这是一个用于QQ大家来找茬(美女找茬)的辅助外挂,开发的原因是看到老爸天天在玩这个游戏,分数是惨不忍睹的负4000多。他玩游戏有他的乐趣,并不很在意输赢,我做这个也只是.........【阅读全文】
发布时间:2014-05-23 09:37:47
操作系统:ubuntu10.04前言: 在通信过程中,无法知道将会接收到的数据的长度,因此开一个固定大小的缓冲区并不合适,开大了,很可能大多数通信都只是几十个自己而已;开小了,又无法处理大数据。因此最好的方法就是创建内存池,根据实际情况,分配合适大小的内存空间。一,思路二,实现三.........【阅读全文】
发布时间:2014-05-23 08:50:10
如果能够模拟一个没有界面的浏览器,还有什么不能做到的呢?关于解析Ajax网站的框架也有不少,
我选择了HtmlUnit,官方网站:http://htmlunit.sourceforge.net/?,htmlunit可以说是一个Java
版本的无界面浏览器,几乎无所不能,而且很多东西都封装得特别完美。
......【阅读全文】