Chinaunix首页 | 论坛 | 博客
  • 博客访问: 967047
  • 博文数量: 403
  • 博客积分: 27
  • 博客等级: 民兵
  • 技术积分: 165
  • 用 户 组: 普通用户
  • 注册时间: 2011-12-25 22:20
文章分类

全部博文(403)

文章存档

2016年(3)

2015年(16)

2014年(163)

2013年(222)

发布时间:2014-05-27 11:00:10

    mechanize是对urllib2的部分功能的替换,能够更好的模拟浏览器行为,在web访问控制方面做得更全面。结合beautifulsoup和re模块,可以有效的解析web页面,我比较喜欢这种方法。    下面主要总结了使用mechanize模拟浏览器的行为和几个例子(谷歌搜索,百度搜索和人人网登录等)1.初.........【阅读全文】

阅读(764) | 评论(0) | 转发(0)

发布时间:2014-05-27 10:55:32

    BeautifulSoup是Python的一个第三方库,可用于帮助解析html/XML等内容,以抓取特定的网页信息。目前最新的是v4版本,这里主要总结一下我使用的v3版本解析html的一些常用方法。1.初始化   导入模块#!/usr/bin/env pythonfrom BeautifulSoup import BeautifulSoup  .........【阅读全文】

阅读(698) | 评论(0) | 转发(0)

发布时间:2014-05-27 10:53:04

好久没写技术相关的博文,这次写篇有意思的,关于一个有意思的游戏——QQ找茬,关于一种有意思的语音——Python,关于一个有意思的库——Qt。这是一个用于QQ大家来找茬(美女找茬)的辅助外挂,开发的原因是看到老爸天天在玩这个游戏,分数是惨不忍睹的负4000多。他玩游戏有他的乐趣,并不很在意输赢,我做这个也只是.........【阅读全文】

阅读(860) | 评论(1) | 转发(0)

发布时间:2014-05-23 09:37:47

操作系统:ubuntu10.04前言:    在通信过程中,无法知道将会接收到的数据的长度,因此开一个固定大小的缓冲区并不合适,开大了,很可能大多数通信都只是几十个自己而已;开小了,又无法处理大数据。因此最好的方法就是创建内存池,根据实际情况,分配合适大小的内存空间。一,思路二,实现三.........【阅读全文】

阅读(689) | 评论(0) | 转发(0)

发布时间:2014-05-23 08:50:10

如果能够模拟一个没有界面的浏览器,还有什么不能做到的呢?关于解析Ajax网站的框架也有不少,
我选择了HtmlUnit,官方网站:http://htmlunit.sourceforge.net/?,htmlunit可以说是一个Java
版本的无界面浏览器,几乎无所不能,而且很多东西都封装得特别完美。
......【阅读全文】

阅读(1467) | 评论(0) | 转发(0)
给主人留下些什么吧!~~
留言热议
请登录后留言。

登录 注册