Chinaunix首页 | 论坛 | 博客
  • 博客访问: 938014
  • 博文数量: 403
  • 博客积分: 27
  • 博客等级: 民兵
  • 技术积分: 165
  • 用 户 组: 普通用户
  • 注册时间: 2011-12-25 22:20
文章分类

全部博文(403)

文章存档

2016年(3)

2015年(16)

2014年(163)

2013年(222)

分类: Python/Ruby

2014-03-21 09:46:27

原文地址:python版爬虫 作者:chinaboywg

python爬虫的三个版本:
1. 基于urllib, urllib2
基于http请求响应的封装。有局限性,因为不能处理动态的脚本如js,一些操作无法实现。
2. 内嵌webbrowser
如pyqt的webkit,pamie, spynner(基于webkit)
这种内嵌的方式类似于com调用,支持所有浏览器的操作,兼容性好,但不如urllib快捷。
3. web test framwork
如selenium。 综合了1,2两种方式,selenium IDE还可以生成代码,是一个强大的web测试工具。
  selenium学习网站
阅读(627) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~