Chinaunix首页 | 论坛 | 博客
  • 博客访问: 972454
  • 博文数量: 403
  • 博客积分: 27
  • 博客等级: 民兵
  • 技术积分: 165
  • 用 户 组: 普通用户
  • 注册时间: 2011-12-25 22:20
文章分类

全部博文(403)

文章存档

2016年(3)

2015年(16)

2014年(163)

2013年(222)

发布时间:2014-03-21 11:30:22

title:python 爬虫抓取心得分享0x1.urllib.quote('要编码的字符串')如果你要在url请求里面放入中文,对相应的中文进行编码的话,可以用:urllib.quote('要编码的字符串') query = urllib.quote(singername) url = 'http://music.baidu.com/search?key='+query response = urllib.urlopen(url) text = response.read(.........【阅读全文】

阅读(4878) | 评论(0) | 转发(0)

发布时间:2014-03-21 11:28:46

写了那么多篇找工作的文章,再写几篇就完了,也算是对自己一段时间的一个总结。近来发现自己博客上python技术点的文章有点少,为了防止自己总是遗忘,还是写出来的好。前几天刚看完《Linux/Unix设计思想》,真是一本不错的书,推荐想提高自己代码质量的童鞋看一下,里面经常提到要以小为美,一个程序做好一件事,短小精悍.........【阅读全文】

阅读(779) | 评论(0) | 转发(0)

发布时间:2014-03-21 09:52:43

首先推荐一个网站:中医世家,这个网站上有很多关于中医的资料,光是提供的中医书籍就有317Mb,全都是CHM格式,资料非常全面。  正因为这个网站有这么多的好东西,但是我又懒得一本书一本书的下载,所以,我就……用Python直接解析了几个书籍下载页面的地址,把所有的书籍的下载地址都弄到手,顺便还下载了,呵呵呵,.........【阅读全文】

阅读(770) | 评论(0) | 转发(0)

发布时间:2014-03-21 09:52:13

#-*- coding:UTF-8 -*-import urllib,urllib2,cookielibimport xml.etree.ElementTree as etree #xml解析类class Login163:   #伪装browser    header = {'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT .........【阅读全文】

阅读(2991) | 评论(0) | 转发(0)

发布时间:2014-03-21 09:46:27

python爬虫的三个版本: 1. 基于urllib, urllib2基于http请求响应的封装。有局限性,因为不能处理动态的脚本如js,一些操作无法实现。2. 内嵌webbrowser如pyqt的webkit,pamie, spynner(基于webkit)这种内嵌的方式类似于com调用,支持所有浏览器的操作,兼容性好,但不如urllib快捷。.........【阅读全文】

阅读(666) | 评论(0) | 转发(0)
给主人留下些什么吧!~~
留言热议
请登录后留言。

登录 注册