python 爬虫抓取心得分享 _qxhgd-ChinaUnix博客

嵌入式Linux点滴

首页　| 　博文目录　| 　关于我

qxhgd

博客访问： 1000006
博文数量： 403
博客积分： 27
博客等级：民兵
技术积分： 165
用户组：普通用户
注册时间： 2011-12-25 22:20

文章分类

全部博文（403）

私人（0）
内核（21）
Android（0）
Java（2）
用户态编程（48）
Linux驱动（33）
Linux网络（42）
脚本语言（48）
乱（91）
面试笔试题（8）
Linux嵌入式（28）
Linux操作（9）
未分配的博文（73）

文章存档

2016年（3）

2015年（16）

2014年（163）

2014年12月（2）
2014年11月（6）
2014年10月（3）
2014年09月（3）
2014年08月（7）
2014年07月（21）
2014年06月（27）
2014年05月（20）
2014年04月（20）
2014年03月（18）
2014年02月（11）
2014年01月（25）

2013年（222）

我的朋友

最近访客

推荐博文

python 爬虫抓取心得分享

发布时间：2014-03-21 11:30:22

title:python 爬虫抓取心得分享0x1.urllib.quote('要编码的字符串')如果你要在url请求里面放入中文，对相应的中文进行编码的话，可以用:urllib.quote('要编码的字符串') query = urllib.quote(singername) url = 'http://music.baidu.com/search?key='+query response = urllib.urlopen(url) text = response.read(.........【阅读全文】

阅读(4893) | 评论(0) | 转发(0)

python使用urllib2抓取防爬取链接

发布时间：2014-03-21 11:28:46

写了那么多篇找工作的文章，再写几篇就完了，也算是对自己一段时间的一个总结。近来发现自己博客上python技术点的文章有点少，为了防止自己总是遗忘，还是写出来的好。前几天刚看完《Linux/Unix设计思想》，真是一本不错的书，推荐想提高自己代码质量的童鞋看一下，里面经常提到要以小为美，一个程序做好一件事，短小精悍.........【阅读全文】

阅读(801) | 评论(0) | 转发(0)

python利用beautifulsoup自动下载中医世家网站电子书

发布时间：2014-03-21 09:52:43

首先推荐一个网站：中医世家，这个网站上有很多关于中医的资料，光是提供的中医书籍就有３１７Mb，全都是CHM格式，资料非常全面。　　正因为这个网站有这么多的好东西，但是我又懒得一本书一本书的下载，所以，我就……用Python直接解析了几个书籍下载页面的地址，把所有的书籍的下载地址都弄到手，顺便还下载了，呵呵呵，.........【阅读全文】

阅读(806) | 评论(0) | 转发(0)

python模拟登陆163邮箱并获取通讯录

发布时间：2014-03-21 09:52:13

#-*- coding:UTF-8 -*-import urllib,urllib2,cookielibimport xml.etree.ElementTree as etree #xml解析类class Login163: #伪装browser header = {'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT .........【阅读全文】

阅读(3013) | 评论(0) | 转发(0)

python版爬虫

发布时间：2014-03-21 09:46:27

python爬虫的三个版本： 1. 基于urllib, urllib2基于http请求响应的封装。有局限性，因为不能处理动态的脚本如js，一些操作无法实现。2. 内嵌webbrowser如pyqt的webkit,pamie, spynner(基于webkit)这种内嵌的方式类似于com调用，支持所有浏览器的操作，兼容性好，但不如urllib快捷。.........【阅读全文】

阅读(687) | 评论(0) | 转发(0)

给主人留下些什么吧！~~

留言热议

请登录后留言。

登录注册

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6