专注 K8S研究
全部博文(348)
发布时间:2013-09-01 23:43:03
title:python 爬虫抓取心得分享0x1.urllib.quote('要编码的字符串')如果你要在url请求里面放入中文,对相应的中文进行编码的话,可以用:urllib.quote('要编码的字符串') query = urllib.quote(singername) url = 'http://music.baidu.com/search?key='+query response = urllib.urlopen(url) text = response.read(.........【阅读全文】
发布时间:2013-08-20 11:50:35
#!/usr/bin/env python#coding:utf-8from bs4 import BeautifulSoup import urllibimport re """结构分析 &nb.........【阅读全文】
发布时间:2013-07-31 11:34:54
BeautifulSoup是Python的一个第三方库,可用于帮助解析html/XML等内容,以抓取特定的网页信息。目前最新的是v4版本,这里主要总结一下我使用的v3版本解析html的一些常用方法。1.初始化 导入模块#!/usr/bin/env pythonfrom BeautifulSoup import BeautifulSoup  .........【阅读全文】