Chinaunix首页 | 论坛 | 博客
  • 博客访问: 2841355
  • 博文数量: 348
  • 博客积分: 2907
  • 博客等级: 中校
  • 技术积分: 2272
  • 用 户 组: 普通用户
  • 注册时间: 2010-03-12 09:16
个人简介

专注 K8S研究

文章分类

全部博文(348)

文章存档

2019年(22)

2018年(57)

2016年(2)

2015年(27)

2014年(33)

2013年(190)

2011年(3)

2010年(14)

发布时间:2013-09-01 23:58:42

python爬虫的三个版本: 1. 基于urllib, urllib2基于http请求响应的封装。有局限性,因为不能处理动态的脚本如js,一些操作无法实现。2. 内嵌webbrowser如pyqt的webkit,pamie, spynner(基于webkit)这种内嵌的方式类似于com调用,支持所有浏览器的操作,兼容性好,但不如urllib快捷。.........【阅读全文】

阅读(3444) | 评论(0) | 转发(1)

发布时间:2013-09-01 23:43:03

title:python 爬虫抓取心得分享0x1.urllib.quote('要编码的字符串')如果你要在url请求里面放入中文,对相应的中文进行编码的话,可以用:urllib.quote('要编码的字符串') query = urllib.quote(singername) url = 'http://music.baidu.com/search?key='+query response = urllib.urlopen(url) text = response.read(.........【阅读全文】

阅读(91650) | 评论(0) | 转发(1)

发布时间:2013-08-20 11:50:35

#!/usr/bin/env python#coding:utf-8from bs4 import BeautifulSoup import urllibimport re """结构分析           &nb.........【阅读全文】

阅读(8008) | 评论(1) | 转发(0)

发布时间:2013-07-31 11:34:54

    BeautifulSoup是Python的一个第三方库,可用于帮助解析html/XML等内容,以抓取特定的网页信息。目前最新的是v4版本,这里主要总结一下我使用的v3版本解析html的一些常用方法。1.初始化   导入模块#!/usr/bin/env pythonfrom BeautifulSoup import BeautifulSoup  .........【阅读全文】

阅读(1474) | 评论(0) | 转发(0)

发布时间:2013-07-08 13:41:37

......【阅读全文】

阅读(1504) | 评论(0) | 转发(0)
给主人留下些什么吧!~~

urgel_babay2016-05-11 11:05

转载了!仅作学习之用,谢谢

回复  |  举报

lkyuang2014-09-18 10:48

Echo "/usr/local/agent/sbin/zabbix_agentd -c /usr/local/agent/etc/zabbix_agentd.conf" >>/etc/tc.local


这个地方的开头 "Echo" 首字母不应该大写,  末尾的“tc.local”是不是打错了啊  “rc.local”

回复  |  举报

wgyzhechao2011-04-22 09:17

baby

回复  |  举报

蓝色虫2011-03-26 10:04

踩踩

回复  |  举报

iCymbidium2011-01-07 10:39

chinaboywg: 5年后CISSP早不值钱了
它要五年工作经验。。。那就看5年后啥好就考啥!O(∩_∩)O

回复  |  举报
留言热议
请登录后留言。

登录 注册