Chinaunix首页 | 论坛 | 博客
  • 博客访问: 337506
  • 博文数量: 148
  • 博客积分: 2745
  • 博客等级: 少校
  • 技术积分: 1704
  • 用 户 组: 普通用户
  • 注册时间: 2010-03-30 14:59
文章分类

全部博文(148)

文章存档

2013年(97)

2012年(7)

2011年(3)

2010年(41)

我的朋友

分类: Python/Ruby

2013-01-31 22:56:25

上次写了一个关于python下载网页的教程,今天想和大家聊另外一个的库:
很多网页处理都可以用urllib这个标准库来处理,下面我分享下平时用到的关于urllib方面的内容:

1如果你要在url请求里面放入中文,对相应的中文进行编码的话,可以用:
urllib.quote('要编码的字符串')

2如果你请求对方的网页,确不想被封IP的话,这个时候就要用到代理了,其实用urllib代理还是比较简单的:

proxies = {'http': '代理ip'}
opener = urllib.FancyURLopener(proxies)
f = opener.open("")
f.read()

3 如果在GET需要一些参数的话,那我们需要对传入的参数进行编码。

params = urllib.urlencode({'spam': 1, 'eggs': 2, 'bacon': 0})
f = urllib.urlopen("%s" % params)
print f.read()

想了解更多关于urllib方面的知识,可以多用用help命令来查看。
阅读(873) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~