Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1157832
  • 博文数量: 241
  • 博客积分: 4385
  • 博客等级: 上校
  • 技术积分: 2383
  • 用 户 组: 普通用户
  • 注册时间: 2009-06-07 23:13
文章分类

全部博文(241)

文章存档

2013年(1)

2012年(8)

2011年(62)

2010年(109)

2009年(61)

分类: Python/Ruby

2010-12-24 13:40:49

本来是最最简单的抓取中文网页的两行代码,但是中文总是显示不出来,baidu,google了一番也没有找到完全可行的方法,继续瞎折腾,最后居然搞出来了!
 

#!/usr/bin/env python
# -*- coding:utf8 -*-

import urllib2

req = urllib2.Request("")
res = urllib2.urlopen(req)
html = res.read()
res.close()

html = unicode(html, "gb2312").encode("utf8")
print html


阅读(16460) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~