本来是最最简单的抓取中文网页的两行代码,但是中文总是显示不出来,baidu,google了一番也没有找到完全可行的方法,继续瞎折腾,最后居然搞出来了!
#!/usr/bin/env python # -*- coding:utf8 -*-
import urllib2
req = urllib2.Request("") res = urllib2.urlopen(req) html = res.read() res.close()
html = unicode(html, "gb2312").encode("utf8") print html
|
阅读(16460) | 评论(0) | 转发(0) |