python抓取[中文网页][乱码]解决-kevin33643-ChinaUnix博客

Chinaunix首页 | 论坛 | 博客

kevin33643kevin33643.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

博客访问： 1190706
博文数量： 241
博客积分： 4385
博客等级：上校
技术积分： 2383
用户组：普通用户
注册时间： 2009-06-07 23:13

文章分类

全部博文（241）

Ruby（2）
Cario（1）
Security（1）
Windows（13）
Java（1）

java基础（1）
Web（2）

php（0）

tcp/ip（1）
Python（17）

python学习（4）

python算法（1）

python程序（10）
IT综合（13）

软件开发（1）

IT杂文（3）

软件工程（3）

IT评论（5）
Mobile（17）

mobile评论（2）

android程序（2）

android开发（9）
一些好文（5）
看过滴书（11）

程序员面试宝典（7）

你必须知道的495（1）

C专家编程（3）
Linux（104）

kernel（4）

虚拟机（11）

script（4）

shell（6）

系统（6）

vim（19）

git（3）

grub（4）

命令（18）

使用（16）

工具（4）

linux转载（5）
通信（5）

通信为什么？（1）

通信转载（1）
C++面试编程（1）
C++编程基础（6）
C编程基础（9）
C面试编程（33）

经典算法（4）

字符串（9）

基本算法（7）

排序算法（6）

数据结构（7）
未分配的博文（0）

文章存档

2013年（1）

2012年（8）

2011年（62）

2010年（109）

2009年（61）

我的朋友

最近访客

推荐博文

相关博文

python抓取[中文网页][乱码]解决

分类： Python/Ruby

2010-12-24 13:40:49

本来是最最简单的抓取中文网页的两行代码，但是中文总是显示不出来，baidu,google了一番也没有找到完全可行的方法，继续瞎折腾，最后居然搞出来了！

#!/usr/bin/env python # -*- coding:utf8 -*- import urllib2 req = urllib2.Request("") res = urllib2.urlopen(req) html = res.read() res.close() html = unicode(html, "gb2312").encode("utf8") print html

阅读(16495) | 评论(0) | 转发(0) |

0

上一篇：vim处理字符的大小写转换

下一篇：python抓取[天气信息]

给主人留下些什么吧！~~

关于我们 | 关于IT168 | 联系方式 | 广告合作 | 法律声明 | 免费注册

Copyright 2001-2010 ChinaUnix.net All Rights Reserved 北京皓辰网域网络信息技术有限公司. 版权所有

感谢所有关心和支持过ChinaUnix的朋友们