Chinaunix首页 | 论坛 | 博客
  • 博客访问: 26278376
  • 博文数量: 2065
  • 博客积分: 10377
  • 博客等级: 上将
  • 技术积分: 21525
  • 用 户 组: 普通用户
  • 注册时间: 2008-11-04 17:50
文章分类

全部博文(2065)

文章存档

2012年(2)

2011年(19)

2010年(1160)

2009年(969)

2008年(153)

分类: Python/Ruby

2010-04-17 11:17:10

推荐一款好的编码探测工具。
官网:
下载之后python setup.py install 安装
使用示例:
>>> import urllib
>>> urlread = lambda url: urllib.urlopen(url).read()
>>> import chardet
>>> chardet.detect(urlread(""))
{'encoding': 'GB2312', 'confidence': 0.99}

非常方便。

比如我现在想要打开一个文档然后看一下这个文档的编码就可以使用这个工具了。而且在呆会的网络爬虫工具的制作的
过程中也会应用到!

阅读(490) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~