全部博文(2065)
分类: Python/Ruby
2010-04-17 11:17:10
>>> import urllib
>>> urlread = lambda url: urllib.urlopen(url).read()
>>> import chardet
>>> chardet.detect(urlread(""))
{'encoding': 'GB2312', 'confidence': 0.99}
非常方便。
比如我现在想要打开一个文档然后看一下这个文档的编码就可以使用这个工具了。而且在呆会的网络爬虫工具的制作的
过程中也会应用到!