发布时间:2012-12-13 16:36:48
字符串编码常用类型:utf-8,gb2312,cp936,gbk等。python中,我们使用decode()和encode()来进行解码和编码在python中,使用unicode类型作为编码的基础类型。即 decode encodestr ---------> unicode --------->stru = u'中文' #显示指定unicode类型对象u str = u.enc......【阅读全文】
发布时间:2012-12-13 16:20:23
1. 中英文混合字串的统一编码表示中英文混合字串处理最省力的办法就是把它们的编码都转成 Unicode,让一个汉字与一个英文字母的内存位宽都是相等的。这个工作用 python 来做,比较合适,因为 python 内码采用的是 Unicode,并且为了支持 Unicode 字串的操作,python 做了一个 Unicode 内建模块,把 string 对象的全部方法重新实现了一遍,另外提供了 Codecs 对象,解决各种编码类型的字符串解......【阅读全文】