这么多年过去了,python在处理gbk、gb2312的xml仍然没有进步,仍然会出现xml.parsers.expat.ExpatError: unknown encoding: line 1, column 30
现在将处理方法记录如下:
先将xml中的gbk或gb2312替换为utf-8,然后再做unicode转换
data ='hello world'
strXML = data.replace("GB2312","utf-8")
strXML = unicode(strXML,encoding='GB2312').encode('utf-8')
阅读(2612) | 评论(0) | 转发(0) |