xml这个东西早早的就听说了,也看过关于它的一些资料,可是实际当中还没有怎么接触过,现在的这个项目算是第一次来接触xml. 在这个项目里面,页面上面的文字标签都是存放在xml文件里面的,我们需要做的一个事情就是要把原来的英文翻译成中文。这里就涉及到了文件编码问题,貌似xml文件都得是utf-8的编码方式,而我们在实际当中发现经常注意不到编码方式,如今天发现一个页面打开有问题,怀疑是xml文件编码的问题。于是使用UE来打开这个xml文件发现其提示的编码方式是DOS而不是U8-DOS, 于是把这个文件另存为UTF-8的编码方式并将文件上传到服务器上,清一下缓存,重新打开该页面后一切正常。
现在有一个问题,我想有没有一种很快速的方法来判断一下服务器上面所有的xml文件是否都是utf-8的编码,我们的服务器是AIX的,比较笨的方法是,把所有的xml文件下载到windows的机器上,然后通过UE打开并查看是否有某个xml文件的编码不是U8-DOS的。或者还有一种方法,我们知道可以用浏览器打开xml文件,如果该文件里面含有非UTF-8编码的字符,则浏览器是无法正常打开xml文件的。
对于一个已经知道其文件编码为非UTF-8的文件,比如是GB18030的文件,我们可以通过下面的命令将其转换成UTF-8的编码
iconv -f GB18030 -t UTF-8 FrmRiskMapDimE_gb.xml > FrmRiskMapDimE.xml
但是这里注意:
在AIX上,需要安装对应的语言包,方可正常进行编码转换。其中UTF-8用到的语言包:UTF-8 Chinese
(Simplified UTF) [ZH_CN];GBK用到的语言包:GB18030 S-Chinese (GB18030)
[Zh_CN]。
注意:使用的编码code对应为:UTF-8和GB18030。
转换的问题其实不大,关键是我如何确认其中某个xml文件是否是采用UTF-8的编码格式的?
待补充...
阅读(1484) | 评论(0) | 转发(0) |