Chinaunix首页 | 论坛 | 博客
  • 博客访问: 176438
  • 博文数量: 29
  • 博客积分: 1445
  • 博客等级: 上尉
  • 技术积分: 295
  • 用 户 组: 普通用户
  • 注册时间: 2006-07-25 10:39
文章分类

全部博文(29)

文章存档

2016年(4)

2015年(2)

2012年(1)

2010年(2)

2008年(3)

2007年(10)

2006年(7)

我的朋友

分类: LINUX

2007-03-06 13:46:34

症状:

使用unzip解压缩在ms windows平台上用winzip压缩的zip文件,如果其中含有中文文件名,结果会出现乱码,而且用convmv转换文件名编码方式也无法解决问题。


分析:

参考这篇文章 ,原因是unzip试图将zip文件中用 oem(ibm-dos) codepage 编码的文件名转换成自己的内部编码。可惜unzip只能转换极少数几种codepage,中文的 cp936 不在其列。


解决办法:

参考文章的作者廖中熙将 unzpriv.h 中 Ext_ASCII_TO_Native 宏中的判断去掉,不管是否为oem codepage,全部用 _ISO_INTERN((string))来转换到内部编码。

我观察到unzip源代码这段开始的地方有判断
#ifndef Ext_ASCII_TO_Native ,这样问题似乎更简单了,不用改源代码,只需在make时定义 Ext_ASCII_TO_Native 即可,这样 Ext_ASCII_TO_Native 实际为一个空的宏,不进行任何转换操作。比如,使用下面的方法编译

$make -D
Ext_ASCII_TO_Native

或者在bash执行下面两行

$export LOCAL_UNZIP=-D
Ext_ASCII_TO_Native
$make

结果:

unzip解压缩含中文文件名zip包是出现乱码的问题解决!
阅读(10942) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~