Chinaunix首页 | 论坛 | 博客
  • 博客访问: 104574613
  • 博文数量: 19283
  • 博客积分: 9968
  • 博客等级: 上将
  • 技术积分: 196062
  • 用 户 组: 普通用户
  • 注册时间: 2007-02-07 14:28
文章分类

全部博文(19283)

文章存档

2011年(1)

2009年(125)

2008年(19094)

2007年(63)

分类:

2008-03-26 19:17:37

作者:sunlan  出处:Unix爱好者家园unix-cd.com   


1.1.        编译libiconv
无论是OpenServer还是UnixWare,SCO的产品对于中文环境的支持都做得不是很好。虽然两者都提供了对iconv系列函数的实现,但能支持的字符集都相当有限,尤其是不能对gbk、gb18030等汉字字符集进行转换,给在XML中使用中文带来了困难。
为此,在libxml2库编译的过程中必须使用外带的iconv库替代操作系统所自带的iconv库。我所用的iconv支持库是libiconv-1.10。这个库的源代码能从下面链接下载:

当然,也可以使用其他版本的libiconv库。
除提供对西欧字符集的支持外,libiconv库还提供了对各种亚洲字符集(包括汉字、日文、韩文)的支持:
Chinese 
EUC-CN, HZ, GBK, GB18030, EUC-TW, BIG5, CP950, BIG5-HKSCS, ISO-2022-CN, ISO-2022-CN-EXT 
Japanese 
EUC-JP, SHIFT_JIS, CP932, ISO-2022-JP, ISO-2022-JP-2, ISO-2022-JP-1 
Korean 
EUC-KR, CP949, ISO-2022-KR, JOHAB 
libiconv的编译过程很简单。首先,将源码包解压、解包,缺省解包后的路径为libiconv-1.10。进入libiconv-1.10目录,执行
        ./configure --enable-static=yes
增加”—enable-static=yes”选项是为了生成静态库。完成配置后,执行make编译libiconv库。
完成编译后,可以通过”make install”命令安装libiconv环境。
1.2.        编译libxml2
最新版本libxml2的源代码可以从获得。此处所使用的版本为libxml2 2.6.19。
在编译前需要定义环境变量LD_LIBRARY_PATH,将libiconv.a所在的目录加入到环境变量中。这是因为libxml2的configure配置脚本是从LD_LIBRARY_PATH所定义的路径中搜索libiconv.a,至于libiconv是静态库还是动态库倒没有关系。
其次,在SCO OpenServer下编译libxml2时,由于OpenServer的系统头文件没有定义PATH_MAX,需要在testModule.c中手工增加PATH_MAX的定义:
   #ifndef PATH_MAX
    #ifdef _POSIX_PATH_MAX
    #define PATH_MAX _POSIX_PATH_MAX
    #else
    #define PATH_MAX 255
    #endif
    #endif
PATH_MAX的值也可以定义为1024或其它的值,但应注意不要超过系统上限。
在UnixWare下不需要自己定义PATH_MAX。
接下去是运行configure配置脚本。在做这一步操作时必须要使脚本正确地找到libiconv的位置。有几种不同的方法可以供采用:
方法一:
./configure --with-iconv=/home/test/libiconv-1.10
其中”--with-iconv”用于指定iconv的源代码的存放目录,我们在这里假定/home/test/libiconv-1.10。需要注意的是这一目录必须使用绝对路径,否则编译时可能会出错。
方法二:
        ./configure CFLAGS=”-I/home/test/include”
        或者先设置环境变量CFLAGS=”-I/home/test/include”,然后直接执行
        ./configure
其中/home/test/include是libiconv的头文件iconv.h所在的目录。
以上两种方法的实质都是要找到正确的liniconv的头文件和支持库,用于替换系统自带的iconv。
configure完成环境配置后需要注意提示的信息中是否有以下信息:
   checking for iconv.h... yes
    checking for iconv... no
    checking for iconv in -liconv... yes
其中1、3行必须为”yes”,否则说明未能正确地找到iconv。第二行无关紧要。
接下去的工作就是执行make了。通过前面所说的几步操作,一般情况下都能正常完成编译过程。
1.3.        编译后的验证
我们的目标是获得能支持中文编码的xml支持库,因此测试的重点也主要放在对中文编码的xml文件上。
首先,运行libxml2自带的测试程序testapi,用于测试libxml2提供的函数的可用性。在使用SCO Openserver自带的iconv时,testapi程序会因为无法进行字符集转换而报许多错误;在使用libiconv替换后可以正常的通过测试。
第二,使用xmllint进行xml文件解析。xmllint是编译libxml2时得到的“副产品”。
手工创建一个xml文件(假设名称为a.xml),内容如下:

测试数据
执行xmllint a.xml。正常的情况下应该能显示xml文件的内容。然后把xml文件中的encoding改为utf8,再次执行xmllint,会出现下面的提示:
a.xml:2: parser error : Input is not proper UTF-8, indicate encoding !
Bytes: 0xB2 0xE2 0xCA 0xD4
测试数据
这就说明编译出的程序确实能支持中文编码。
最后,自己写程序验证。参照libxml2提供的示例,最简单的程序基本如下:
xmltest.c:
#include 

#include "libxml/parser.h"
#include "libxml/tree.h"

main( int argc, char **argv )
{
    xmlDocPtr doc;

    if( (doc = xmlReadFile( argv[1], NULL, 0)) == NULL )
    {
        printf( "error!\n" );
        exit( -1 );
    }

    printf( "OK!\n" );

    xmlCleanupParser();

    exit( 0 );

}
cc –belf –o xmltest xmltest.c –I/home/test/include –L/home/test/lib –lxml2 –liconv –lm –lsocket
编译成功后执行xmltest a.xml,并重复类似xmllint所做的测试。当然,也可以编写更全面的测试程序进行测试。
阅读(622) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~