Chinaunix首页 | 论坛 | 博客
  • 博客访问: 833661
  • 博文数量: 125
  • 博客积分: 4066
  • 博客等级: 上校
  • 技术积分: 1401
  • 用 户 组: 普通用户
  • 注册时间: 2010-03-03 18:58
文章分类

全部博文(125)

文章存档

2014年(1)

2013年(1)

2012年(2)

2011年(29)

2010年(92)

我的朋友

分类: LINUX

2010-06-29 16:55:09

函数 bindtextdomain 的作用是通过给定的 domain 查找路径,可用信息的路径被指定为:

dirname/locale/category/domainname.mo

dirname 即为参数 dirname,若参数 dirname 为 NULL,则函数返回程序当前路径值 ( 默认是 /usr/share/locale),若 dirname 值为 "",则返回值为空。locale 即为 locale 名字,category 是 locale 的分类,如 LC_MESSAGES 等。domainname 即为参数 domainname。函数 bind_textdomain_codeset 的功能与 bindtextdomain 相近,因此 glibc 在实现时采用了一个内部函数 set_binding_values 并通过对该函数输入参数的控制分别实现以上 2 个函数。




/* intl/bindtextdom.c */
static void
set_binding_values (domainname, dirnamep, codesetp)
const char *domainname;
const char **dirnamep;
const char **codesetp;
{ ... }

/* 函数 bindtextdomain */
char *
BINDTEXTDOMAIN (domainname, dirname)
const char *domainname;
const char *dirname;
{
set_binding_values (domainname, &dirname, NULL);
return (char *) dirname;
}

/* 函数 bind_textdomain_codeset */
char *
BIND_TEXTDOMAIN_CODESET (domainname, codeset)
const char *domainname;
const char *codeset;
{
set_binding_values (domainname, NULL, &codeset);
return (char *) codeset;
}

另外,还有一个可访问 locale 相关信息的重要函数 nl_langinfo,该函数定义于头文件 langinfo.h 中,其作用是通过给定的 item 返回与 locale 相关的信息。




#include
char *nl_langinfo(nl_item item);

/* locale/nl_langinfo.c */
char *
nl_langinfo (item)
nl_item item;
{
return __nl_langinfo_l (item, _NL_CURRENT_LOCALE);
}





通过以上的描述我们大致了解了 Linux 对国际化和本地化的支持,下面我们编写一个获取当前系统时间的小程序来更好的理解函数 setlocale 对整个程序的影响 ( 见 清单 12)。




#include
#include
#include

#define SIZE 80

int main (int argc, char *argv[])
{
time_t now;
struct tm *timeinfo;
struct lconv *lc;
char buffer[SIZE];

setlocale (LC_ALL, "");
printf ("LC_TIME = %s\n", setlocale (LC_TIME, NULL));
printf ("LC_MONETARY = %s\n", setlocale (LC_MONETARY, NULL));

time (&now);
timeinfo = localtime (&now);

strftime (buffer, SIZE, "%c", timeinfo);
printf ("Date : %s\n", buffer);

lc = localeconv();
printf ("Currency symbol : %s\n", lc->currency_symbol);

return 0;
}

$ gcc -Wall locale-time.c -o locale-time
$ LC_ALL=zh_CN.UTF-8 ./locale-time
LC_TIME = zh_CN.UTF-8
LC_MONETARY = zh_CN.UTF-8
Date : 2009 年 11 月 05 日 星期四 19 时 47 分 46 秒
Currency symbol : ¥

清单 12 中,我们不仅展示了 setlocale 函数的 "" 和 NULL 这两个特殊参数值的使用,还使用了 lconv 这个数据结构用于打印与区域相一致的货币符号 (lconv 这个有关数字和货币规则信息的结构体及相关函数 localeconv 被定义在头文件 locale.h 中,与 locale 中的 LC_NUMERIC 和 LC_MONETARY 相关 )。在程序执行时,我们动态的修改了 locale 环境变量的值以此来更好的观察 setlocale 函数对程序的影响 ( 如前述使用 date 命令时一样,见 清单 5)。在没有调用函数 setlocale 的程序中,程序将使用默认环境值 "C" 或 "POSIX"。由于我们在上面提过 glibc 提供了两组不同的接口实现程序的国际化和本地化,为了更好的理解这两种方式,我们在下面分别进行展示 ( 见 清单 13清单 15)。




#include
#include
#include

#define PACKAGE "gettext-hello"
#define LOCALEDIR "po"
#define N_(msgid) gettext(msgid)

int main (int argc, char *argv[])
{
setlocale (LC_CTYPE, "zh_CN.UTF-8");
setlocale (LC_MESSAGES, "zh_CN.UTF-8");

bindtextdomain (PACKAGE, LOCALEDIR);
textdomain (PACKAGE);

/* Translators: 这里仅是一个注释 */
printf (N_("Are you ok?\n"));

return 0;
}

我们指定使用 locale 名字为 "zh_CN.UTF-8" 以此方便我们建立目录进行测试,但是更通常的做法是使用 "" 作为参数值使程序适应不同的语言 ( 区域 ) 环境。另外,我们需要为这个简单的程序做一个翻译,并生成一个可用的二进制翻译文件。我们使用由 GNU gettext 提供的工具 xgettext 及 msgfmt 来完成翻译档的生成,但这仅是用于制作、维护 PO (Portable Object) 和 MO (Machine Object) 文件的部分工具集 ( 见 清单 14)。




$ xgettext --add-comments --keyword=N_ gettext-hello.c -o \
> gettext-hello.pot --from-code=UTF-8
$ cp gettext-hello.pot gettext-hello.po
$ cat locale-hello.po
...
"Content-Type: text/plain; charset=UTF-8\n"
"Content-Transfer-Encoding: 8bit\n"
...
#. Translators: 这里仅是一个注释
#: locale-hello.c:23
msgid "Are you ok?\n"
msgstr "你还好吗? \n"

$ mkdir -p po/zh_CN.UTF-8/LC_MESSAGES/
$ msgfmt gettext-hello.po -o gettext-hello.mo
$ mv gettext-hello.mo po/zh_CN.UTF-8/LC_MESSAGES/
$ gcc -Wall gettext-hello.c -o gettext-hello
$ LC_ALL=zh_CN.UTF-8 ./ gettext-hello
你还好吗?




#include
#include
#include

#define CATALOG_NAME "catgets-hello.cat"

int main (int argc, char *argv[])
{
nl_catd catd;
setlocale (LC_ALL, "");
printf ("LC_MESSAGES = %s\n", setlocale (LC_MESSAGES, NULL));

catd = catopen (CATALOG_NAME, NL_CAT_LOCALE);
if(catd == (nl_catd) -1) {
perror("catopen");
return 1;
}

int set_no=11;
int msg_id=14;
printf("%s\n", catgets (catd, set_no, msg_id, "Are you OK?"));

if(catclose(catd) < 0) {
perror ("catclose");
return 1;
}

return 0;
}

我们在 catgets 示例代码中加上了错误处理,但这仅是为了更好的展示。通常情况下这是不需要的,因为我们应尽量使程序运行下去而不是中断。在编辑完程序所需的翻译档后,我 们执行这个简单的 catgets 示例 ( 见 清单 16)。




$ cat catgets-hello.msg
...
$set 11
14 你还好吗?
15 I am fine,thanks.
...

$ gencat catgets-hello.msg -o catgets-hello.cat
$ mv catgets-hello.cat po/zh_CN.UTF-8/LC_MESSAGES/
$ gcc -Wall catgets-hello.c -o catgets-hello
$ export NLSPATH=po/%L/LC_MESSAGES/%N
$ LC_ALL=zh_CN.UTF-8 ./ catgets-hello
LC_MESSAGES = zh_CN.UTF-8
你还好吗?

我们使用命令 gencat 生成程序所需的二进制翻译档并通过 NLSPATH 指定该文件存放的位置。若不指定该变量,默认的位置将会是如下所示。

[1] prefix/share/locale/%L/%N 
[2] prefix/share/locale/%L/LC_MESSAGES/%N

其中 %L 用于指定 locale 名字,%N 为文件名。对于上面几个示例及命令,更好的执行方式是通过 strace 等调试工具进行跟进,这不仅能熟悉相关函数的作用,并可更好的理解 Linux 国际化与本地化机制。





我们从国际化与本地化的概念深入到 Linux 实现国际化与本地化机制的 glibc 源码,并尝试从多个角度理解 Linux 上的国际化与本地化机制的运作,最后我们还编写了一些示例,但仍有一些内容被我们忽略,如多语言化、X Window 系统的国际化环境等。另外,一个值得关注的项目是 uClibc,它是一个为嵌入式 Linux 设计的 C 库,相比于 glibc 小巧许多但功能及实现上稍有差异。

阅读(2626) | 评论(0) | 转发(0) |
0

上一篇:bindtextdomain 函数

下一篇:strrchr 函数

给主人留下些什么吧!~~