偷得浮生半桶水(半日闲), 好记性不如抄下来(烂笔头). 信息爆炸的时代, 学习是一项持续的工作.
全部博文(1750)
分类: 其他平台
2018-02-01 16:09:03
在linux系统下,以c语言程序为例来实现程序的国际化,即让程序根据Linux系统不同的语言环境的不同来显示出对应该语言的文字,即先让c程序支持国际化然后再进行本地化翻译。
Linux上实现这个过程需要用到xgettext和msgfmt这两个工具。
Xgettext 是国际化的工具,用来提取程序中的字符串,生成*.po或是*.pot的文件,
msgfmt是本地化的工具,用来编译翻译后的.po文件为.mo文件,这样系统在启动时候会扫描系统环境提取对应名字的.mo文件中的字符串替代原来的英文,实现本地化。
如我们来做一个简单的rpm包,包文件的目录树如下:
hello.c /*我们用来测试的c语言程序*/
po /zh_CN.po /*放在该包根目录下的po目录。对应于该程序进行的中文翻译*/
第一步、支持国际化的C程序(hello.c)如下:
先用下面的命令提取出c程序中需要进行本地化的语言文件。
[Lee@leedd.com hello]$ xgettext -k––keyword=_ hello.c -o hello.pot |
再用poedit或是vim翻译hello.pot中对应英文为中文并另存为zh_CN.po,作为中文本地化的翻译文件。
如下面翻译后的zh_CN.po文件的内容:
|
第三步、把翻译后的文件打包
制作rpm包相当于给源程序添加一个外衣,让用户很容易的安装、使用,而不用理会源程序的编译过程等细节。如果要进行rpmbuild我们需要先写个SPEC文件,如下:
Neoshine-hello-wrold.spec文件内容
已经有了源文件和SPEC文件后,需要把他们分别放在rpmbuild目录下对应的SOURCES和SPECS目录中,然后打包:
[Lee@leedd.com SPECS]$ rpmbuild -bs neoshine-hello-world.specWrote: /home/Lee/rpmbuild/SRPMS/neoshine-hello-world-5.0-1.src.rpm
[Lee@leedd.com SPECS]$ mock -r neoshine-5-i686––rebuild /home/Lee/rpmbuild/SRPMS/neoshine-hello-world-5.0-1.src.rpm |
本文用到的源程序: SOURCES源文件:neoshine-hello-world-5.0.tar.bz2 SPEC文件: neoshine-hello-world.spec 编译后的源码包:neoshine-hello-world-5.0-1.src.rpm
参考文章:
[1] Hello World
[2] Linux 国际化编程 http://riuliyu.blog126.fc2.com/blog-entry-20.html
[3] 认识下linux下程序的国际化(C语言实例)
http://swinging-breeze.blogspot.com/2009/05/linuxc.html(已经被墙)
用xgettext命令提取出来的.pot文件,修改和翻译后的.po文件内容如下:
GNU locale
locale被设计用来设定当前系统区域环境相关的信息来满足不同用户对国际化和本地化的需要,相关环境变量信息如下:
GNU gettext
gettext被设计用来实现国际化和本地化,通过gettext可以索引到字串的多国语言翻译,从而为国际化和本地化的字串显示提供基础。
Self-check
要理解test_helloworld.c里面相关locale和国际化相关API最好的方法就是亲自读一读glibc中的locale和intl相关目录下的src code,如setlocale.c、textdomain.c、bindtextdom.c、gettext.c等。多用man命令查一下这些命令或API,配合google和wikipedia
GetText是GNU的一个项目, 有最丰富的信息。下面大致翻译一下GetText主页的介绍 :
“通常,程序及其文档信息都是用英语语言写的,程序运行时同用户交互的信息也是英语。这是一个事实,不仅仅GNU的软件是这样,其他大部分私有软件或自由软件也是这样。一方面,对于来自所有国家的开发者、维护者和用户来说,相互沟通中使用一种通用的语言非常的方便。另一方面,相对于母语来说大多数人并不适应使用英语,而且他们的日常工作都是尽可能的使用他们自己的母语。多数人都会喜欢他们的计算机屏幕显示的英语更少,显示的母语更多。"
" GNU 的 'gettext' 是 GNU翻译项目的一个重要步骤,我们依赖于它来作很多其他的步骤。这个软件包给程序员、翻译者,或者用户提供了一套集成工具和文档。详细地说,GNU gettext 提供了一套工具,能让其他 GNU 软件创建多语言信息。..."
翻译真累!直接说汉语吧!
gettext的工作流程是这样的:比如我们写一个C程序,通常printf等输出信息都是English的。如果我们在程序中加入gettext支持,在需要交互的字符串上用gettext函数,程序运行是就可以先调用gettext函数处理字符串,替换当前的字符串了。注意是运行时替换。
一个简单的例子,
#include #include #include /*使用gettext通常使用类似下面的一个带函数的宏定义 *你完全可以不用,直接使用 gettext(字符串) */ #define _(S) gettext(S) /*PACKAGE是本程序最终的名字(运行时输入的命令)*/ #define PACKAGE "jian_gettext" int main(int argc, char **argv) { /* 下面三个参数都是使用gettext时候需要使用的 * setlocale * bindtextdomain * textdomain */ setlocale(LC_ALL,""); bindtextdomain(PACKAGE, "locale"); textdomain(PACKAGE); printf(_("Hello,GetText!\n")); return 0; }
1 头文件包含:
#include #include
2 定义宏定义(完全是为了方便,而且几乎所有程序都这样)
#define _(S) gettext(S)
3 设置locale和mo文件将要存放的路径,关联程序
setlocale(LC_ALL,""); bindtextdomain(PACKAGE, "locale"); textdomain(PACKAGE);
4 制作po文件(示例程序是:jian_gettext.c)
xgettext -a jian_gettext.c -o jian_gettext.po --from-code=utf-8
5 修改生成的 jian_gettext.po 文件,将下面行中的 CHARSET 换成 UTF-8
"Content-Type: text/plain; charset=CHARSET\n"
再翻译其中的string(其他的string不要改):
#: jian_gettext.c:14 #, c-format msgid "Hello,GetText!\n" msgstr "你好,GetText!\n"
6 生成mo文件,
msgfmt jian_gettext.po -o jian_gettext.mo
7 创建存放mo文件的目录,(例子使用./locale)
mkdir -pv locale/zh_CN/LC_MESSAGES/ cp -v jian_gettext.mo locale/zh_CN/LC_MESSAGES/
8 运行程序,你的程序应该是这样编译好的:
gcc -Wall -o jian_gettext jian_gettext.c
没有错误,上面的程序运行结果如下:
# ./jian_gettext 你好,GetText!
setlocale(LC_ALL,"") 的意思是使用环境变量(系统当前的值)
xgettext jian_gettext.c -k_ -o jian_gettext.po
msginit -l zh_CN -i jian_gettext.po
上面命令会生成 zh_CN.po 文件,可由此修改生成mo文件
一个开源项目中,通常有很多源文件,我们都需要翻译其中的字符串。通常步骤如下:
# intltool-update -m
得到一个文件列表告诉我应该把它们加入 POTFILES.in 文件.
xgettext -a -f po/POTFILES.in -o po/xxx.pot
我使用的一个示例:
# xgettext -k_ -f po/POTFILES.in -o po/mutter-moblin.pot --from-code="utf-8"
intltool-update —pot 生成 pot 文件intltool-update —maintain
创建po文件
创建并进入/po目录,创建POTFILES.in,内容为你需要提取源码中有需要翻译的字符串的源文件列表,每行一个文件,然后执行intltool-update —pot产生pot文件,如果将来你在维护代码中代码有变化或者在POTFILES.in中新增了源文件,可用intltool-update —maintain更新。
有了pot文件,现在需要产生各种语言的po文件,如msginit —locale=zh_CN产生中文po文件,如将来源文件有变化可以intltool-update zh_CN更新zh_CN.po,接下来翻译的工作就是你自己来做了。
要生成特定语言的mo文件,需要维护configure.ac中的ALL_LINGUAS,以空格分隔就可以了
首先,您必须声明一些允许 gettext 库为您的应用程序找到正确消息的名称。请注意,在现实的场景中,构建系统将为您处理这些名称,但是出于我们的需要,可以使用下面的名称:
GETTEXT_PACKAGE "foo-app"LOCALEDIR "mo"
在此之后,您必须正确地包含 gettext Header。完成该任务的最简单的方法是使用 GLib 提供的可用 Header(在 Versions 2.4 及更高版本中可用):
#include
这个 Header 为您提供了 () 和 N() 宏,用来标记可翻译的字符串,稍后您将看到。
现在,您必须以一种 gettext 可以识别并在运行时进行翻译的方式来标记用户可见的字符串。出于这两个目的,您可以使用 _() 宏,它是 gettext() 函数完整调用的简短别名。
gettext() 函数查找消息目录中提供的字符串,以判断对于当前语言,是否存在一个经过翻译的合适的版本。如果存在,它会返回翻译结果;否则,它会返回原始字符串。当您为源代码进行翻译准备工作时,在扫描过程中将单词 gettext 作为标记,以便提取要翻译的消息并将其放置到单独的文件中。
认识到了这一点,您就可以开始以不同的语言进行表达了。在程序开始执行之前,您必须初始化 gettext:
bindtextdomain (GETTEXT_PACKAGE, LOCALEDIR); bind_textdomain_codeset (GETTEXT_PACKAGE, "UTF-8"); textdomain (GETTEXT_PACKAGE);
现在,您可以使用 gettext() 调用来替换所出现的每个可以翻译的字符串。因此,下面的代码行形式:
gtk_label_set_markup(GTK_LABEL (label1), "Normal mode Foo, translated:");
变为:
gtk_label_set_markup(GTK_LABEL (label1), _("Normal mode Foo, translated:"));
这就是与此有关的全部内容,其中有两点例外之处。一个是不能在静态字符串中使用 gettext(),因为它是一个函数。在这种情况下,可以使用 N_() 宏,它不进行任何扩展,但会被作为对翻译内容进行标记的关键词。稍后在需要使用的地方,可以和前面一样使用 () 。
const char *msg = N_("Important message"); do_important_stuff(_(msg));
另一个例外是包含某个数值变量的情况,如检索的文件的数目。在这种情况下,可以使用 ngettext() 函数,它能够理解复数。GNU gettext 库手册中包含了该函数的细节信息,以及关于 gettext() 函数的使用和操作的细节信息。
最后,请正确地选择哪些内容应该翻译,哪些内容不应该翻译。通常,所有用户可见的字符串都是翻译工作的候选对象。然而,对于调试信息和其他面向开发人员的信息,可以保留其中的部分或所有内容不进行翻译,以使得您自己和其他开发人员能够理解并在源代码中对其进行查找。FooWidget 便是这种方式的一个示例(请参见下面的“自定义小部件”),它包含了一个模拟的调试模式,在该模式中 RTL 或者 LTR 标记都没有进行翻译。
与此类似,避免翻译那些不是真正的单词的内容。例如,不要翻译 TCP/IP 状态标记,即使它们最初来自于英语单词。这类错误几乎随处可见,例如,在Microsoft Windows 的网络工具中,类似 SYN_ACK 的内容被翻译 为毫无意义的波兰语 ZGODN_POTW。其结果是所有的人,包括说本族语的人,都被弄糊涂了,感到无法理解,甚至在 Internet 上查阅这样的信息。
#include #include { gtk_set_locale(); //bindtextdomain (PACKAGE, LOCALEDIR); //textdomain (PACKAGE); bindtextdomain ("test", "/usr/share/locale"); textdomain ("test"); gtk_init (&argc, &argv); ... gtk_window_set_title(GTK_WINDOW(dialog), _("hi")); ... }
#include #define GETTEXT_PACKAGE "test" #include { gtk_init (&argc, &argv); ... gtk_window_set_title(GTK_WINDOW(dialog), _("hi")); ... }
上述两种方法是一样的。第一种中 gi18n.h将为我们引用
#include
同时定义
#define _(String) gettext (String)
而第二中方法中gi18n-lib.h必须在我们定义了 GETTEXT_PACKAGE 宏之后才为我们定义
#define _(String) dgettext (GETTEXT_PACKAGE, String)
由于
gtk_init(); -->gtk_init_check() -->gtk_parse_args() -->gettext_initialization ()
gettext_initialization的代码实现:
static void gettext_initialization (void) { #ifdef ENABLE_NLS bindtextdomain (GETTEXT_PACKAGE, GTK_LOCALEDIR); bindtextdomain (GETTEXT_PACKAGE "-properties", GTK_LOCALEDIR); # ifdef HAVE_BIND_TEXTDOMAIN_CODESET bind_textdomain_codeset (GETTEXT_PACKAGE, "UTF-8"); bind_textdomain_codeset (GETTEXT_PACKAGE "-properties", "UTF-8"); # endif #endif }
mutter-moblin 已经有 i18n 架构了,只需要生成 po 文件,设置 lang,翻译po 就可以了。
直接修改 configure 也可以,但是不推荐。
# Substitute ALL_LINGUAS so we can use it in po/Makefile ALL_LINGUAS="zh_CN"
通常在 po/ 目录下创建一个文件 LINGUAS
echo zh_CN > po/LINGUAS
下面操作都在 po 目录下:
首先,更新 POTFILES.in 文件
[root@localhost po]# intltool-update --pot # 生成 mutter-moblin-netbook-plugin.pot [root@localhost po]# ll 总计 28 -rw-r--r-- 1 root root 6 06-18 01:03 LINGUAS -rw-r--r-- 1 1000 1000 6899 06-05 21:54 Makefile.in.in -rw-r--r-- 1 root root 8998 06-18 01:04 mutter-moblin-netbook-plugin.pot -rw-r--r-- 1 1000 1000 978 06-05 20:46 POTFILES.in
生成 zh_CN.po
[root@localhost po]# msginit --locale=zh_CN 新的翻译库应该包含您的电子邮件地址,这样用户就可以对您的翻译提出意见, 同时软件维护者也可以在出现技术问题时联络您。 Is the following your email address? root@localhost.localdomain Please confirm by pressing Return, or enter your email address. jian.li@turbolinux.com.cn A translation team for your language (zh) does not exist yet. If you want to create a new translation team for zh or zh_CN, please visit 已创建 zh_CN.po。
注意,上面创建的 zh_CN.po 文件是 gbk 编码,现在多用 UTF-8 编码。所以需要用下面命令创建(其实就是把 locale 参数的值 zh_CN 换成 zh_CN.utf8):
# msginit -l zh_CN.utf8
接下来翻译 po 文件。
翻译过程中通常有一些粗心的错误。需要检查:
msgfmt -c mutter-moblin-0.27.6/po/zh_CN.po