偷得浮生半桶水(半日闲), 好记性不如抄下来(烂笔头). 信息爆炸的时代, 学习是一项持续的工作.
全部博文(1748)
分类: Android平台
2017-06-05 10:36:41
Tegaki是一款开源的手写输入法,可以运行在Windows、Mac OS X和UNIX/Linux上。可以参见其项目主页。本文主要介绍如何在Ubuntu 11.04(Linux发行版之一)中安装。
本文是本人实践安装Tegaki的产物,可能并不适用于读者,但我希望本文能为读者提供参考。本文提供的知识不一定正确。
有个知识要先讲。UNIX/Linux上的手写输入法一般由3个组件组成,一是界面GUI,二是引擎(Engine),三是模式文件(Model)。模式文件是中文日文韩文等某种语言里每个字的信息。识别一个字的过程是,GUI接收笔画输入,把笔画输入传给引擎处理,引擎在模式文件里找到匹配的字。一个模式文件可能只能被一种特定的引擎处理。于是,一款手写输入法所能识别的字符集不受限制:只要你有(可以被该输入法支持的引擎处理的)中文的模式文件,就能手写识别中文;有藏文的模式文件,就能手写识别藏文。所以,要令手写输入法能工作,要下载GUI、引擎和中文模式文件(对咱们中国人来说)。
回来了,现在讲Tegaki。它支持两种引擎,zinnia和wagomu。所以在其主页,你选某一种引擎下载即可,但请记住你的选择。(如下图)
还有,在Ubuntu系统中,输入法框架是ibus,所以不要安装scim-tegaki。除最后一项(tegaki-tools)外,其余没提到的的项目都下载下来。
把你带到zinnia的主页,你要下载Zinnia和Zinnia Recognition models——Zinnia-Tomoe。在,下载zinnia和zinnia-tomoe的最新版本;而不要下载zinnia-win32,这是给windows用的。
tegaki-python、tegaki-pygtk、tegaki-recognize、ibus-tegaki、tegaki-train都比较好装。重点是要看各目录下面的README文件!然后装引擎。
如果选zinnia引擎,就参照的说明:
% tar zxfv zinnia-X.X.tar.gz
% cd zinnia-X.X
% ./configure
% make
% sudo make install
% tar jxfv zinnia-tomoe-XXXX.tar.bz2
% cd zinnia-tomoe-XXXX
% ./configure
% make
% sudo make install
但我在安装tomoe时遇到了
/usr/local/bin/zinnia_convert: error while
loading shared libraries: libzinnia.so.0: cannot open shared object
file: No such file or directory
make: *** [handwriting-ja.model] 错误 127
遂没有成功。
如果选wagomu引擎,解压以后读README文件,到里面说先compile(编译)再install(安装),就照它说的做。
因为我装zinnia失败了,wagomu装上了,所以我下载上对应于wagomu引擎的model。
Engine | Name | Comment |
zinnia | ||
zinnia | Smaller and faster but less accurate | |
zinnia | Primary school level kanji only | |
zinnia | Commonly used kanji only | |
zinnia | ||
zinnia | Smaller and faster but less accurate | |
zinnia | ||
zinnia | Smaller and faster but less accurate | |
wagomu | ||
wagomu | Primary school level kanji only | |
wagomu | Commonly used kanji only | |
wagomu |
安装模式文件也要看README!
之后,重启计算机,在屏幕顶上靠右约1/4处有个键盘图标,点击它。得到如下图界面后点击选择输入法,其他|tegaki。(下图的输入法列表里已经有了“其他-tegaki”是因为我事先已经添加过了。)
测试了一下,wagomu识别率不高,没有早先微软拼音的那个好用。我下载了tegaki-train,在终端里输入tegaki-train,打开图形界面,(远程用ssh或telnet打开要失败的),企图训练一下wagomu——完善模式文件。可见4.2节。
tegaki-train打开后,要新建或打开一个字符集文件,字符集文件包含好多字符,这些字符显示在左边的框里。每个字都要定义一组模式,一个模式就是该字的所有笔画的位置。一个字的模式越多,识别到该字的几率越高。另外,你可以字是“牛”,但模式里输入“逼”;于是你手写“逼”,软件会认为这是“牛”。
但是tegaki-train很不完善!左边添加一个汉字——它说要输入Unicode,那好——,我输入0x597E,它显示出这是“奾”;我输入0x597D,它就没反应(但没有失去响应)。也罢,我就补充一下“奾”的模式吧,可是工具条上的“+”按钮点了没反应。不知道是我人品差还是不会用。。。