基本思路就是查表。
如果只处理内码转换:BIG5繁体→GBK繁体 或者 GBK繁体→BIG5繁体,很简单
如果要处理 简体 与 繁体 之间转换,非常复杂,无论是什么内码的。
繁体与简体的转换太头痛了,因为繁体与简体不是一一对应的, 简体转繁体和繁体转简体,都是多对多的关系
中国人把汉字给改的面部全非,甚至只差一笔也给改的乱糟糟的,这是中国悠久的古代的文化啊,就这么改来改去的!
如果排除政治上的意义,简体中文与繁体中文是两门语言,就像日语与汉语。
无论简体到繁体,还是繁体到简体,都没有准确的对应关系,乱七八糟的,多对多的。
例如:
简体 - 繁體 //体字是对应的
乾坤 - 乾坤 //可是这个“乾”不能翻译
干支 - 干支 //这个“干”不可翻译
干枯 - 乾枯 //这“乾”才算捣乱
干部 - 幹部 //这个“干”也捣乱, 并且与与干枯不同
老板 - 老闆 //这个一定要翻译,否则台湾老闆不高兴
板凳 - 板凳 //这个“板”就不要翻译了
---- 晕死了, 需要一个非常大的码表来查表, 并且需要分析语法。
我现在提供的功能都是繁体与繁体之间的内码转换,解决多语言识别和乱码,
通过 Word 把简体翻译成繁体,仍然需要手动改一些不满意的字。
--------------------next---------------------
阅读(1118) | 评论(0) | 转发(0) |