Chinaunix首页 | 论坛 | 博客
  • 博客访问: 2350481
  • 博文数量: 816
  • 博客积分: 10000
  • 博客等级: 上将
  • 技术积分: 5010
  • 用 户 组: 普通用户
  • 注册时间: 2008-12-17 17:57
文章分类

全部博文(816)

文章存档

2011年(1)

2008年(815)

分类:

2008-12-17 18:01:59

基本思路就是查表。
如果只处理内码转换:BIG5繁体→GBK繁体 或者 GBK繁体→BIG5繁体,很简单
如果要处理 简体 与 繁体 之间转换,非常复杂,无论是什么内码的。

繁体与简体的转换太头痛了,因为繁体与简体不是一一对应的, 简体转繁体和繁体转简体,都是多对多的关系
中国人把汉字给改的面部全非,甚至只差一笔也给改的乱糟糟的,这是中国悠久的古代的文化啊,就这么改来改去的!
如果排除政治上的意义,简体中文与繁体中文是两门语言,就像日语与汉语。

无论简体到繁体,还是繁体到简体,都没有准确的对应关系,乱七八糟的,多对多的。

例如:
简体 - 繁體 //体字是对应的
乾坤 - 乾坤 //可是这个“乾”不能翻译
干支 - 干支 //这个“干”不可翻译
干枯 - 乾枯 //这“乾”才算捣乱
干部 - 幹部 //这个“干”也捣乱, 并且与与干枯不同
老板 - 老闆 //这个一定要翻译,否则台湾老闆不高兴
板凳 - 板凳 //这个“板”就不要翻译了
---- 晕死了, 需要一个非常大的码表来查表, 并且需要分析语法。

我现在提供的功能都是繁体与繁体之间的内码转换,解决多语言识别和乱码,
通过 Word 把简体翻译成繁体,仍然需要手动改一些不满意的字。

--------------------next---------------------

阅读(1118) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~