C++爱好者 - 网友留言-3JTwF2T-ChinaUnix博客

linux学习天堂11685

首页　| 　博文目录　| 　关于我

3JTwF2T

博客访问： 2363063
博文数量： 816
博客积分： 10000
博客等级：上将
技术积分： 5010
用户组：普通用户
注册时间： 2008-12-17 17:57

文章分类

全部博文（816）

未分配的博文（816）

文章存档

2011年（1）

2008年（815）

我的朋友

最近访客

推荐博文

C++爱好者 - 网友留言

分类：

2008-12-17 18:01:59

基本思路就是查表。
如果只处理内码转换：BIG5繁体→GBK繁体或者 GBK繁体→BIG5繁体，很简单
如果要处理简体与繁体之间转换，非常复杂，无论是什么内码的。

繁体与简体的转换太头痛了，因为繁体与简体不是一一对应的, 简体转繁体和繁体转简体，都是多对多的关系
中国人把汉字给改的面部全非，甚至只差一笔也给改的乱糟糟的，这是中国悠久的古代的文化啊，就这么改来改去的!
如果排除政治上的意义，简体中文与繁体中文是两门语言，就像日语与汉语。

无论简体到繁体，还是繁体到简体，都没有准确的对应关系，乱七八糟的，多对多的。

例如：
简体 - 繁體 //体字是对应的
乾坤 - 乾坤 //可是这个“乾”不能翻译
干支 - 干支 //这个“干”不可翻译
干枯 - 乾枯 //这“乾”才算捣乱
干部 - 幹部 //这个“干”也捣乱, 并且与与干枯不同
老板 - 老闆 //这个一定要翻译，否则台湾老闆不高兴
板凳 - 板凳 //这个“板”就不要翻译了
---- 晕死了, 需要一个非常大的码表来查表, 并且需要分析语法。

我现在提供的功能都是繁体与繁体之间的内码转换，解决多语言识别和乱码，
通过 Word 把简体翻译成繁体，仍然需要手动改一些不满意的字。

--------------------next---------------------

阅读(1151) | 评论(0) | 转发(0) |

上一篇：C++爱好者 - 网友留言

下一篇：C++爱好者 - 网友留言

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6