博客首页 注册 建议与交流 排行榜 加入友情链接
推荐 投诉 搜索: 帮助
  dorainm.cublog.cn

关于作者
dorainm
dorainm@gmail.com

我的梦想是当一名地主家的少爷,家有良田千顷,终日不学无术,没事领着一帮狗和奴才去调戏一下良家少女……

格物、致知、正心、诚意、修身、齐家、治国、平天下

电影的长度取决于观众的那泡尿能憋多久
|| << >> ||
我的分类


繁体简体转换-唉
    向来很不支持简体,感觉那个是xx党那个年代为了跟资产阶级划分界限,自己独立、毫无依据搞出来的一套糊弄中国人民和两千年华夏历史的东西!

    平时阅读都是简体,自己在纸上书写一直都繁体,无奈那些繁体输入法着实得不会用... 这种就像,没有学过五笔的人绝对不会用五笔,而不是念过书的人多少会些拼音输入法!

    出很多问题了!


北大中文论坛 www.pkucn.com » 中文信息处理 » 从技术角度为我们的简体字挑挑刺!


标题: 从技术角度为我们的简体字挑挑刺! 最近访问的论坛 ...美学



柔昆
注册会员
来自 www.zhsc.com
从技术角度为我们的简体字挑挑刺!

  这里,首先列出九十六个汉字(简体):

  厂 摆 板 表 别 卜 才 冲 种 丑 出 当 淀
  冬 斗 恶 发 范 丰 复 干 谷 刮 合 后 胡
  划 回 汇 伙 获 几 家 姜 借 尽 卷 克 困
  适 累 里 历 帘 了 霉 蒙 弥 面 蔑 万 辟
  朴 仆 千 签 纤 秋 曲 舍 沈 胜 松 苏 台
  坛 团 系 咸 向 吁 须 旋 么 叶 佣 游 于
  余 郁 御 愿 云 芸 脏 折 征 症 只 致 制
  钟 朱 术 筑 准

  然后,请让我平静地告诉大家:正是这九十六个简化字,会将我们的汉字引入困境。

  简体字(简化字)作为十几亿中国人的“官方语言”,在过去近五十年间,逐渐为社会公众所广泛承认、接受与普遍使用。这个当初由中华人民共和国文化部、 教育部及中国文字改革委员会联合颁布实施的《汉字简化方案》,无疑是非常成功的,简化字笔划简单、书写方便,给人们的工作、学习、生活带来了方便。

  随着现代科技不断发展,人们的生活已与计算机密不可分。在古文典籍的电子化过程中,上述九十六个简体字所引发出来的混乱,却近乎是一种灾难。

  因汉语言文学研究上的需要,古文典籍我们应当以繁体原文形式进行保存,一篇经一校、二校、三校,准确无误的简体字文章,一经电脑程序转换为繁体字,立 刻涌现出大量“错别字”:「陸游」成了「陸遊」,「胡適」成了「胡适」,「錢鍾書」成了「錢鐘書」,「怒髮衝冠」成了「怒發衝冠」,「這裡那裡」成了「這 里那里」,「為甚麼」成了「為什么」,「九萬里」成了「九万裡」……但愿百年之后,你我归了黄土,不会被发明汉字的祖师爷倉頡先生,指着鼻梁子臭骂,但愿 从此你我的脸皮子能磨练得厚一些,再厚一些,丝毫不再觉得愧对华夏祖先。

  其实,话也不必说得那么远。明天请您用电脑输入一篇繁体字的学术文章,发往台湾的学术研究机构;在台湾方面,只要将文章转给任何一名稍有点水平的高中生,他就能一一为您指出:在您的文章当中,可能有多少多少个错别字。……

  这一切,我们并不能责怪程序员或计算机,二者均已尽了力;程序的编制完全忠实于固定算法,电脑运作也完全忠实于程序;若一定要责怪的话,只能怪 “天”!只能怪简化汉字改革的推行早了四、五十年。只能怪“我们在一个错误的时机,发动了一场错误的战争”(引用美国官方话语)。

  若计算机的普及早那么四、五十年,若制定《汉字简化方案》的专家学者们用过计算机,反复地论证过“在计算机上处理汉字的问题”,这九十六个简化字所引发的灾难,恐怕就绝不会发生了。

  单纯从技术的角度,我可以明确地这样告诉大家:若维持上述“九十六个简化字”的现状不作任何改变,那么试图通过程序方式自动将简体字准确无误地转换成 繁体字,几乎是不可能的!因为简繁体汉字之间快速准确的转换,基于这样一个必要条件:简体字与繁体字应当是一一对应的;就象“汉”对应于“漢”、“华”对 应于“華”、“实”对应于“實”这样直截了当;若简体的“系”字,可对应“系係繫”、“于”可对应“于於”……且这种“一对多”的关系是近乎随意的,那么 便没有任何电脑程序能够准确地处理了(事实上,人脑进行这种辨别也相当困难——请您试试分辨以下繁体字(一组词里头,只有其中一个是正确的):“陸游”与 “陸遊”、“天台山”与“天臺山”、“五台山”与“五臺山”!)。

  若从经济的角度,即便最终能完美地实现了这样的程序,也将会是一件“劳民伤财”、得不偿失的事情——计算机要经过极其复杂(运行次数近乎天文数字)的运算,才能准确转换一篇几百字的文章。

  古人云:亡羊而补牢,未为迟也。我觉得,要从根本上解决这个问题,其实并不难。只要文化部、教育部等“官方机构”对简化字作一次“有时代特色”的小小 的修订(计算机领域的专业术语叫做“补丁(Service Pack)”),将可能引致繁简转换混乱的所有简化字(上述“九十六个简化字”的统计数字,估计仍会有个别遗漏,请以官方统计数据为准),逐一细拆,逐一 重新制定相对应的简化字(例如,为“于”与“於”分别制定两个不同的简体字,为“系”“係”“繫”分别制定三个不同的简体字……),并强制全社会推行。

  最后要说一句:这不仅仅是典籍电子化的需要,这也是中华民族子孙万代的需要;我们没有任何理由、任何藉口,让优美的汉语言文字自我们这一代人起断子绝孙!我们没有任何理由、任何藉口,让我们的后人从此再也写不出一篇措辞优雅且没有任何一个错别字的繁体字文章!

  ……五千多年来的华夏祖先们,正默默地躺在黄土之下,默默地注视着我们。



 原文地址 http://wangf.net/vbb/showthread.php?s=028dc4be5fa1834b22c8c6cf6175d745&threadid=21204
 TAG 繁体 简体 转换
发表于: 2007-08-17,修改于: 2007-08-17 06:06,已浏览579次,有评论1条 推荐 投诉


网友评论
网友: 本站网友 时间:2008-04-15 09:58:23 IP地址:222.216.2.★
求学者!!

 发表评论