[oeasy]python0122_日韩字符_日文假名_JIS_Shift_韩国谚文-overmind1980-ChinaUnix博客

Chinaunix首页 | 论坛 | 博客

oeasy的ChinaUnix博客

首页　| 　博文目录　| 　关于我

博客访问： 226934
博文数量： 267
博客积分： 0
博客等级：民兵
技术积分： 2701
用户组：普通用户
注册时间： 2020-08-10 06:35

文章分类

全部博文（267）

文章存档

2025年（19）

2024年（33）

2023年（86）

2022年（53）

2021年（42）

2020年（34）

我的朋友

最近访客

推荐博文

相关博文

[oeasy]python0122_日韩字符_日文假名_JIS_Shift_韩国谚文

分类： Python/Ruby

2023-04-01 11:30:04

日文假名和韩国谚文回忆上次内容

上次回顾了非ascii的拉丁字符编码的进化过程
0-127 是 ascii 的领域

世界各地编码分布
拉丁字符扩展 ascii 共 16 种
由iso组织制定
从iso-8859-1
到iso-8859-16

无法同时显示俄文和法文

此时中日韩的文字也需要进入计算机
象形文字的字符集超级巨大
日本、韩国也用汉字
数量2万起步

添加图片注释，不超过 140 字（可选）

真能把如此巨大的字符集
编码进入计算机吗？????

文字

日本汉字我们可以直接看懂

添加图片注释，不超过 140 字（可选）

地铁里的标记

添加图片注释，不超过 140 字（可选）

日文中为什么
这么多汉字呢？

遣唐使

皇子公卿僧侣
都要专门
来中国朝圣
学文化

添加图片注释，不超过 140 字（可选）

日文很多词
都能看懂
管老师叫做先生
管火车叫做机车
管学习叫做勉强
管辣叫辛

添加图片注释，不超过 140 字（可选）

特别辣
叫激辛

这些汉字怎么来的呢？

空海和尚

从日本来的留学僧
不但学习汉语佛法
也学习汉字书法

添加图片注释，不超过 140 字（可选）

并把这些文化带回日本
汉字成为书写符号
口头系统的日语
可以记录下来了

正如同
使用圣书体的一些字型
将腓尼基的口语记录下来

万叶集

“叶” 是 “世”
即时代
希望能流传到万世

各种各样的歌
敬畏自然山神、河神的歌
男女恋爱的歌
挽歌

添加图片注释，不超过 140 字（可选）

汉字
数量很多
记起来、写起来也比较复杂
只有 {BANNED}最佳有文化的人
才能都写下来

自己写东西的时候
有些字忘了怎么写
就拿一个同音字
来假借

日语假名

假借的次数多了
就固定了下来

形成了
专门的日语拼音字符

添加图片注释，不超过 140 字（可选）

假名
存在着多个体系
不同的时代
不同的地域

平假名

直到明治33年
发行公文才得以统一

万葉仮名(假名)
草书风格的符号
有女性的柔美
抄文众多
《枕草子》
《源氏物语》

添加图片注释，不超过 140 字（可选）

把写法也固定了下来
成为铅字

万葉仮名(假名)
形成了
现代假名系统中的平假名

除了平假名之外
还有片假名

片假名

片假名来自汉字的一片
也是一种假名系统
有硬朗的楷书转化而来

添加图片注释，不超过 140 字（可选）

明治维新时期
大量欧美外来语涌入日本
日语只取其读音
用片假名将其表示出来

假名系统
是拼音文字系统
字符数量不多

{BANNED}最佳初的日文编码

在ascii的基础上
把片假名加了上去

添加图片注释，不超过 140 字（可选）

字型什么样呢？

假名字形码

添加图片注释，不超过 140 字（可选）

可以把这些片假名输出出来吗？

输出假名

下面的代码是将a1到e0
封包进入一个字节
然后再将字节解码

添加图片注释，不超过 140 字（可选）

可以动手试试
以后我们会详细讲解封包解包

范围[0xa1, 0xe0)

添加图片注释，不超过 140 字（可选）

勇者斗恶龙

当时的日文
能显示出ascii和假名的字型
就已经很厉害

添加图片注释，不超过 140 字（可选）

想显示出中文字型
是不可能的

日本汉字

是中文的拼音文字
只是假名都加在一起就至少 100+
128 根本不够用

添加图片注释，不超过 140 字（可选）

更何况日文里面用日本汉字
虽然只有2000个不到
但是是文化的象征

不过假名毕竟是假的
日文中{BANNED}最佳厉害的还是汉字

汉字文化

日语中混有各种汉字

添加图片注释，不超过 140 字（可选）

感觉根本不用翻译

添加图片注释，不超过 140 字（可选）

也会造一些日本汉字

汉字	发音	含义
凪	なぎ	风平浪静
雫	しずく	水滴如雨下
躾	しつけ	教育
榊	さかき	寺庙里的树

评选年度汉字

添加图片注释，不超过 140 字（可选）

所以日文中的字符直接超过2000+
1 个字节是不够了
至少需要 2 个字节

添加图片注释，不超过 140 字（可选）

日本规格协会制定标准
JIS X 0212

点阵字库产生了
日本汉字的黑体模式

无衬线黑体风格

无衬线
黑体
注重实效
注重清晰度

添加图片注释，不超过 140 字（可选）

任何字帖一般都有两种风格
板正规范的生硬风格
圆润灵动的手写风格

手写风格

添加图片注释，不超过 140 字（可选）

不像大写字母
那么生硬

添加图片注释，不超过 140 字（可选）

就像小写字母
那么圆滑

韩文字符又是如何编码的呢？

韩文

韩文也是一种拼音文字
基础字母有二十四个
符号是朝鲜王朝世宗大王时创作的
从此韩文有了谚文

添加图片注释，不超过 140 字（可选）

但是韩国士大夫会写汉字
不愿意推广谚文

拼音

不过拼音文字
更容易一些

添加图片注释，不超过 140 字（可选）

谚文书写普及速度比汉字书写快得多
拼音是有结构的

谚文结构

谚文是由表音符号组合而成的
有各种间架结构

添加图片注释，不超过 140 字（可选）

这些声旁都发什么音呢？

声音

韩文名字
宋仲基(???)
金喜善(???)
李英爱(???)
阿一古(???)
圆圈不发音

添加图片注释，不超过 140 字（可选）

从此就连哎呦喂(阿一古)
都有了标准发音方法
用拼音文字把读音固化下来

谚文有多少字符呢？

谚文字符

声母韵母拼写在一起算一个
共 554 个

而且这还不算朝鲜汉字

添加图片注释，不超过 140 字（可选）

这554个基础字符导致
1 个字节不够
2 个字节才够

韩文的字符集为
KS X 1001

总结

日韩各有编码格式
日本
有假名
五十音
一字节可以勉强放下

有日本汉字
字符数量超过20000+

韩国
有谚文
数量超过500
一个字节放不下

有朝鲜汉字
字符数量超过20000+

添加图片注释，不超过 140 字（可选）

作为汉字源头的中国
究竟应该如何对汉字进行编码呢？????

我们下次再说！????
蓝桥->
github->
gitee->

阅读(223) | 评论(0) | 转发(0) |

0

上一篇：[oeasy]python0120_英语的崛起_英文字符_小写字母的由来_不列颠帝国

下一篇：[oeasy]python0123_中文字符_文字编码_gb2312_激光照排技术_王选

给主人留下些什么吧！~~

关于我们 | 关于IT168 | 联系方式 | 广告合作 | 法律声明 | 免费注册

Copyright 2001-2010 ChinaUnix.net All Rights Reserved 北京皓辰网域网络信息技术有限公司. 版权所有

感谢所有关心和支持过ChinaUnix的朋友们