Chinaunix首页 | 论坛 | 博客
  • 博客访问: 183142
  • 博文数量: 218
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 2211
  • 用 户 组: 普通用户
  • 注册时间: 2020-08-10 06:35
文章分类
文章存档

2024年(3)

2023年(86)

2022年(53)

2021年(42)

2020年(34)

我的朋友

分类: Python/Ruby

2023-04-02 08:55:48

中文编码GB2312 回忆上次内容
  • 上次回顾了 日韩各有 编码格式
  • 日本
  • 有假名
  • 五十音
  • 一字节 可以勉强放下

  • 有日本汉字
  • 字符数量超过20000+


  • 韩国
  • 有谚文
  • 数量超过500
  • 一个字节 放不下

  • 有朝鲜汉字
  • 字符数量超过20000+



添加图片注释,不超过 140 字(可选)
  • 作为 汉字源头的中国
  • 究竟应该 如何对汉字 进行编码 呢?????

汉字
  • 汉字起源于甲骨文
  • 是世界上唯一还在使用的象形文字
  • 真的很不容易

添加图片注释,不超过 140 字(可选)
  • 写的本意 就是 画
  • 写意
  • 写生

  • 这就是{BANNED}最佳初的
  • 象形字

六书
  • 以象形为基础
  • 指事
  • 会意
  • 形声
  • 转注
  • 假借

添加图片注释,不超过 140 字(可选)
  • 字的结构是什么呢?
间架结构
  • 上下
  • 左右
  • 内外
添加图片注释,不超过 140 字(可选)
  • 字型相当复杂
  • 笔画也千姿百态
汉字笔画
  • 笔画也比较复杂
添加图片注释,不超过 140 字(可选)
  • 运笔藏锋都很有讲究
中国大陆地区
  • 中国大陆地区{BANNED}最佳早使用 GB/T 2312-1980
  • 当时参考了比我们先进的日本JIS 字符集
  • 1980 年 指定的国标 (GuoBiao)
  • 1981 年 5 月 1 日开始使用

添加图片注释,不超过 140 字(可选)
  • GB2312 编码共收录汉字 6763 个
  • 其中一级汉字 3755 个
  • 二级汉字 3008 个

  • 这么多字怎么排呢?
区位
  • 01-09 区为特殊符号
  • 先把ascii的128个字符让出去
  • 然后在留有一些制表的字符
  • 还留了相当多的空余

  • 16-55 区为一级汉字
  • 按拼音排序

  • 56-87 区为二级汉字
  • 按部首/笔画排序

添加图片注释,不超过 140 字(可选)
  • 出了汉字之外,还收录了
  • 拉丁字母
  • 希腊字母
  • 日文平假名及片假名字母
  • 俄语西里尔字母
  • 真的很全了

  • 可是这gb2312
  • 具体是如何编解码的呢?????

应用
添加图片注释,不超过 140 字(可选)
  • 如果是0-127以内的ascii字符
  • 标志位为0
  • 1个字节存储

添加图片注释,不超过 140 字(可选)
  • 如果是ascii以外的字符
  • 标志位为1
  • 2个字节存储

编解码
  • 编解码方法一致就可以
  • 解铃还须系铃人

添加图片注释,不超过 140 字(可选)
  • 同时用 gb2312 编解码是没有问题的
  • 这篇 制定标准的文档
  • 当时怎么打印出来的呢?
  • 制定内码标准的 时候 就有 字形 了吗?

铅字
  • 虽然 计算机 在当时 还 没有普及
  • 但是 出版行业 已经 工业化 了

添加图片注释,不超过 140 字(可选)
  • 印刷厂 使用 铅活字 进行排版
  • 铸字工
  • 拼版工
  • 还有拣字工

拣字工
  • 印刷家谱 从 一个大盒子 就够了
添加图片注释,不超过 140 字(可选)
  • 字 再多些
  • 要用 转轮排字盘

添加图片注释,不超过 140 字(可选)
  • 字 再多些呢?
捡字室
  • 大 印刷厂
  • 字模 特别多

添加图片注释,不超过 140 字(可选)
  • 甚至 要放
  • 好 几面墙
  • 好 几张桌子

开端
  • 这 也 曾被
  • 使用26个字母的 西方文明 嘲讽

添加图片注释,不超过 140 字(可选)
  • 出书确实不易
  • 捡好了 字
  • 排好了 版
  • 先 打个样
  • 再来 校对
  • 再 浇铅板
  • {BANNED}最佳后 印刷

  • {BANNED}最佳初的
  • 书籍
  • 杂志
  • 报纸
  • 试卷
  • 都是这样 印刷出来 的

  • 到了 印刷 gb2312-80标准的 1980年
  • 已经启用了新的技术

机械打字机
  • 从 轮转排字盘
  • 到 谢卫楼 发明的 中文打字机

添加图片注释,不超过 140 字(可选)
  • 再到 舒震东
  • 在前人的研究基础上经过创新
  • 得到的 舒式打字机

添加图片注释,不超过 140 字(可选)
  • 中文字符 的数量
  • 是 一个难关

  • 直到
  • 照相技术 的 发展

照片排版
  • 使用 照片底片 进行排版
添加图片注释,不超过 140 字(可选)
  • 也面临检字的工作
添加图片注释,不超过 140 字(可选)
  • 照片排版技术本身也在迭代
激光照排
  • 这次使用 激光 扫描照片
添加图片注释,不超过 140 字(可选)
  • 每一个小字型都是一个照片
  • 根据汉字内码找到汉字对应的激光照片
  • 然后再把激光照片像活字一样排版
  • 这就是激光照排技术

添加图片注释,不超过 140 字(可选)
  • 用照片排版的方式
  • 制作了这样一个汉字编码的文档

  • 标准定了立刻就能用起来么?
过程
  • 凡事都有个过程
  • 95年定的gbk
  • 98年才逐渐推行开来

  • 但还是有些生僻字没有相应的字型
添加图片注释,不超过 140 字(可选)
  • 内码从无到有
  • 字形码也从无到有

添加图片注释,不超过 140 字(可选)
感谢前辈
  • 感谢王选与陈堃銶前辈的技艺
添加图片注释,不超过 140 字(可选)
  • 激光照排技术 可以
  • 印刷中文书籍 和 报纸 了

总结
  • 简体和繁体的汉字
  • 字符数量都超级大
  • 感谢王选和陈堃銶等前辈发明了激光照排技术
  • 中文排版从此使用上了gb2312编码

添加图片注释,不超过 140 字(可选)
  • 纸张之外
  • 显示器是更先进的输出设备

  • 计算机是如何在显示器上显示的呢?????
  • 我们下次再说!????
  • 蓝桥->
  • github->
  • gitee->


阅读(149) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~