计算机汉字显示原理-jarodlau-ChinaUnix博客

jerry的小窝jarodlau.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

jarodlau

博客访问： 683976
博文数量： 156
博客积分： 6010
博客等级：准将
技术积分： 1201
用户组：普通用户
注册时间： 2007-05-05 20:08

文章分类

全部博文（156）

vim（2）
ubuntu（46）
kernel（16）
program（37）
hardware（7）
Emacs相关（9）
日记随笔（4）
音乐（4）
未分配的博文（31）

文章存档

2010年（13）

2008年（39）

2007年（104）

我的朋友

aaaaa5aa

相关博文

计算机汉字显示原理

分类： LINUX

2007-05-27 21:47:06

国家标准汉字字符集GB2312-80共收集了共7445个汉字和图形符号，其中汉字6763个，分为二级，
一级汉字3755个，二级汉字3008个。汉字图形符号根据其位置将其分为94个“区”，
每个区包含94个汉字字符，每个汉字字符又称为一个“位”。区的序号和位的序号都是从01到94，

UCDOS软件中的文件HZK16和文件ASC16分别为16×16的国标汉字点阵文件和8×16的ASCII码点阵文件，
以二进制格式存储。在文件HZK16中，按汉字区位码从小到大依次存有国标区位码表中的所有汉字，
每个汉字占用32个字节，每个区为94个汉字。在文件ASC16中按ASCII码从小到大依次存有
8×16的ASCII码点阵，每个ASCII码占用16个字节。

在PC机的文本文件中，汉字是以机内码的形式存储的，每个汉字占用两个字节：第一个字节为区码，
为了与ASCII码区别，范围从十六进制的0A1H开始（小于80H的为ASCII码字符），
对应区位码中区码的第一区；第二个字节为位码，范围也是从0A1H开始，对应某区中的第一个位码。
这样，将汉字机内码减去0A0AH就得该汉字的区位码。

例如汉字“房”的机内码为十六进制的“B7BF”，其中“B7”表示区码，“BF”表示位码。
所以“房”的区位码为0B7BFH-0A0A0H=171FH。将区码和位码分别转换为十进制得汉字“房”的
区位码为“2331”，即“房”的点阵位于第23区的第31个字的位置，相当于在文件HZK16中的
位置为第32×[(23-1) ×94+(31-1)]=67136B以后的32个字节为“房”的显示点阵。

ASCII码的显示与汉字的显示原理相同，在ASC16文件中不存在机内码的问题，
其显示点阵直接按ASCII码从小到大依次排列，不过每个ASCII码在文本中只占1个字节并且小于80h,
每个ASCII码为8X16点阵，即在ASCII16文件中，每个ASCII码的点阵也只占16个字节。

以下是读取hzk16的C部分语言代码(仅供参考)：

void dis_cc(unsigned int x,unsigned int y,unsigned int color,unsigned int codeh,
unsigned int codel,unsigned int circle,unsigned int kind,unsigned int mode)
{
char word[32];
int area,bit;
long count,offset;

unsigned long count,offset;
unsigned int i,j;

area = (codeh&0x00ff)-0xa0-1; //根据机内码取得区码
bit = (codel&0x00ff)-0xa0-1; //根据机内码取得位码

offset = area*94+bit; //取得偏移量
count = 32l*(long)offset;
lseek(HZK16,count,SEEK_SET);//在HZK16文件中找到点阵起始位置
j=_read(HZK16,&word[0],32);//读取32字节的点阵信息

阅读(3069) | 评论(0) | 转发(0) |

上一篇：C语言测试：想成为嵌入式程序员应知道的0x10个基本问题 zz

下一篇：以后os发展得方向

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6