Chinaunix首页 | 论坛 | 博客
  • 博客访问: 678468
  • 博文数量: 156
  • 博客积分: 6010
  • 博客等级: 准将
  • 技术积分: 1201
  • 用 户 组: 普通用户
  • 注册时间: 2007-05-05 20:08
文章分类

全部博文(156)

文章存档

2010年(13)

2008年(39)

2007年(104)

我的朋友

分类: LINUX

2007-05-27 21:47:06

国家标准汉字字符集GB2312-80共收集了共7445个汉字和图形符号,其中汉字6763个,分为二级,
一级汉字3755个,二级汉字3008个。汉字图形符号根据其位置将其分为94个“区”,
每个区包含94个汉字字符,每个汉字字符又称为一个“位”。区的序号和位的序号都是从01到94,

UCDOS软件中的文件HZK16和文件ASC16分别为16×16的国标汉字点阵文件和8×16的ASCII码点阵文件,
以二进制格式存储。在文件HZK16中,按汉字区位码从小到大依次存有国标区位码表中的所有汉字,
每个汉字占用32个字节,每个区为94个汉字。在文件ASC16中按ASCII码从小到大依次存有
8×16的ASCII码点阵,每个ASCII码占用16个字节。


国家标准汉字字符集GB2312-80共收集了共7445个汉字和图形符号,其中汉字6763个,分为二级,
一级汉字3755个,二级汉字3008个。汉字图形符号根据其位置将其分为94个“区”,
每个区包含94个汉字字符,每个汉字字符又称为一个“位”。区的序号和位的序号都是从01到94,

UCDOS软件中的文件HZK16和文件ASC16分别为16×16的国标汉字点阵文件和8×16的ASCII码点阵文件,
以二进制格式存储。在文件HZK16中,按汉字区位码从小到大依次存有国标区位码表中的所有汉字,
每个汉字占用32个字节,每个区为94个汉字。在文件ASC16中按ASCII码从小到大依次存有
8×16的ASCII码点阵,每个ASCII码占用16个字节。


在PC机的文本文件中,汉字是以机内码的形式存储的,每个汉字占用两个字节:第一个字节为区码,
为了与ASCII码区别,范围从十六进制的0A1H开始(小于80H的为ASCII码字符),
对应区位码中区码的第一区;第二个字节为位码,范围也是从0A1H开始,对应某区中的第一个位码。
这样,将汉字机内码减去0A0AH就得该汉字的区位码。


例如汉字“房”的机内码为十六进制的“B7BF”,其中“B7”表示区码,“BF”表示位码。
所以“房”的区位码为0B7BFH-0A0A0H=171FH。将区码和位码分别转换为十进制得汉字“房”的
区位码为“2331”,即“房”的点阵位于第23区的第31个字的位置,相当于在文件HZK16中的
位置为第32×[(23-1) ×94+(31-1)]=67136B以后的32个字节为“房”的显示点阵。


ASCII码的显示与汉字的显示原理相同,在ASC16文件中不存在机内码的问题,
其显示点阵直接按ASCII码从小到大依次排列,不过每个ASCII码在文本中只占1个字节并且小于80h,
每个ASCII码为8X16点阵,即在ASCII16文件中,每个ASCII码的点阵也只占16个字节。

以下是读取hzk16的C部分语言代码(仅供参考):

void dis_cc(unsigned int x,unsigned int y,unsigned int color,unsigned int codeh,
unsigned int codel,unsigned int circle,unsigned int kind,unsigned int mode)
{
char word[32];
int area,bit;
long count,offset;

unsigned long count,offset;
unsigned int i,j;

area = (codeh&0x00ff)-0xa0-1; //根据机内码取得区码
bit = (codel&0x00ff)-0xa0-1; //根据机内码取得位码

offset = area*94+bit; //取得偏移量
count = 32l*(long)offset;
lseek(HZK16,count,SEEK_SET);//在HZK16文件中找到点阵起始位置
j=_read(HZK16,&word[0],32);//读取32字节的点阵信息
阅读(3027) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~