分类: 嵌入式
2015-08-23 16:33:26
15年8月21日10:06:00
HZK16 字库是符合GB2312标准的16×16点阵字库,HZK16的GB2312-80支持的汉字有6763个,符号682个。其中一级汉字有3755个,按声序排列,二级汉字有3008个,按偏旁部首排列。我们在一些应用场合根本用不到这么多汉字字模,所以在应用时就可以只提取部分字体作为己用。
HZK16字库里的16×16汉字一共需要256个点来显示,也就是说需要32个字节才能达到显示一个普通汉字的目的。
我们知道一个GB2312汉字是由两个字节编码的,范围为A1A1~FEFE。A1-A9为符号区,B0到F7为汉字区。每一个区有94个字符(注意:这只是编码的许可范围,不一定都有字型对应,比如符号区就有很多编码空白区域)。下面以汉字“我”为例,介绍如何在HZK16文件中找到它对应的32个字节的字模数据。
前面说到一个汉字占两个字节,这两个中前一个字节为该汉字的区号,后一个字节为该字的位号。其中,每个区记录94个汉字,位号为该字在该区中的位置。所以要找到“我”在hzk16库中的位置就必须得到它的区码和位码。(为了区别使用了区码和区号,其实是一个东西,别被我误导了)
区码:区号(汉字的第一个字节)-0xA0(因为汉字编码是从0xA0 区开始的,所以文件最前面就是从0xA0 区开始,要算出相对区码)
位码:位号(汉字的第二个字节)- 0xA0
这样我们就可以得到汉字在HZK16中的绝对偏移位置:
offset=(94*(区码-1)+(位码-1))*32
注解:1、区码减1是因为数组是以0为开始而区号位号是以1为开始的
2、(94*(区号-1)+位号-1)是一个汉字字模占用的字节数
3、最后乘以32是因为汉字库文应从该位置起的32字节信息记录该字的字模信息(前面提到一个汉字要有32个字节显示)
有了偏移地址就可以从HZK16中读取汉字编码了,剩下的就是文件操作了,就不说了。
要看代码(汉字)就是下面的:“hzk16汉字库的简单读写程序",是一个最简单的c语言程序。
int i,
j, k;
unsigned char incode[3]="我";
// 要读出的汉字
unsigned char qh,wh;
unsigned long offset;
// 占两个字节, 取其区位号
qh = incode[0] - 0xa0; / /获得区码
wh = incode[1] - 0xa0; / /获得位码
offset = ( 94*(qh-1) + (wh-1) ) * 32; /*得到偏移位置*/
FILE *HZK;
char mat[32];
if((HZK=fopen("hzk16",
"rb")) == NULL)
{
printf("Can't Open
hzk16\n");
exit(0);
}
fseek(HZK, offset,
SEEK_SET);
fread(mat, 32, 1, HZK);
//显示
for(j=0;j<16;j++)
for(i=0;i<2;i++)
for(k=0;k<8;k++)
if(mat[j][i]&(0x80>>k)) /*测试为1的位则显示*/
{
printf("%s",'#');
}
else
{
printf("%s",'-');
}
fclose(HZK);
fclose(fp);
如果,一个汉字存放在内存中,我们想要直接使用数组操作来获取它的偏移值,比如:
unsigned char incode[3]="我"; // 要读出的汉字
unsigned char qh,wh;
unsigned long offset;
// 占两个字节, 取其区位号
qh = incode[0] - 0xa0; / /获得区码
wh = incode[1] - 0xa0; / /获得位码
offset = ( 94*(qh-1) + (wh-1) ) * 32; /*得到偏移位置*/
我们可以用一步来直接代替:
unsigned char incode[3]="我";
offset = (94* (incode[0] – 0xA1) + (incode[1] – 0xA1)) * 32;
这样用比较方便。