Chinaunix首页 | 论坛 | 博客
  • 博客访问: 487750
  • 博文数量: 78
  • 博客积分: 5131
  • 博客等级: 大校
  • 技术积分: 1468
  • 用 户 组: 普通用户
  • 注册时间: 2007-10-17 16:20
文章分类
文章存档

2012年(1)

2011年(29)

2010年(6)

2009年(24)

2008年(18)

我的朋友

分类: LINUX

2011-07-07 19:28:19

【嵌入式】字体知识收集 - Linux使用心得

2009-11-24 13:08:09|  分类: 嵌入式 |  标签:字库  汉字  字体  内码  点阵   |字号 


字体分为点阵字体与矢量字体两大类。
点阵字体,是把每一个汉字分成 16 x 16 或者 24 x 24个点,然后用每个点的虚实来表示汉字的轮廓,常用来作为显示字库使用,这类点阵字库的最大缺点就是不能放大,一旦放大就会发现文字的边缘锯齿。
矢量字体,保存的是对每一个汉字的描述信息,比如一个笔划的起始、终止坐标,半径、弧度等等。在显
示、打印这一类字库时,要经过一系列的数学运算才能输出结果,但是这一类字库保存的汉字理论上可
以被无限地放大,笔划轮廓仍然能保持圆滑,打印时使用的字库均为此类字库。Windows使用的字库也
为以上两类,在FONTS目录下,如果字体扩展名为FON,表示该文件为点阵字库,扩展名为TTF则表示
矢量字库。点阵字库文件的图标为一个红色的“A”,矢量字库图标是两个“T”


  你是否碰到过用启动盘启动系统后用DIR命令得到一串串莫名其妙的字符?有经验的朋友会告诉你:那是汉字。汉字?你不禁会问:怎么一个我一个也不认识。但那确确实实是汉字,如果你启动UCDOS或其他的汉字系统后,就会看到那是一个个熟悉的汉字。同样是汉字,为什么前后会看到不同的结果?呵呵,其实在电脑硬件中,根本没有汉字这个概念,也没有英文的概念,这铁玩意认识的概念只有——内码。

  点头表示什么?是“对”、“YES”,偏偏有的地方表示的意义却恰恰相反。一个动作,有不同的诠释;一个问题,有不同的答案;而一个符号,却有不同的意义,关键在于:你是如何地理解。在电脑中亦如此,所有的数据都是以0和1保存的,按不同的数据操作,可以得到不同的结果。对于显示英文操作,由于英文字母种类很少,只需要8位(一字节)即可。而对于中文,常用却有5000以上,于是我们的DOS前辈想了一个办法,就是将ASCII表的高128个很少用到的数值以两个为一组来表示汉字,即汉字的内码。而剩下的低128位则留给英文字符使用,即英文的内码。不信,你可以用记事本写一C文件:
main()
{
    unsigned char *s,*e="ABcd",*c="你好";
    clrscr();
    printf("English char =");
    s=e;
    while(*s!=0) /*C的字符串以0为结束符*/
    {
        printf("%3d,",*s);
        s++;
    }
    printf("\nChinease char=");
    s=c;
    while(*s!=0)
    {
        printf("%3d,",*s);
        s++;
    }
    getch();
}
再用TC输入*.txt打开运行,看见了没有,那些数值即英文和汉字的各字节内码。

  得到了汉字的内码后,还仅是一组数字,那又如何在屏幕上去显示呢?这就涉及到文字的字模,字模虽然也是一组数字,但它的意义却与数字的意义有了根本的变化,它是用数字的各位信息来记载英文或汉字的形状,如英文的'A'在字模中是这样记载的:

【嵌入式】字体知识收集 - Linux使用心得 - 分享成长的喜悦 - lttian - 心晴lttian

而中文的“你”在字模中却是这样记载的:

【嵌入式】字体知识收集 - Linux使用心得 - lttian - 心晴lttian

在硬件系统内,英文的字模信息一般固化在ROM里,即使在没有进入系统的CMOS里,也可以让你看到英文字符。而在DOS下,中文的字模信息一般记录在汉字库文件HZK16里。

  了解字母和汉字是按字模位信息显示的原理后,那如何得到汉字的字模信息呢?难道要我们自己去做?NO。DOS前辈们经过艰辛的努力,将制作好的字模放到了一个个标准的库中以免去后辈的麻烦,这就是点阵字库文件。一般我们使用16*16的点阵宋体字库,所谓16*16,是每一个汉字在纵、横各16点的区域内显示的。不过后来又有了 HZK12、HZK24,HZK32和HZK48字库及黑体、楷体和隶书字库。虽然汉字库种类繁多,但都是按照区位的顺序排列的。前一个字节为该汉字的区号,后一个字节为该字的位号。每一个区记录94个汉字,位号则为该字在该区中的位置。因此,汉字在汉字库中的具体位置计算公式为:94*(区号-1)+位号-1。减1是因为数组是以0为开始而区号位号是以1为开始的。这仅为以汉字为单位该汉字在汉字库中的位置,那么,如何得到以字节为单位得到该汉字在汉字库中的位置呢?只需乘上一个汉字字模占用的字节数即可,即:(94*(区号-1)+位号-1)*一个汉字字模占用字节数,而按每种汉字库的汉字大小不同又会得到不同的结果。以16*16点阵字库为例,计算公式则为:(94*(区号-1)+(位号-1))*32。汉字库文该从该位置起的32字节信息即记录了该字的字模信息。

汉字库文件

  了解点阵汉字及汉字库的构成原理后,显示汉字就变得简单。以16*16点阵字库为例,通常的方法是:将文件工作指针移到需要的汉字字模处、将汉字库文件读入一2*16数组再用for循环一位位地显示。以使用VGAHI模式显示“我”字为例,程序如下:
#include "graphics.h"
#include "stdio.h"
main()
{
    int i=VGA,j=VGAHI,k;
    unsigned char mat[16][2],chinease[3]="我";
    FILE *HZK;
    if((HZK=fopen("hzk16","rb"))==NULL)
        exit(0);
    initgraph(&i,&j,"");
    i=chinease[0]-0xa0;j=chinease[1]-0xa0; /*获得区码与位码*/
    fseek(HZK,(94*(i-1)+(j-1))*32l,SEEK_SET);
    fread(mat,32,1,HZK);
    for(j=0;j<16;j++)
        for(i=0;i<2;i++)
            for(k=0;k<8;k++)
                if(mat[j][i]&(0x80>>k)) /*测试为1的位则显示*/
                    putpixel(i*8+k,j,WHITE);
    getch();
    closegraph();
    fclose(HZK);
}
怎么样?只要掌握了正确的方法,显示汉字并不复杂。

  如果你有UCDOS的 HZK24S(宋体)、HZK24K(楷体)或HZK24H(黑体),你还可以使用不同字体的大字模汉字了。HZK24系列是24*24的点阵字库,每字模占用3*24字节。如果你按照HZK16的显示方法的话,你会看到......呵呵,字被放倒了。这是因为该类字库与一般的汉字库不同,这类大字模汉字库是专供打印的打印字库,为了打印的方便将字模都放倒了,你使用时,只要将字模的位信息纵横转置显示即可。例如你如果定义为mat[24][3]则应该这样输出:
    for(i=0;i<24;i++)
        for(j=0;j<24;j++)
            if((0x80>>i%8)&mat[j][i/8]) /*转置显示*/
                putpixel(j+x,y+i,color);
  还有一类字库HZK12,虽然属于标准字库类型,但如果你将它的字模当作12*12位计算的话,根本无法正常显示汉字。因为字库设计者为了使用的方便,字摸每行的位数均补齐为8的整数倍,于是实际该字库的位长度是16*12,虽然每行都多出了4位,但这4位都是0(不显示),并不影响显示效果。
问题:1 内码  与 字模的关系 ?
    内码指明需要显示的是那个字,字模规定具体怎样来显示这个字
    可以参考下面的 《国标码,区位码,内码之间的关系》引文,明白怎么通过内码找到要显示的字
   
    2 linux下字体的显示原理或者顺序?
   
    
From:http://blog.csdn.net/kt400_hhx/archive/2007/06/07/1641590.aspx

字库与编码关系

       字库是由字模组成的。字库是编码表字符显示的描述文件。字符编码是在字库中查询需要显示的字符的索引值。
       不同的编码就应该有不同的字库,比如unicode编码就有unicode的字库。Gb2312编码就有gb2312的字库。

字库格式    
       字库的格式主要有TrueType(ttf),PostScript(rip),OpenType等
       TrueType是微软定义的字库格式,主要用于软件显示这种要求精度不高的环境,
       PostScript是Adobe定义的字库格式,主要用于排版印刷等大字打印精度要求很高的环境。
       OpenType是TrueType与PostScript的综合格式,并且是使用了unicode的编码。
TTF 和 TTC
TTC是几个TTF合成的字库,安装后字体列表中会看到两个以上的字体。两个字体中大部分字都一样时,可以将>两种字体做成一个TTC文件,现在常见的TTC中的不同字体,汉字一般没有差别,只是英文符号的宽度不一样,>以便适应不同的版面要求。
字体引擎
       字体引擎用于读取字库,显示文字,文字转换等操作。现在免费的字体引擎有FreeType.
点阵字体和矢量字体的区别
http://blog.21ic.com/user1/942/archives/2006/11368.html
点阵汉字的显示原理
http://blog.chinaunix.net/u/7270/showart_311100.html
国标码,区位码,内码之间的关系
http://www21.blogchina.com/www21/5419647.html
汉字的字模与显示
http://blog.chinaunix.net/u/19881/showart_347012.html
linux 下的字体原理
http://hi.baidu.com/limu100/blog/item/21b7deef1fef6b15fcfa3c0e.html
探究X Window System运行原理与启动过程

Linux中文字体的加载!!
http://www.mcublog.com/blog/user1/16/archives/2006/12690.html
如何在linux下安装simsun字体的个人体会(转)
http://hi.baidu.com/renyijiu/blog/item/53cd7f032e6e60e809fa9360.html

阅读(1637) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~