qt字库的移植(使其很好的显示中文)-leanderlee-ChinaUnix博客

点滴记录，是前进的脚步lide.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

leanderlee

博客访问： 1196276
博文数量： 181
博客积分： 4968
博客等级：上校
技术积分： 1867
用户组：普通用户
注册时间： 2008-01-13 21:52

文章分类

全部博文（181）

nginx（8）
其它（8）
移动互联（4）
Linux开发（108）
C/C++/QT（19）
日语与日本文化（19）
English（6）
未分配的博文（9）

文章存档

2015年（2）

2013年（6）

2012年（22）

2011年（41）

2010年（27）

2009年（51）

2008年（32）

我的朋友

相关博文

qt字库的移植(使其很好的显示中文)

分类： LINUX

2009-06-16 12:20:25

qt字库的移植(使其很好的显示中文)

1 如何定制字库（移植字库）
需要将至少两个文件赋值到....lib/font目录下
1. fontdir 文件。这个是应用程序寻找当前系统中最合适自己需要的字库的索引；

2，需要的字体库文件，一般是多个。具体移植那一个，看你使用的字库是什么了，。比如我现在的系统我就是移植的wenquanyi_12pt.bdf就可以了，当然这个比较大。你也可以用小点的。我的flash比较大呵呵，懒得折腾。
在程序中需要这样设置：

QTextCodec::setCodecForTr(QTextCodec::codecForName("utf8"));
QTextCodec::setCodecForCStrings(QTextCodec::codecForName("utf8"));

设置使用utf-8编码也就是unicode编码了，这样在tr和string的都是unicode的编码了，根据字库的索引就能对应相应的字符了。

然后设置字体：

//字体设置
QFont font("wenquanyi",12,QFont::Bold); //使用wenquanyi字体
this->setFont(font);

//这样就设置了字体了，中文一般使用wenquanyi字体就可以了。很好的。

基础知识介绍：

字符编码
1、
字符必须编码后才能被计算机处理。计算机使用的缺省编码方式就是计算机的内码。早期的计算机使用7位的ASCII编码，为了处理汉字，程序员设计了用于简体中文的GB2312和用于繁体中文的big5。在这些编码中，中文和英文可以统一的处理，区分中文编码的方法是高字节的最高位为不为0。GB内码的存储方式始终都是big endian，即高位在前。

2、
Unicode是一种字符编码方法，它是由国际组织设计，可以容纳全世界所有语言文字的编码方案。Unicode的学名是"Universal Multiple-Octet Coded Character Set"，简称为UCS。UCS可以看作是"Unicode Character Set"的缩写。
Unicode与GB码不兼容，只与ASCII兼容。
UCS规定了怎么用多个字节表示各种文字。怎样传输这些编码，是由UTF（Unicode transforation format）规范规定的。常见的UTF规范包括UTF-8(就是以8位为单元对UCS进行编码)、UT F-7、UTF-16。
UTF-*和Unicode是同类，就是在编码方式上不同。首先UTF编码后的大小是不一定，不像Unicode编码后的大小是一样的。

字体库：
一般认为，一个汉字的编码就对应着这样的字形，这还是错误的。内码对于字库来说，只是查找字形的索引。如果换成另一个编码标准的字体，同一个字符串就会呈现不同的字形，也就是乱码。
随着GUI的发展，字库逐渐转向TTF.TTF字库的编码标准没有UTF8的
由于工作需要把ttf字体转换成qpf字体，牵扯到了qt的makeqpf工具的使用方法
先简单说一下qt的字体支持
Qte可以支持以下四种形态的字体格式
TrueType (TTF)、Postscript Type(PFA/PFB)、Bitmap Distribution Format fonts(BDF)、Qt Prerendered Font(QPF)
Qt中不同字体是用Unicode来处理、转换
因为Unicode（UTF16或者UTF8）最适合在任何人之间传递信息，
至于TrueType(不知道是什么东西，先唬着)的支援，目前Qte采用的是FreeType2 Livrary来显示字体，可充分享受无段式anti-aliased显示。
经过下午的查证：Truetype是由AppleComputer公司和Microsoft公司联合提出的一种新型数学字形描述技术。他用数学函数描述字体轮廓外形，含有字形构造、颜色填充、数字描述函数、流程条件控制、珊格处理控制、附加提示控制等指令。TrueType采用几何学中二次B样条曲线及直线来描述字体的外形轮廓，其特点是：TrueType即可以作打印字体又可以做屏幕显示；由于它是由指令对字形进行描述，因此它与分辨率无关，输出时总是按照打印机的分辨率输出。无论放大或缩小，字符总是光滑的，不会有锯齿出现。但相对PostScript字体来说，其质量要差一些，特别是在文字太小时，就表现得不是很清楚
简单一下：
truetype，字体就是可以不变形放大的字体，标准的字体大约有三种。*.fon 、*.ttf 、*.ttc，你所问的就是*.ttf 、*.ttc是*.ttf的新标准。*.fon就是很久以前用的字体，dos下现windows还有少量，主要用在系统使用方面可以提高程序的执行效率

FreeType是一个免费的并且可以被移植的TrueType 字库引擎，可以应用于很多平台！

fontdir的简介
下面是截取qtcore中默认的fontdir文件中的中文字库部分
#Chinese character font from
wenquanyi wenquanyi_12pt.bdf BDF n 50 120 u
wenquanyi wenquanyi_13pt.bdf BDF n 50 130 u
wenquanyi wenquanyi_15pt.bdf BDF n 50 150 u
wenquanyi wenquanyi_16pt.bdf BDF n 50 160 u
wenquanyi wenquanyi_12ptb.bdf BDF n 75 120 u
wenquanyi wenquanyi_13ptb.bdf BDF n 75 130 u
wenquanyi wenquanyi_15ptb.bdf BDF n 75 150 u
wenquanyi wenquanyi_16ptb.bdf BDF n 75 160 u

可以看到共有七列
第一列：字体的名字，就是你在设置字体的时候的字体的名字
第二列: (file)即具体的文件名字
第三列: (renderer)字体的格式，有BDF,TTT,QPF等选择.
第四列: n 表示iitalic,是否为斜体
第五列：weight, 50 = Nomal,75=Bold
第六列: size 120表示12pt
第七列flags 有三个选项：s   (smooth)
                              u   (unicode顺序保存)
                              a   (ascii 顺序保存,默认是Latin 1)。

    文件中每行都标识一个特定的字库，每个段的含义是：第一列为name，第二列为file，第三列为renderer，相当于字型格式，所以有 BDF，TTT，QPF等选择。第四列n表示iitalic，表示是否为斜体字。第五列表示weight，其中50表示Normal，75表示Bold。第六列表示size，例如：120表示12pt。第七列为flags，有下面三个选择：s=smooth(anti-aliased)u =unicode range when saving (default is Latin 1 a = ASCII range when saving(default is Latin 1))
                                                         —— 摘自参考文献[1]
    其中属性file，renderer(BDF，TTF，QPF)和size特别要设置对，其它属性问题不大。还要注意如果在该目录下有QPF的文件，系统只会使用QPF格式的文件，而不会读取其它格式的文件，不管FONTDIR里面的内容是什么。如果有多个QPF文件，应用程序按照大小，家族，黑体和斜体的顺序查找，即首先查找大小和自己一样的字库，大小无法区分唯一的字库的再看对应的家族，还是无法区分的再看是否黑体，是否斜体。可以参考PC上的字库索引文件FONTDIR：
例如：
-cclib -song -medium -r -normal -jiantizi -16 -160 -75 -75 -c -160 -gb2312 1980 -0
其中，每个段的含义如下：
cclib：制造商
song：字体族，此处表示“宋体”字
medium：字权重(中等)，还有bold(粗体)选项
r：倾斜，R(Roman)，I(Italic)，O(Oblique)
normal：字符集宽度，此外还有condensed，narrow，double
jiantizi：附加说明(此处意义为“简体字”)
16：用像素衡量的宽度。
160：点数 10
75(1)：水平分辨率(dpi)
75(2)：垂直分辨率(dpi)
c：间距。c：square，m：fixed width，p：variable width
160：平均宽度(10*pixels)
gb2312.1980：注册字符集，标准名
0：第0套，基本集
                                                      —— 摘自参考文献[2]

1.2 几种格式字库的简介
    QT支持四种格式的字库(TTF，BDF，PFA/PFB，QPF)(见参考文献[3])，但在产品中，如果直接使用，TTF或PFA/PFB。即让应用程序在显示的时候再计算点阵，最终的效果并不理想，会发现有些字大，有些字小，而且需要占用非常多的FLASH和内存，速度也有点慢，所以我在此不想过多的介绍PFA/PFB。如果直接使用BDF，速度非常慢，而且需要占用比较多的FLASH和内存;使用QPF，速度和占用其它资源是最小的，因此我们最终的产品中采用QPF格式。下面我简单介绍，TTF，BDF和QPF字体的结构，这样就比较容易理解后面的转换过程。

1.2.1 TTF字体
   TTF(TrueType Font)是Apple公司和Microsoft公司共同推出的字体文件格式，随着Windows的流行，已经变成最常用的一种字体文件表示方式。TTF 字体已经成功用在Windows中文版生成汉字字库，此字体采用二次B样条曲线来描述字符轮廓，对字符轮廓的上的点，按顺时针方向从小到大编号，填充部分在其右边。TTF文件结构分成三个部分：文件名(12Bytes)，描述表目录(每个16Bytes)，描述表数据。
    对于每一个字，都有一个假想的矩形框，正常情况字是不会超出这个矩形框的，中文属于象形字，不象英文，大小不一致，比如：英文中的f就可能会超出矩形框。微软把矩形的高度称为EM，实际字符的高度称为BODY.矩形框最原始的坐标系是矩形的中心为原点，但为了实际字体在打印和显示的使用过程中的方便，通常将坐标原点放在左下角，或中下。
    通常，在实际打印过程中，TTF字体是用像素来度量的，如何将矩形框中的字体转成像素呢?有一个计算公式，实例如下：如果18个点的72点每英寸屏下有一个550的长度，矩形框内有2048个单位。那其像素为550*18*72/72/2048=4.83像素。显然，每英寸里的点取的越多，字就越逼真，同时这样的存储空间和计算的时间也就越多。在嵌入程序开发过程中，这往往是不可以接受的，因为嵌入式系统的硬件资源本来就很有限，如果真的这样的话，在显示过程会很慢。并且如果为了提高速度而减少每英寸中的点数，则字体失真的情况很严重。更加具体的关于，TTF字体的内容可见参考资料[3]。
    另外，在Windows下编程，Microsoft实现了让用户对字体操作处理具有透明性，有关字体结构定义见参考文献[4]。

1.2.2 BDF字体
    BDF(Bitmap Distribution Format)是在X窗口系统中的一种表示位图字体的文件格式。是X协会定义的一种标准，是ASCII文件它由两部分组成，一是表示字体整体属性的文件头信息;二是每一个字符独有的属性和位图数据。我以16*16的位图字体为例描述BDF字体文件格式。
STARTFONT2.1 /*后面跟一个版本号，指出该字体文件版本*/
COMMENT /*表示注释*/
FONT -adobe -courier -bold -r -normal -16 -160 -75 -75 -m -160 -gb2312.1980 -0
/*表示字体名*/
SIZE 16 75 75 /*字符大小与在X，Y方向上的分辨率*/
FONTBOUNDINGBOX 16 16 0 0 /*X方向上宽度与Y方向高度及x和Y方向上的偏移*/
STARTPROPERTIES 16 /*设置字体的属性项目数*/
FOUNDRY "Adobe" /*字体的制造厂家*/
FAMILY_NAME "Courier" /*字体的变种字型*/
WEIGHT_NAME "Bold" /*字体的印刷权*/
SLANT "R" /*字体字型的设计情况*/
SEWINDTH_NAME "Normal" /*字体的缩放因素*/
ADD_STYLE_NAME "" /*唯一的标识该字体，一般为空*/
PIXEL_SIZE 16 /*依赖于设备的字体尺寸*/
POINT_SIZE 160 /*设计字体的实际尺寸*/
RESOLUTION_X 75 /*设计字体的水平分辨率*/
RESOLUTION_Y 75 /*设计字体的垂直分辨率*/
SPACING "m" /*指出字符宽度是定长还是可变*/
AVERAGE_WIDTH 160 /*字体中所有字符的平均宽度*/
CHARSET_REGISTRY "gb2312.1980" /*字符集名*/
CHARSET_ENCODING "0" /*字符集编号*/
FONT_DESCENT 0 /*基线下的高度*/
FONT_ASCENT 16 /*基线上的高度*/
ENDPROPERTIES /*属性项设置结束*/
CHAR 6775 /*字体文件中的字符数*/
STARTCHAR 啊 /*字符起始标志及名称*/
ENCODE 3021 /*X服务器在存取该字符时使用的编码。如汉字国标码*/
SWIDTH 1000 0 /*X和Y方向上的逻辑宽度和高度*/
DWIDTH 16 0 /*字符在x和Y方向上的设备单位宽度*/
BBX 16 16 0 0 /*字符边界框的宽度，高度以及偏移*/
BITMAP /*字符的位图的信息起始标志*/
0000 /*字符位图*/
04a0
……
0590
ENDCHAR /*字符结束标志*/
STARTCHAR 阿 /*第二个字符开始*/
……
ENDFONT /*BDF字体文件结束标志*/

1.2.3 QPF字体简介
    QPF格式的字库是仅用于QT/Embedded的不可缩放的字体，在程序运行过程中，对TTF格式的字体，在第一次装入使用时，都要以给定的字体大小进行处理;而对于BDF字体，当其使用时，所有字体都必须被处理;而对于QPF字体，均以相同格式的存储。所以在字体显示时，Qt只要读取字体，做相应分析，然后显示就完成了，这样进一步减少了对RAM资源的浪费。QPF字体是基于UNICODE编码的，这为QT/Embedded良好的可移植性奠定了基础。有关QPF更详细的资料可以查阅参考文献[5]。

2 如何从TTF字体文件转成QPF字体文件
2.1 把TTF转换成BDF
尽管不推荐使用TTF格式的字库，但由于TTF格式的字库可以转换成任意大小的BDF字库，而可以找到的BDF字库都是固定大小的，因此在实际制作QPF字体文件时，还是需要TTF格式的字库。把TTF转换成BDF的方法如下：
./ttf2bdf source.ttf -p yourSize -o destination.bdf
即利用软件ttf2bdf可以把源文件source.ttf转换成大小为yourSize的BDF格式的文件destination.bdf。那在程序内部是如何实现将TTF转成BDF的呢?由2.2.1和2.2.2的介绍，并且查阅参考文献[3]，可以知道TTF的内部存储结构。其中最核心的部分是 TTF文件格式中的12个字节的文件表：表目录按tag以升序排列。

Type	Name	Description
ULONG	tag	4字节的标识
ULONG	checkSum	表中的CheckSum
ULONG	offset	TrueType font文件的起始偏移量Offset
ULONG	length	表长

    还有一个有关Offset表的信息，包括版本号，表的数量，查找范围。入口选择，转换范围。
    通过操作文件表，将描述表中的数据取出来，按照BDF字体所定义的格式写入，就可以生成对应的字体。比如，可以给出一小段c语言程序，此程序用于计算当前CheckSum的位置。
ULONG
CalcTableChecksum(ULONG *Table,ULONG Length)
{
ULONG Sum = 0L;
ULONG *Endptr=Table+((Length+3)& ~3)/sizeof(ULONG);
while(TableSum += *Table++;
return Sum;
}
    利用此程序可以将每个字体的信息分开，并将每个字体信息从文件中取出来，对每个字体进行操作。在从TTF转到BDF过程中，仅通过使用WINDOW的函数是很不方便的，最方便的办法是使用c语言对字体进行操作。我在此列出转换过程中最重要的几个值：PIXEL_SIZE，POINT_SIZE，RESOLUTION_X，RESOLUTION_Y，FONT_DESCENT，FONT_ASCENT，SWIDTH，DWIDTH，BBX。这些值决定着最后生成的BDF字体与TTF字体的失真度，因为TTF是可缩放的，而BDF是固定大小的，所以在转换过程中一定会出现失真的情况。

2.2 对得到的BDF文件进行调整
    由于从软件xmbdfed里得到的三个字库不符合系统的要求，因此需要手动对其进行一些调整，其它方法得到的BDF文件不需要进行调整。
直接从xmbdfed里得到的字库是按照GB2312-80.0进行编码的，因此首先要将其转换成符合UNICODE编码，这需要用到我手动写的一个程序 gb2unieode，把源文件拷贝到gb2unicode程序的目录下，将其名字改为hanzist24a.txt(程序的要求，也可以不改名字而修改程序里源文件的名字再重新编译)，然后运行./change之后，就完成了，因为QT中因现成的转换函数可以调用，在此我不想多说关于用程序转换的代码。因为有一种更简单的方法，即在Word中打开GB字库。然后另存为UNICODE字库文件就行了。
    等待该命令执行完后(注意需要的时间比较长)，对所生成的文件dest.txt进行排序，方法如下：把dest.txt的名字改为dest.bdf(只要后缀名为bdf就行);然后运行软件xmbdfed，用其打开该文件(xmbdfed只能直接打开后缀明为bdf的文件)，另存为 yourname.bdf即可。排完序后需要手
动修改处理yourname.bdf。
    由上面介绍的BDF字体格式，现在对转换得到的BDF字体文件进行如下手工处理：先删除行说明属性默认的字符的行DEFAULT_CHAR 8481，因为从GB2312转换成UNICODE后，编码为8481的字符已经不存在了，如果不删除该行，运行时会出现段错误。然后删除那些存在于两个 16号字库但在标准GB2312中没有的一些字模。标准GB2312中有7445个字模，而两个16字库有7612个字模，多出来的那部分在用 gb2unicode转换的时候因为找不到相应的GB2312码而没有写进dest.txt的字模开始行"STARTCHAR ****"。可以用xmbdfed打开，如果出错则说明还有一些不完整的字模，还需要手动删除这些不完整的字模，如果可以正确打开则说明目标文件已经是正确的。(24号字库不存在这个问题，因此不需要进行本项操作。)最后从其它大小相同的.bdf文件中拷贝编码为20-7F(ASCII码)和编码为 FE54(分号;)的字模到目标文件。

2.3 把TTF.BDF转换成QPF
    从参考文献[5]中可以知道QT提供的把TTF，BDF转换成QPF的方法有两种，一种是工具makeqpf，这个命令无论是在Pc机上还是在开发板上都没有效果(但是QT的官方网站却说是可以的，不知道为什么，并且，也不是每个版本的QT都有makeqpf这个工具，还要说明的是，文献[6]中说这个工具是可以的，不过我没有试验成功)。
    另一种是运行应用程序时加上选项-savefonts，如在开发板上运行应用程序的命令：./sulfur -qws -savefonts
    如果此时系统中/usr/qt/lib/fonts目录下没有QPF格式的字库而只有TTF或BDF格式的字库，对应的文件fontdir中只保留要转换的文件的行，QT就会在运行时首先生成QPF格式的字库。尽管通过TTF字体也可以得到QPF字体，不过最好不要这样做，因为失真太大。

3 总结
经过本人对字库进行上述处理后，就可以在嵌入式开发板上显示各种字体，只要找到给定TTF或BDF的字库，如果找不到BDF字库，可以找到字库，然后通过 TTF2BDF这个程序来得到BDF字库。这样在开发板上可以显示行书，楷书等字体，并且字体显示也很正常，不会出现大小不一致的问题。但是，本人认为，由于这是嵌入式开发，存储资源非常有限，如果能进一步将字库缩小，只留下程序中所要用的汉字组成的字库就好了，这是需要下一步研究的方向。

参考文献：
[1]
[2] = viewtopic&t=82950&highlight=fonts.dir
[3] Microsoft Corporation. TTF Technical Specification Revision 1.66 November 1995.
[4] Windows 2000编程核心技术精解[M].中国水利水电出版社，2001.
[5]
[6] 黄敬群.Qt/Embedded中文处理实战[M]

阅读(6529) | 评论(0) | 转发(0) |

上一篇：qt中文编码

下一篇：qte undefined reference to QWidget::x11Even 一类错误信息

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6