Chinaunix首页 | 论坛 | 博客
  • 博客访问: 708039
  • 博文数量: 118
  • 博客积分: 1437
  • 博客等级: 上尉
  • 技术积分: 1155
  • 用 户 组: 普通用户
  • 注册时间: 2009-02-22 20:23
文章分类

全部博文(118)

文章存档

2022年(32)

2017年(3)

2014年(4)

2013年(1)

2011年(2)

2010年(16)

2009年(60)

我的朋友

分类: LINUX

2009-06-05 09:09:20

关键字:USC,Unicode,utf-8,gb2312,字库

 

什么是编码

       为了交流信息,所以对字符进行了统一的编码。

UCSISO10646

       ISO10646定义了通用字符集(Universal Character Set,UCS).UCS是国际标准编码,包含了全球所有字符。UCS使用31bit进行编码。现在只分配了前65534个码位,这个16位的子集称为基本多语言面(BMP)

什么Unicode

       Unicode编码是UCS级别3的实现。Unicode编码全码为4个字节,所有字符都使用等的编码方式,现在只使用两个字节编码。兼容UCS定义的BMP

GB2313Unicode

       GB2312是中国定制的国际准标编码,由两个字节组成,最高位为1表示汉字,最高为0表示是英文。

       GB2312与区位码存在数值关系,区位码+20HGB2312

       GB2312Unicode的转换不成数学关系,只能通过映射表来实现。

       GB2312为80年定义的基本编码扩展编码有

       GBK

       GB18030

       GB13000GBK不兼容,只是使用了相同的词汇.

       最新为GB16500-95unicode3.0兼容

UnicodeUTF-8

       Utf-8是为了兼容软件处理的编码,是unicode的另一种表示方式。使用变化的方式编码,第一字节表示字符的长度,后面的字符以10开头表示编码。0开头表示ascii编码。

       例如:

Unicode 字符 U+00A9 = 1010 1001 (版权符号) UTF-8 里的编码为

              11000010 10101001 = 0xC2 0xA9

字库与编码关系

       字库是编码表字符显示的描述文件。字符编码是在字库中查询需要显示的字符的索引值。

       不同的编码就应该有不同的字库,比如unicode编码就有unicode的字库。Gb2312编码就有gb2312的字库。

 

字库格式

       字库的格式主要有TrueType(ttf),PostScript(rip),OpenType

       TrueType是微软定义的字库格式,主要用于软件显示这种要求精度不高的环境,

       PostScriptAdobe定义的字库格式,主要用于排版印刷等大字打印精度要求很高的环境。

       OpenTypeTrueTypePostScript的综合格式,并且是使用了unicode的编码。

 

 

字体引擎

       字体引擎用于读取字库,显示文字,文字转换等操作。现在免费的字体引擎有FreeType.

 

参考文献

    UTF-8 and Unicode FAQ by

   

http://developer.apple.com/fonts/TTRefMan/index.html

阅读(1114) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~