Chinaunix首页 | 论坛 | 博客
  • 博客访问: 307142
  • 博文数量: 146
  • 博客积分: 198
  • 博客等级: 入伍新兵
  • 技术积分: 689
  • 用 户 组: 普通用户
  • 注册时间: 2010-08-24 08:35
文章分类

全部博文(146)

文章存档

2013年(46)

2012年(98)

2011年(1)

2010年(1)

我的朋友

分类: 嵌入式

2013-02-22 11:55:25

原文地址:字符编码详解 v1.0 作者:crifan

字符编码详解

版本: 1.0

作者: crifan

邮箱: green-waste at163.com

 

-----------------------------------------------------------

PDF下载:

1. 字符编码详解 v1.0.pdf (937.93 KB)

2.  字符编码详解 v1.0.pdf    

-----------------------------------------------------------

 

内容简介

介绍了编码相关背景知识;
介绍了ASCII,EASCII,ISO/IEC 8859,Unicode,ISO 10646的解释;
添加了UTF-8和Unicode的区别和联系

 

关键字

字符编码,ASCIIISO 8859ISO 10646UCSUnicodeUTF-8

  

版本

版本

日期

内容更新

1.0

2011-11-02

添加了编码相关背景知识介绍

添加了ASCIIEASCII编码介绍

添加了ISO/IEC 8859相关的编码和各种单字节编码的关系

添加了UnicodeISO 10646的解释

添加了UTF-8Unicode的区别和联系

 
目录
1 正文之前 5
1.1 目的 5
1.2 本文内容 5
1.3 声明 5
2 字符编码相关的背景知识 6
2.1 拉丁字母 6
2.2 什么是字符编码 6
3 字符编码标准 8
3.1 只支持基本的拉丁字符的字符编码:ASCII 8
3.1.1 ASCII的由来 8
3.1.2 ASCII编码规则 8
3.1.3 ISO 646 9
3.1.4 ASCII码表/编码字符表 9
3.2 支持多种衍生拉丁字母的字符编码:EASCII和ISO 8859 10
3.2.1 EASCII 11
3.2.2 ISO 8859 11
3.2.2.1 ISO/IEC 8859出现的背景 11
3.2.2.2 ISO/IEC 8859的编码规则 11
3.2.2.3 ISO/IEC 8859的特点 13
3.2.2.4 ISO/IEC 6429 14
3.2.2.5 ISO 8859和ISO-8859的区别和联系 14
3.2.2.5.1 原先的ISO 8859-1和我们常说的ISO 8859-1 15
3.3 各种单字节编码标准的关系 17
3.4 支持世界上几乎所有字符的字符编码:Unicode 17
3.4.1 Unicode和ISO 10646的关系 18
3.4.1.1 ISO 10646=UCS 18
3.4.1.2 Unicode 和ISO 10646的联系 18
3.4.1.3 Unicode和ISO 10646的区别 19
3.4.2 Unicode编码规则 20
3.4.3 Unicode字符编码所对应的存储和交换标准:UTF-8, UTF-16, UTF-32 21
3.4.3.1 UTF-8 21
3.4.3.2 Unicode与UTF-8之间的转换 22
3.4.3.2.1 关于UTF-8的BOM:“EF BB BF” 23
3.5 字符存储(交换)标准 24
3.6 字形和你所看到的字符的关系 25
4 引用 26

图表
图表 1 ASCII编码表 10
图表 2 ISO/IEC 8859编码标准中的15种字符集 12
图表 3 ISO/IEC 8859的15个字符集的部分比较 13
图表 4 ISO/IEC 8859-1字符集表 16
图表 5 各种单字节编码标准之间的关系 17
图表 6 ISO/IEC 10646与Unicode的版本对应关系 19
图表 7 Unicode中的各种平面划分 20
图表 8 Unicode与UTF-8之间的编码映射关系 22
图表 9 Notepad中的各种编码 22
图表 10 字符(存储)交换标准 24
图表 11 汉字“宋”的不同字体 25
 

缩写

缩写

全称

含义

ASCII

American Standard Code for Information Interchange

美国信息交换标准代码

BMP

Basic Multilingual Plane

基本多文种平面

EBCDIC

Extended Binary Coded Decimal Interchange Code

扩展二进制编码十进制交换码

IANA

Internet Assigned Numbers Authority

互联网号码分配局

ISO/IEC

International Organization for Standardization /

International Electrotechnical Commission

国际标准化组织和国际电工委员会

UCS

Universal Character Set

通用字符集

UTF

Unicode Transformation Format

Unicode转换格式

 

阅读(1458) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~