分类:
2008-10-23 09:54:09
目前使用最广泛的西文字符集及其编码是 ASCII 字符集和 ASCII 码( ASCII 是 American Standard Code for Information Interchange 的缩写),它同时也被国际标准化组织( International Organization for Standardization, ISO )批准为国际标准。
基本的 ASCII 字符集共有 128 个字符,其中有 96 个可打印字符,包括常用的字母、数字、标点符号等,另外还有 32 个控制字符。标准 ASCII 码使用 7 个二进位对字符进行编码,对应的 ISO 标准为 ISO646 标准。下表展示了基本 ASCII 字符集及其编码:
代码 | 字符 | 代码 | 字符 | 代码 | 字符 | 代码 | 字符 |
---|---|---|---|---|---|---|---|
0 | 32 | [空格] | 64 | @ | 96 | ` | |
1 | 33 | ! | 65 | A | 97 | a | |
2 | 34 | " | 66 | B | 98 | b | |
3 | 35 | # | 67 | C | 99 | c | |
4 | 36 | $ | 68 | D | 100 | d | |
5 | 37 | % | 69 | E | 101 | e | |
6 | 38 | & | 70 | F | 102 | f | |
7 | 39 | ' | 71 | G | 103 | g | |
8 | ** | 40 | ( | 72 | H | 104 | h |
9 | ** | 41 | ) | 73 | I | 105 | i |
10 | ** | 42 | * | 74 | J | 106 | j |
11 | 43 | + | 75 | K | 107 | k | |
12 | 44 | , | 76 | L | 108 | l | |
13 | ** | 45 | - | 77 | M | 109 | m |
14 | 46 | . | 78 | N | 110 | n | |
15 | | 47 | / | 79 | O | 111 | o |
16 | | 48 | 0 | 80 | P | 112 | p |
17 | | 49 | 1 | 81 | Q | 113 | q |
18 | | 50 | 2 | 82 | R | 114 | r |
19 | 51 | 3 | 83 | S | 115 | s | |
20 | 52 | 4 | 84 | T | 116 | t | |
21 | 53 | 5 | 85 | U | 117 | u | |
22 | | 54 | 6 | 86 | V | 118 | v |
23 | | 55 | 7 | 87 | W | 119 | w |
24 | | 56 | 8 | 88 | X | 120 | x |
25 | | 57 | 9 | 89 | Y | 121 | y |
26 | | 58 | : | 90 | Z | 122 | z |
27 | 59 | ; | 91 | [ | 123 | { | |
28 | | 60 | < | 92 | \ | 124 | | |
29 | | 61 | = | 93 | ] | 125 | } |
30 | - | 62 | > | 94 | ^ | 126 | ~ |
31 | 63 | ? | 95 | _ | 127 | |
字母和数字的 ASCII 码的记忆是非常简单的。我们只要记住了一个字母或数字的 ASCII 码(例如记住 A 为 65 , 0 的 ASCII 码为 48 ),知道相应的大小写字母之间差 32 ,就可以推算出其余字母、数字的 ASCII 码。
虽然标准 ASCII 码是 7 位编码,但由于计算机基本处理单位为字节( 1byte = 8bit ),所以一般仍以一个字节来存放一个 ASCII 字符。每一个字节中多余出来的一位(最高位)在计算机内部通常保持为 0 (在数据传输时可用作奇偶校验位)。
由于标准 ASCII 字符集字符数目有限,在实际应用中往往无法满足要求。为此,国际标准化组织又制定了 ISO2022 标准,它规定了在保持与 ISO646 兼容的前提下将 ASCII 字符集扩充为 8 位代码的统一方法。 ISO 陆续制定了一批适用于不同地区的扩充 ASCII 字符集,每种扩充 ASCII 字符集分别可以扩充 128 个字符,这些扩充字符的编码均为高位为 1 的 8 位代码(即十进制数 128~255 ),称为扩展 ASCII 码。下表展示的是最流行的一套扩展 ASCII 字符集和编码:
代码 | 字符 | 代码 | 字符 | 代码 | 字符 | 代码 | 字符 |
---|---|---|---|---|---|---|---|
128 |
|