分类:
2009-04-28 08:53:16
(1)汉字。共有汉字6763个,它分为两级,第一级汉字3755个,按拼音排序,约占近代文献汉字累计使用频度99.9%左右;二级汉字3008个,按部首、笔画排序
(2)202个一般符号。其中包括1.~20.,(1)~(20),①~⑩,(-)~(+)等
(3)22个数字。其中0~9共10个,Ⅰ~Ⅻ共12个
(4)52个拉丁字母。其中大写字母A~Z 26个,小写字母a~z 26个
(5)169个日文假名。其中平假名83个,片假名86个
(6)48个希腊字母。其中大写字母Α~Ω24个,小写字母α~ω 24个
(7)66个俄文字母。其中大写字母А~Я33个,小写字母а~я 33个
(8)26个汉语拼音符号。包括带声调符号和其它符号的字母
(9)37个汉语注音字母。ㄅ~ㄥ
中文字符由两个字节组成,每个字节的ASCII码都大于127(因为每字节的最高为都定义为1)。中文字符码实质上是一种区位码,其编码空间是94*94,即有8836个码位,除了有7445个字符之外,还有1391个空位。具体的说,国标码的两个字节的ASCII值都是161-254之间的整数。
根据这个思想,我们便可以很容易的实现由机器自动生成国标码的字符。
值得一提的是,国标码总共有6763个汉字,对于处理一般的现代汉语是够用的,但也有些特别的地名和人名用字在国标码中没有。这时往往会根据实际的需要采取相应的特殊措施。