什么是Unicode编码-wangchenxicool-ChinaUnix博客

wangchenxicoolwcx.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

wangchenxicool

博客访问： 4317481
博文数量： 776
博客积分： 13014
博客等级：上将
技术积分： 10391
用户组：普通用户
注册时间： 2010-02-22 17:00

文章分类

全部博文（776）

x11（1）
avr-gcc（0）
iptables（3）
hostapd（3）
codes（8）
wcx_bb（11）
mini_httpd（1）
cups（2）
lubuntu（1）
kubuntu（2）
ncurses（1）
openwrt（19）
centos（2）
busybox（2）
shell（1）
protel（2）
android（7）
cubieboard（17）
ok6410（1）
AOI（0）
opencv（3）
onvif（5）
i2c（1）
vmware（1）
arduino（14）
a31（12）
qt（46）
bb-black（3）
pcDuino（24）
lua（3）
mfc（20）
dxf/svg/xml（7）
libevent（3）
linux维护（2）
软件调试（16）

Oops（5）
移植（10）
vim（26）
spi（14）
嵌入式（12）
常用算法（7）
数据库（13）
linux多线程编程（21）
linux网络编程（54）

socket网络编程（13）
硬件（3）
ftp（15）
c/c++（51）
电子（4）
ubuntu（42）
pppd/vpn（19）

pppd移植（1）
linux笔记（40）
工程师手册（18）
dbus（14）
我做过的项目（11）
3G模块（19）
pic（2）
makefile（7）
shell（74）
linux函数（10）
driver（29）
未分配的博文（17）

文章存档

2015年（55）

2014年（43）

2013年（147）

2012年（20）

2011年（82）

2010年（429）

我的朋友

相关博文

什么是Unicode编码

分类： LINUX

2010-03-15 10:44:31

UNICODE 是目前用来解决 ASCII 码 256 个字符限制问题的一种比较流行的解决方案。大家知道，ASCII 字符集只有256个字符，用 0-255 之间的数字来表示。包括大小写字母、数字以及少数特殊字符；如标点符号、货币符号等。对于大多数拉丁语言来说，这些字符已经够用。但是，许多亚洲和东方语言所用的字符远远不止256个字符。有些超过千个。人们为了突破 ASCII 码字符数的限制，试图用一种简单的方法来针对超过256个字符的语言编写计算机程序。于是 UNICODE 应运而生。UNICODE 通过用双字节来表示一个字符，从而在更大范围内将数字代码映射到多种语言的字符集。 Unicode给每个字符提供了一个唯一的数字，不论是什么平台，不论是什么程序，不论什么语言。Unicode标准已经被这些工业界的领导们所采用，例如：Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys和其它许多公司。最新的标准都需要Unicode，例如XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML等等，并且，Unicode是实现ISO/IEC 10646的正规方式。许多操作系统，所有最新的浏览器和许多其他产品都支持它。Unicode标准的出现和支持它工具的存在，是近来全球软件技术最重要的发展趋势。

为什么使用Unicode？
基本上，计算机只是处理数字。它们指定一个数字，来储存字母或其他字符。在创造Unicode之前，有数百种指定这些数字的编码系统。没有一个编码可以包含足够的字符：例如，单单欧州共同体就需要好几种不同的编码来包括所有的语言。即使是单一种语言，例如英语，也没有哪一个编码可以适用于所有的字母，标点符号，和常用的技术符号。这些编码系统也会互相冲突。也就是说，两种编码可能使用相同的数字代表两个不同的字符，或使用不同的数字代表相同的字符。任何一台特定的计算机（特别是服务器）都需要支持许多不同的编码，但是，不论什么时候数据通过不同的编码或平台之间，那些数据总会有损坏的危险。比如，简体中文（GB）、繁体中文（BIG5）、日文中，“赵”都是一个字，但是编码不同。在不同的编码下，BIG5的赵是0xBBAF，而0xBBAF在GB里面就被显示为“化”，这就是乱码。而Unicode采用统一的编码，“赵”只有一个，不必管他在哪种文字里。

Unicode的优点是什么？
举一个最明显的例子就是Windows 2000/XP以及微软Office2000及其后的产品。因为这些软件都是Unicode内核，因此，无论何种文字，都可以在上面正常显示，而且是同屏显示。以前，简体中文的Word文件拿到英文版打开就会是乱码，简体中文的程序在Windows英文版上运行会出现乱码，而现在一切都解决了。

本文来自CSDN博客，转载请标明出处：http://blog.csdn.net/Lawrencewt/archive/2009/03/27/4028278.aspx

阅读(1083) | 评论(0) | 转发(0) |

上一篇：linux常用c函数

下一篇：AT编程常见问题

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6