宽字符标量L-cdutlibing-ChinaUnix博客

vc++ c++ c 程序开发（vc学习园地cdutlibing.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

cdutlibing

博客访问： 9836341
博文数量： 1227
博客积分： 10026
博客等级：上将
技术积分： 20273
用户组：普通用户
注册时间： 2008-01-16 12:40

文章分类

全部博文（1227）

心得感想（0）
test（0）
COM技术（134）

MS Office中的COM（13）

IE编程（12）

ActiveX控件应用（6）

ActiveX控件开发（14）

OLE Automation（3）

WTL（10）

ATL（30）

COM技术_COM_DCO（46）
新闻（572）
工具与产品（0）

设计工具（0）

发布工具（0）

测试工具（0）

调试工具（0）

开发工具（0）
技术英语（0）
标准与规范（0）
程序员话题（0）
开发新闻与技术展（7）
软件工程（19）
硬件与嵌入开发（14）
VC环境与编译调试（21）
XML（17）
脚本语言（3）
WEB Services（1）
.NET平台（50）

应用开发（16）

系统安全（13）

公共语言运行时（21）
文件系统（21）

文件格式（2）

文件与目录对话框（4）

驱动器与磁盘信息（1）

文件操作_拷贝_查（14）
WINDOWS系统（143）

其它（24）

NT服务（7）

注册表（5）

剪贴板（2）

Shell编程（10）

驱动程序开发（11）

钩子HOOK（7）

消息系统（11）

多任务_多进程_（25）

DLL（16）

WIN32 API（25）
数据库（47）

数据库技术_SQL索（4）

Access（3）

Oracle（5）

SQL Server（8）

ODBC（27）
网络与通信（79）

网络安全（7）

通信协议（15）

RAS拨号上网（1）

MODEM通信（1）

并行通信（2）

串行通信（11）

局域网（4）

Internet与WEB服（17）

WinSock（21）
图形、图像与多媒（52）

游戏开发（4）

图形算法（8）

OpenGL（2）

DirectX（5）

视频技术（2）

音频技术（9）

图形存取（6）

图像格式（2）

字体与GDI（5）

位图与调色板（9）
WINDOWS窗口视图（28）

报表与打印（7）

高级用户界面（7）

窗口管理（6）

视图分割与停靠（3）

多文档界面（5）

单文档界面（0）

对话框（0）
WINDOWS标准界面（0）

其它控件（0）

数据表格控件（0）

进度条（0）

列表控件（0）

树型控件（0）

静态控件（0）

属性页（0）

组合框（0）

多功能编辑控件（0）

编辑控件（0）

状态条（0）

工具提示（0）

工具条（0）

菜单（0）

按钮（0）
一般性编程问题（0）

C++、MFC（0）

杂项（0）

Samples（0）

加解密（0）

常用算法与数据结（0）

日期与时间（0）

字符串处理（0）

STL（0）
未分配的博文（19）

文章存档

2010年（1）

2008年（1226）

我的朋友

相关博文

宽字符标量L

分类： C/C++

2008-04-23 21:54:38

宽字符标量L"xx"在VC6.0/7.0和GNU g 中的不同实现

作者：乾坤一笑

　　锲子：本文源于在 VCKBASE 和周星星大哥的一番讨论，这才使我追根索源，找到了理论依据和实践的证明。（本文一些资料和测试代码由周星星提供）

《The C Programming Language 3rd》中有这么两段话：

from 4.3:
A type wchar_t is provided to hold characters of a larger character set such as Unicode. It is a distinct type. The size of wchar_t is implementation-defined and large enough to hold the largest character set supported by the implementation’s locale (see §21.7, §C.3.3). The strange name is a leftover from C. In C, wchar_t is a typedef (§4.9.7) rather than a builtin type. The suffix _ t was added to distinguish standard typedefs.

from 4.3.1:
Wide character literals are of the form L′ab′, where the number of characters between the quotes and their meanings is implementation-defined to match the wchar_t type. A wide character literal has type wchar_t.

这两段话中有两个要点是我们关心的：

wchar_t 的长度是由实现决定的；
L"ab" 的含义是由实现决定的。

那么GNU g 和VC6.0/7.0各是怎么实现的呢？看下面代码：

//author: **.Zhou

#include 

#include 

#include 



void prt( const void* padd, size_t n )

{

    const unsigned char* p = static_cast( padd );

    const unsigned char* pe = p   n;

    for( ; p

      　　这段代码说明了，g  （Dev-CPP 用的是 MingGW 编译器）中 L"xx" 解释为把作为 non-wide-char 的 "xx" 

      扩展为作为 wide-char 的 wchar_t，不足则在高位补0；而 VC6.0 的 L"xx" 解释为把作为 MBCS 的 "xx" 

      转换为作为 unicode 的 WCHAR，目前的 MBCS 是以 char 为一个存储单元的，而 WCHAR 在 winnt.h 中定义为 

      typedef wchar_t WCHAR。在 Windows 平台上，只要是超过 0~127 范围内的 char 型字符，都被视为 MBCS，它由1到2个字节组成，MBCS 

      字符集跟它的地区代码页号有关。在某个特定的 Windows 平台，默认的代码页号可以在控制面板 -> 区域选项中设定。


      


      关于上述结论可以有下面这个程序来验证：

      //author: smileonce

#include 

#include 

#include 

#include 



void prt( const void* padd, size_t n )

{

    const unsigned char* p = static_cast( padd );

    const unsigned char* pe = p   n;

    for( ; p

      呵呵，问题已经明了，总结一下：

        ISO C 中 wchar_t 是一个 typedef，ISO C   中 wchar_t 是语言内建的数据类型，L"xx" 是ISO 

        C/C   语言内建的表示 wchar_t 的文本量的语法；

        wchar_t 的长度是由实现决定的；

        L"xx" 的意义是由实现决定的；

        默认的 "xx" 是 non-wide-char，其每个元素数据的类型是 char；与其相对应的 L"xx" 

        是wide-char,其每个元素数据的类型是wchar_t。

      

      　　为什么 C/C   语言把 L"xx" 定义为由实现决定的呢？这显然是为了 C/C   的普适性、可移植性。Bjarne 

      的观点认为，C   的方式是允许程序员使用任何字符集作为串的字符类型。另外，unicode 

      编码已经发展了若干版本了，是否能永久适合下去也不得而知。有关 unicode 的详细论述以及和其它字符集的比较，我推荐你看。

阅读(434) | 评论(0) | 转发(0) |

上一篇：用VC实现PC并行端口数字信息的输入/输出

下一篇：串口类库的第二个版本

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6