多字节与Unicode区别与使用函数-lzn

lzn_sc

首页　| 　博文目录　| 　关于我

lzn_sc

博客访问： 379033
博文数量： 132
博客积分： 3066
博客等级：中校
技术积分： 781
用户组：普通用户
注册时间： 2009-04-14 16:19

文章分类

全部博文（132）

虚拟机技巧（1）
其它（1）
版本管理（2）
游戏（1）
图像处理（2）
网络协议（2）
OFFICE技巧（5）
字符集（18）
编程开发（92）

数据库（5）

c++（16）

linux（6）

跨平台（4）

服务器（1）

网络编程（5）

sqlite3（1）

网络开发（5）

C_SHARP（6）

趣味应用（12）

c++（5）

WINCE（12）

嵌入式开发（0）

网络编程（9）

MFC（5）

JAVA（0）

vc（0）
未分配的博文（8）

文章存档

2012年（1）

2010年（50）

2009年（81）

我的朋友

相关博文

多字节与Unicode区别与使用函数

分类： C/C++

2009-05-22 12:25:57

本文摘自《windows核心编程》

1.双字节字符集

使用双字节字符集，对于程序员来说简直是个很大的难题，因为有些字符只有一个字节宽，而有些字符则是两个字节宽。为了帮助你对D B C S 字符串进行操作，Wi n d o w s 提供了下面的一组帮助函数。

函数	描述
PTSTR CharNext(PCTSTR pszCurrentChar);	返回字符串中的下一个字符的地址
PTSTR CharPrev (PCTSTR pszStart,PCTSTR p s z C u r r e n t C h a r);	返回字符串中的上一个字符的地址
BOOL IsDBCSLeadByteTRUE(BYTE bTestChar);	如果该字节是DBCS 字符的第一个字节，则返回

2.Unicode ：宽字节字符集

U n i c o d e 用一个1 6 位的值来表示每个字符，提供了一种简单而又一致的表示字符串的方法。U n i c o d e 字符串中的所有字符都是1 6 位的（两个字节）。它没有专门的字节来指明下一个字节是属于同一个字符的组成部分，还是一个新字符。这意味着你只需要对指针进行递增或递减，就可以遍历字符串中的各个字符。

3. C 运行期库对Unicode的支持

为了利用U n i c o d e 字符串，定义了一些数据类型。标准的C 头文件S t r i n g . h 已经作了修改，以便定义一个名字为w c h a r _ t 的数据类型，它是一个U n i c o d e 字符的数据类型： typedef unsigned short wchar_t;

与一些标准的ANSI C 字符串函数等价的U n i c o d e 函数：

1）char * strcat(char *,const char *);
wchar_t * wcscat(wchar_t *,const wchar_t *);

2）char * strchr(const char *,int);
wchar_t * wcschr(const wchar_t *,wchar_t);
3）int strcmp(const char *,const char *);
int wcscmp(const wchar_t *,const wchar_t *);
4）char * strcpy(char *,const char *);
wchar_t * wcscpy(wchar_t *,const wchar_t *);
5）size_t strlen(const char *);
size_t wcslen(const wchar_t *);

对于包含了对s t r 函数或w c s 函数进行显式调用的代码来说，无法非常容易地同时为A N S I 和U n i c o d e 对这些代码进行编译。以创建同时为A N S I 和U n i c o d e 进行编译的单个源代码文件。若要建立双重功能，必须包含T C h a r. h 文件，而不是包含S t r i n g . h 文件。

T C h a r. h 文件的唯一作用是帮助创建A N S I / U n i c o d e 通用源代码文件。

阅读(856) | 评论(0) | 转发(0) |

上一篇：有关UNICODE、ANSI字符集和相关字符串操作

下一篇：CRichEditCtrl 超文本编辑

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6