转自:http://www.sinzy.net/blog/Read.asp?ID=44&BID=4371
作者:秋梦无痕
- VC中GBK与UTF8字符串的转换
-
- 想在VC中把GB2312/GBK字符串转换成UTF8/Unicode字符串,昨天折腾了三个多小时,在google上跑了好几圈,还是没能实现,结果今天早上一过来就搞定了。共享之:
void ConvertGBKToUtf8(CString& strGBK) {
int len=MultiByteToWideChar(CP_ACP, 0, (LPCTSTR)strGBK, -1, NULL,0);
unsigned short * wszUtf8 = new unsigned short[len+1];
memset(wszUtf8, 0, len * 2 + 2);
MultiByteToWideChar(CP_ACP, 0, (LPCTSTR)strGBK, -1, wszUtf8, len);
len = WideCharToMultiByte(CP_UTF8, 0, wszUtf8, -1, NULL, 0, NULL, NULL);
char *szUtf8=new char[len + 1];
memset(szUtf8, 0, len + 1);
WideCharToMultiByte (CP_UTF8, 0, wszUtf8, -1, szUtf8, len, NULL,NULL);
strGBK = szUtf8;
delete[] szUtf8;
delete[] wszUtf8;
}
void ConvertUtf8ToGBK(CString& strUtf8) {
int len=MultiByteToWideChar(CP_UTF8, 0, (LPCTSTR)strUtf8, -1, NULL,0);
unsigned short * wszGBK = new unsigned short[len+1];
memset(wszGBK, 0, len * 2 + 2);
MultiByteToWideChar(CP_UTF8, 0, (LPCTSTR)strUtf8, -1, wszGBK, len);
len = WideCharToMultiByte(CP_ACP, 0, wszGBK, -1, NULL, 0, NULL, NULL);
char *szGBK=new char[len + 1];
memset(szGBK, 0, len + 1);
WideCharToMultiByte (CP_ACP, 0, wszGBK, -1, szGBK, len, NULL,NULL);
strUtf8 = szGBK;
delete[] szGBK;
delete[] wszGBK;
}
--------------------------------------------------------------
今天读几个TXT文件,有一个文件怎么读入都是乱码,看字体都是一样的,然后猜想是不是UNICODE的问题,就用wchar_t 的类型从文件中读出,通过WideCharToMultiByte函数转成ANSI的串,然而还是不行。
偶然间,我打开那个文件,然后选择另存为,原来格式果然是UTF-8的,然后我再看其他的文件都是ANSI的,呵呵,发现了问题,刚好在网上找到了“秋梦无痕”这篇文章!!
我看作者的这两个函数是用代码的形式发在BLOG上的,格式比较整齐,CU虽然改版了,很长时间都没有写BLOG文章了,新功能都还没用上。不知道好在哪里!!
阅读(9711) | 评论(1) | 转发(0) |