Chinaunix首页 | 论坛 | 博客
  • 博客访问: 656840
  • 博文数量: 151
  • 博客积分: 3498
  • 博客等级: 中校
  • 技术积分: 1570
  • 用 户 组: 普通用户
  • 注册时间: 2005-02-28 18:10
文章分类

全部博文(151)

文章存档

2014年(12)

2013年(17)

2012年(17)

2011年(5)

2010年(12)

2009年(2)

2007年(26)

2006年(22)

2005年(38)

分类: WINDOWS

2006-03-02 20:46:15

转自:http://www.sinzy.net/blog/Read.asp?ID=44&BID=4371
作者:秋梦无痕


VC中GBK与UTF8字符串的转换 
想在VC中把GB2312/GBK字符串转换成UTF8/Unicode字符串,昨天折腾了三个多小时,在google上跑了好几圈,还是没能实现,结果今天早上一过来就搞定了。共享之:
void ConvertGBKToUtf8(CString& strGBK) {
    int len=MultiByteToWideChar(CP_ACP, 0, (LPCTSTR)strGBK, -1, NULL,0);
    unsigned short * wszUtf8 = new unsigned short[len+1];
    memset(wszUtf8, 0, len * 2 + 2);
    MultiByteToWideChar(CP_ACP, 0, (LPCTSTR)strGBK, -1, wszUtf8, len);

    len = WideCharToMultiByte(CP_UTF8, 0, wszUtf8, -1, NULL, 0, NULL, NULL);
    char *szUtf8=new char[len + 1];
    memset(szUtf8, 0, len + 1);
    WideCharToMultiByte (CP_UTF8, 0, wszUtf8, -1, szUtf8, len, NULL,NULL);

    strGBK = szUtf8;
    delete[] szUtf8;
    delete[] wszUtf8;
}

void ConvertUtf8ToGBK(CString& strUtf8) {
    int len=MultiByteToWideChar(CP_UTF8, 0, (LPCTSTR)strUtf8, -1, NULL,0);
    unsigned short * wszGBK = new unsigned short[len+1];
    memset(wszGBK, 0, len * 2 + 2);
    MultiByteToWideChar(CP_UTF8, 0, (LPCTSTR)strUtf8, -1, wszGBK, len);

    len = WideCharToMultiByte(CP_ACP, 0, wszGBK, -1, NULL, 0, NULL, NULL);
    char *szGBK=new char[len + 1];
    memset(szGBK, 0, len + 1);
    WideCharToMultiByte (CP_ACP, 0, wszGBK, -1, szGBK, len, NULL,NULL);

    strUtf8 = szGBK;
    delete[] szGBK;
    delete[] wszGBK;
}




--------------------------------------------------------------
今天读几个TXT文件,有一个文件怎么读入都是乱码,看字体都是一样的,然后猜想是不是UNICODE的问题,就用wchar_t 的类型从文件中读出,通过WideCharToMultiByte函数转成ANSI的串,然而还是不行。
  偶然间,我打开那个文件,然后选择另存为,原来格式果然是UTF-8的,然后我再看其他的文件都是ANSI的,呵呵,发现了问题,刚好在网上找到了“秋梦无痕”这篇文章!!
  我看作者的这两个函数是用代码的形式发在BLOG上的,格式比较整齐,CU虽然改版了,很长时间都没有写BLOG文章了,新功能都还没用上。不知道好在哪里!!

阅读(9711) | 评论(1) | 转发(0) |
给主人留下些什么吧!~~