Chinaunix首页 | 论坛 | 博客
  • 博客访问: 413853
  • 博文数量: 55
  • 博客积分: 2124
  • 博客等级: 大尉
  • 技术积分: 621
  • 用 户 组: 普通用户
  • 注册时间: 2008-04-26 17:39
文章分类
文章存档

2011年(1)

2010年(2)

2009年(32)

2008年(20)

分类: 系统运维

2009-05-22 16:22:09

Internet Explorer 不支持国标汉字集 GB18030

国标18030是一套支持所有统一码汉字的字符集。在制作龙榆生先生纪念网站时,我曾希望使用此字符集来编码网页文件。如果使用了该字符集,有如下优点:

  1. 此字符集与现行的 GBK 编码比较兼容。
  2. 可支持统一码中的七万多个汉字。
  3. 使用的字节数比 UTF-8、UTF-16 等统一码编码方式要少很多。
  4. 在编译成 CHM 文件时,可被全文检索(如使用 UTF-8 等统一码编码,在 CHM 编译器在制作全文索引时不被支持,无法做全文索引)。

然而,当做好网页之后,使用 Internet Explorer 浏览,发现一些汉字居然变成了乱码。如以下附件即是。

文件: 使用IE以GB18030编码方式浏览时出现乱码的文档.rar
大小: 5KB
下载: 下载

乱码如下所示:

经测试,如果在出现乱码的地方前面加奇数个字符,乱码就会消失。操作系统为 Windows 2003,IE 7、IE 8 都是如此。但也有测试发现,加奇数个字符后,又会在其他地方出现乱码。

关于此现象的讨论,见:

注:在测试上述网页时,应选择浏览器编码为“GB18030”。有时候浏览器选择的编码为“GB2312”,这时不会出现乱码。

 

 

阅读(3261) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~