ansi编码-wsnhyjj-ChinaUnix博客

FinL

首页　| 　博文目录　| 　关于我

wsnhyjj

博客访问： 348801
博文数量： 88
博客积分： 2011
博客等级：大尉
技术积分： 885
用户组：普通用户
注册时间： 2010-05-21 14:50

文章分类

全部博文（88）

Minix3虚存设计（1）
安全（1）
算法&数据结构（25）
面&笔题（30）
杂感（6）
Linux（24）
未分配的博文（1）

文章存档

2010年（88）

我的朋友

关于ansi编码的BUG

　　很多细心的人会发现，当新建文本文档只输入“联通”2字保存再打开时将是乱码。

　　当txt文档中一切字符都在 C0≤AA≤DF 80≤BB≤BF 这个范围时，notepad都无法确认文档地格式，没有自动依照UTF-8格式来"Display"。而"联通"就是C1 AA CD A8，刚好在上面地范围内，所以不能正常显现。

　　记事本默认是以ANSI编码保存文本文档的，而正是这种编码存在的bug招致了上述怪现象。假如保存时选择Unicode、Unicode(big endian)、UTF-8编码就正常了。此外，假如以ANSI编码保存含有某些特别符号的文本文档，再次打开后符号也会变成英文问号。例如输入英文 this app can break 以ANSI编码保存也会变成乱码。

阅读(1559) | 评论(0) | 转发(0) |

上一篇：比较两棵二叉树是否相等

下一篇：过滤字符串中ansi编码的字符

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6