UNICODE WINDOWS 记事本-GilBert1987-ChinaUnix博客

米斯特逗的学习笔记gilbert.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

GilBert1987

博客访问： 1519000
博文数量： 218
博客积分： 6394
博客等级：准将
技术积分： 2563
用户组：普通用户
注册时间： 2008-02-08 15:33

个人简介

持之以恒

文章分类

全部博文（218）

Android（12）

四大组件（3）

开发环境（5）

Games（2）

Interview（1）

HTTP（0）
Linux（5）

多线程同步（4）

编译内存性能（1）
C/C++（56）

基础（1）

String（3）

文件操作（3）

STL（10）
算法+数据结构（23）

索引结构学习（1）
Design Patterns（16）
Video（1）

RTMP（0）

FFMPEG（1）
计算机网络（28）

ACE（12）

网络基础（9）

HTTP（1）

HHTPS&&SSL（0）

Apache（2）
Java（3）

多线程（1）
Ubutun（1）
DataBase（2）
XML（3）
WinCE（7）
ARM（19）
Windows编程和MFC（35）
Pattern Recognit（6）
Others（1）
未分配的博文（0）

文章存档

2013年（8）

2012年（2）

2011年（21）

2010年（55）

2009年（116）

2008年（16）

我的朋友

最近访客

推荐博文

UNICODE WINDOWS 记事本

分类：

2010-05-26 00:01:14

昨天写一个程序:用Win的ReadFile函数读取一个UNICODE编码的TXT文件，读进来发现前面两个字节是FFFE
后面网上搜了下一才知道
windows对UTF-8文件进行了特殊处理，即对UTF-8的文本文件自动在前面加了两个byte（FF FE），但是不会显示出来，我晕
只能用十六进制编辑器，将它删掉，汗

阅读(870) | 评论(2) | 转发(0) |

上一篇：外排序(转)

下一篇：编程珠玑--读书笔记(一)

给主人留下些什么吧！~~

GilBert19872010-05-26 10:49:30

谢谢楼上的提醒，查了一下，的确是BOM BOM——Byte Order Mark 字节序标记。在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如果接收者收到FEFF，就表明这个字节流是Big-Endian的；如果收到FFFE，就表明这个字节流是Little- Endian的。因此字符"ZERO WIDTH NO-BREAK SPACE"又被称作BOM。

回复 | 举报

chinaunix网友2010-05-26 10:09:06

BOM??

回复 | 举报

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6