Chinaunix首页 | 论坛 | 博客
  • 博客访问: 331358
  • 博文数量: 29
  • 博客积分: 5710
  • 博客等级: 大校
  • 技术积分: 567
  • 用 户 组: 普通用户
  • 注册时间: 2006-09-18 11:52
文章分类

全部博文(29)

文章存档

2011年(2)

2010年(9)

2009年(6)

2008年(12)

我的朋友

分类:

2008-09-03 00:59:52

查看文本文件编码方式
来源: 作者: 发布时间:2008-02-03  

当一个软件打开一个文本时,它要做的第一件事是决定这个文本究竟是使用哪种字符集的哪种编码保存的。
软件一般采用三种方式来决定文本的字符集和编码:
检测文件头标识,提示用户选择,根据一定的规则猜测
最标准的途径是检测文本最开头的几个字节,开头字节Charset/encoding,如下表:
EF BB BF UTF-8
FE FF UTF-16/UCS-2, little endian
FF FE UTF-16/UCS-2, big endian
FF FE 00 00 UTF-32/UCS-4, little endian.
00 00 FE FF UTF-32/UCS-4, big-endian.
阅读(5335) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~