java判断一个文本文件的编码方式-hfm

hfm_honey学习乐园huangfanmei.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

hfm_honey

博客访问： 1513394
博文数量： 148
博客积分： 2234
博客等级：大尉
技术积分： 3225
用户组：普通用户
注册时间： 2012-05-17 21:34

个人简介

未来很长。

文章分类

全部博文（148）

文章存档

2017年（7）

2016年（4）

2015年（1）

2014年（6）

2013年（31）

2012年（99）

我的朋友

相关博文

java判断一个文本文件的编码方式

分类： Windows平台

2014-03-05 10:06:17

按照给定的字符集存储文本文件时，在文件的最开头的三个字节中就有可能存储着编码信息，所以，基本的原理就是只要读出文件前三个字节，判定这些字节的值，就可以得知其编码的格式。其实，如果项目运行的平台就是中文操作系统，如果这些文本文件在项目内产生，即开发人员可以控制文本的编码格式，只要判定两种常见的编码就可以了：GBK和UTF-8。由于中文Windows默认的编码是GBK，所以一般只要判定UTF-8编码格式。对于UTF-8编码格式的文本文件，其前3个字节的值就是-17、-69、-65，所以，判定是否是UTF-8编码格式的代码片段如下：测试文件编码是否为UTF-8

点击(此处)折叠或打开

public class Charset {
public static void main(String[] args) {
File f = new File("D:"+File.separator+"b.txt");
try {
java.io.InputStream ios = new java.io.FileInputStream(f);
byte[] b = new byte[3];
ios.read(b);
ios.close();
if (b[0] == -17 && b[1] == -69 && b[2] == -65)
System.out.println(f.getName() + "编码为UTF-8");
else
System.out.println(f.getName() + "可能是GBK");
} catch (Exception e) {
e.printStackTrace();
}
}
}

阅读(5658) | 评论(0) | 转发(0) |

上一篇：thinkPHP 学习笔记

下一篇：java 字节流与字符流的区别

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6