几种判断字符集编码的方法(Java)-qbq-ChinaUnix博客

IT民工窝棚qbq.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

qbq

博客访问： 30600969
博文数量： 708
博客积分： 12163
博客等级：上将
技术积分： 8240
用户组：普通用户
注册时间： 2007-12-04 20:59

文章分类

全部博文（708）

Highcharts（1）
Android（3）
多浏览器（2）
游记（1）
装修（1）
手机（2）
电影（1）
英语（2）
音乐（2）

国产（1）

欧美（1）
图片（1）
日本（6）
知识宝库（41）
文学收藏（6）
马尔代夫（2）
体育（6）
原创空间（1）
技术收藏（597）

SEO（1）

CSS3（5）

TestNG（4）

HTML5（2）

iBatis（3）

URLRewrite（1）

WebService（1）

WebServer（12）

PHP（8）

OGNL（1）

AS2（2）

Multimedia（0）

Flex AS3（29）

面试（9）

Commet（1）

Ivy（2）

Bat（8）

Maven（18）

CSS（7）

Ext（9）

Spring问题集（4）

Word（1）

JFreeChart（2）

Groovy on Grails（14）

Python（1）

Portlet（3）

amCharts（4）

CSharp.NET（3）

Tools（1）

S2Dao（8）

HSQL（9）

taglib（28）

Source Safe（3）

JSTL（6）

EL（2）

Seasar-SAStruts（3）

Prototype（0）

JQuery（3）

DWR（7）

AJAX（14）

Guice（13）

Digit（2）

Notebook（4）

Log4J（8）

Servlet（2）

JSP（4）

Eclipse（12）

VB.NET（3）

DotNet（3）

JavaScript（63）

Thinking In Soft（10）

Framework（11）

English（0）

Struts2（14）

Struts（38）

Hibernate（10）

Spring（30）

HTML（14）

Web（5）

MYSQL（9）

SQLSERVER（1）

ORACLE（2）

SQL（3）

数据库（0）

DATABASE（0）

Windows（8）

JAVA（67）

Software（1）

Hardware（3）

OpenSource（2）

Microsoft（0）

Excel（4）

DIY（5）

Linux（4）
关于工作（8）
个人日记（7）
未分配的博文（18）

推荐博文

相关博文

几种判断字符集编码的方法(Java)

分类： Java

2008-07-14 10:00:33

1.通过把未知编码字符串,用猜想的编码再解码,观察字符串是不是正确还原了。
原理:假如目标编码没有数组中的字符,那么编码会破坏,无法还原。
缺点:假如字符少,而正巧错误的猜想编码中有这种字节,就会出错。

如:new String("tested str".getBytes("enc"),"enc")

2.大多数时候,我们只要判断本地平台编码和utf8,utf8编码相当有规律,所以可以分析是否是utf9,否则使用本地编码。
原理:分析byte[]来判断规律。
缺点:有时,个别本地编码字节在utf8中也会出现,导致出错,需要分析。

如转贴得函数: