JSP技巧：从原理上解决Tomcat中文问题-Larpenteur-ChinaUnix博客

尘世中一个迷途小书童riverhwp.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

Larpenteur

博客访问： 6455952
博文数量： 2759
博客积分： 1021
博客等级：中士
技术积分： 4091
用户组：普通用户
注册时间： 2012-03-11 14:14

文章分类

全部博文（2759）

Todo（1）
Advice（151）
Linux-未分类（223）
Ubuntu（47）
Database（145）
算法&DS（77）
Android（47）
Web（214）
Geek（237）
CPPC（296）
Java（113）
Python（99）
Matlab（19）
Git（19）
SVN（11）
Gnuplot（5）
面试（0）
机器-挖掘-AI（6）
开源项目（1）
Happy Drawe（9）
Programming（144）

Tools（23）

Shell（66）

Makefile（11）

GDB（26）

vim（18）
System（628）

Author（110）

Common（4）

Memory（66）

File system（82）

Driver（19）

IO（66）

Storage（45）

General（38）

Architecture（19）

Command（64）

Kernel（115）
Virtualization（39）
Cloud（33）
Hadoop（71）
Big Data（24）
未分配的博文（100）

文章存档

2019年（1）

2017年（84）

2016年（196）

2015年（204）

2014年（636）

2013年（1176）

2012年（463）

我的朋友

相关博文

JSP技巧：从原理上解决Tomcat中文问题

分类： Web开发

2013-08-20 11:01:57

原文地址：JSP技巧：从原理上解决Tomcat中文问题作者：2394009892

很多开源软件都有国际化和本地化的问题，其实国际化本没有那么复杂，只是总有些公司希望通过拒绝国际标准来提高市场占有率，所以也就渐渐导致了现在的情况。很多开源软件首要支持的便是UTF编码，然后才是其他编码。(by gashero)当然也有些不着调的软件首选的是ISO-8859-1编码，甚至是ASCII编码。好了，下面先讲讲编码，因为Tomcat也是一种不着调的软件。

　　常见的中文编码有GB2312、GBK、GB18030等等，当然没有包括繁体中文，这些编码都是表示编码，而并非是显示编码。现在越来越多的软件，在其核心使用的显示编码或者说处理编码，是Unicode编码。Unicode编码使用2字节表示了世界上几乎所有的文字符号，作软件的内部国际化处理再适合不过了。

　　只是有些龌龊公司，为了商业目的，对内核的Unicode编码API全部屏蔽，对外只提供本地化编码。(by gashero)比如M公司在中文软件上就主推GBK编码。

　　还有一个问题就是用C/C++编写的很老的软件，字符串结束标志是'\0'，而使用Unicode的话，会无故的截断一些字符串。所以UTF-8就应运而生了，这种变长编码既可以减小字符串的体积，也可以防止阶段而传输Unicode编码。

　　至于传统的英文编码，最常见的就是两种。一是ASCII，这种字符集高位为0，用7位表示数据。另一种是ISO-8859-1，每个字符1字节，用8位表示一个字符。

　　Tomcat的内置编码就是使用了ISO-8859-1。这也是本文最关键的一句，各种技巧的根本。

　　由此可知由网页所提交的数据就需要从ISO-8859-1解码，如下是获得提交参数number的例子。

　　String number=new String(request.getParameter("number").getBytes("ISO-8859-1"),"UTF-8");

　　这句就成功的实现了从ISO-8859-1向UTF-8编码的转换。

　　有经验的读者应该遇到过通过＜jsp:param＞标签传递网页间参数时出错的问题。(by gashero)接收到的字符串只要是无论如何都是一堆问号。其实这也是Tomcat内部编码所导致的。如果可以顺应Tomcat的内部编码就可以传递中文字符串了。

　　比如一个页面间的内部重定向:

　　＜?xml:namespace prefix = jsp /＞＜jsp:forward page="index.jsp"＞

　　＜jsp:param name="name" value="＜%=new String(" % 中文参数?.getBytes(?UTF-8?),?ISO-8859-1?)＞" />

　　＜/jsp:forward＞

　　而在目的页面接收参数的时候也需要再次从ISO-8859-1编码转换到UTF-8编码。这样就实现了在页面之间传递中文参数。

阅读(418) | 评论(0) | 转发(0) |

上一篇：解析远程访问的三种入侵以及保护之道

下一篇：Ubuntu 下配置hadoop 1.0.3 （Single Node Cluster）

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6