Chinaunix首页 | 论坛 | 博客
  • 博客访问: 30492909
  • 博文数量: 708
  • 博客积分: 12163
  • 博客等级: 上将
  • 技术积分: 8240
  • 用 户 组: 普通用户
  • 注册时间: 2007-12-04 20:59
文章分类

全部博文(708)

分类: Java

2008-04-09 09:16:06

在JSP中表单转向servlet时,会出现get,post参数传递时,出现中文乱码问题,原因在于tomcat,本文讲述了如何解决tomcat下的中文问题:

    问题描述:

       1、 表单提交的数据,用request.getParameter(“xxx”)返回的字符串为乱码或者??
      2 、
直接通过url中国,这样的get请求在服务端用request. getParameter(“name”)时返回的是乱码;按tomcat4的做法设置Filter也没有用或者用request.setCharacterEncoding("GBK");也不管用
  

   原因:

    1、 tomcatj2ee实现对表单提交即post方式提示时处理参数采用缺省的iso-8859-1来处理
    2 、tomcat
get方式提交的请求对query-string 处理时采用了和post方法不一样的处理方式。(tomcat4不一样,所以设置setCharacterEncoding(“gbk”))不起作用。

   解决办法:

   首先所有的jsp文件都加上:
     1 、
实现一个Filter.设置处理字符集为GBK(tomcatwebapps/servlet-examples目录有一个完整的例子。请参考web.xmlSetCharacterEncodingFilter的配置。)

     1)
只要把%TOMCAT安装目录%/ webappsservlets-examplesWEB-    INFclassesfiltersSetCharacterEncodingFilter.class文件拷到你的webapp目录/filters下,如果没有filters目录,就创建一个。
     2)
在你的web.xml里加入如下几行:

    
          Set Character Encoding
           filters.SetCharacterEncodingFilter
         
               encoding
              GBK
         

    

    
         Set Character Encoding
         /*
   

     3)
完成.

       2 get方式的解决办法
       1)
打开tomcatserver.xml文件,找到区块,加入如下一行:
           URIEncoding=”GBK”
      完整的应如下:
                    port="80" maxThreads="150" minSpareThreads="25" maxSpareThreads="75"
           enableLookups="false" redirectPort="8443" acceptCount="100"
          debug="0" connectionTimeout="20000"
          disableUploadTimeout="true"
           URIEncoding="GBK"
           />
       

        2)重启tomcat,一切OK
       执行如下jsp页页测试是否成功
            <%@ page contentType="text/html;charset=gb2312"%>
           <%@ page import="java.util.*"%>
             <%
                String q=request.getParameter("q");
                q = q == null? "
没有值" : q;
              %>
      
        </FONT></SPAN><SPAN>新闻列表显示</SPAN><SPAN><FONT face="Times New Roman">
         
        
        
        你提交了:
        <%=q%>
       

       


       输入中文:">
      

        ">
通过get方式提交
      
       
测试结果如果你输入文本框或者点超链都会显示:你提交了中国”,说明成功!!!!!

 
比较详细的:
JSP显示中文有乱码怎么办,用request得到的用户输入的中文怎么是乱码,把汉字写到数据库怎么是乱码,等等一些关于汉字乱码的问题。其实这个问题很简单,管它汉字不汉字,还是日文,还是其他的什么双字节的语言,我们一律把它当作UTF-8看待。

      (一)request中的双字节文字

      我们来实现在整个应用程序中使用UTF-8编码工作,之所以选择UTF-8不仅仅之于上述原因,我们知道java的就是基于在UTF-8之上的,所以我们选择UTF-8应该没错
首先把我们的.java, .jsp文件都用UTF-8编码来保存,如果以前的没有用UTF-8保存也无所谓,但是建议以后写的都用UTF-8来保存。

      并在.jsp里面写:

以下是引用片段:
<%@page contentType="text/html; charset=UTF-8"%>而不是

      然后在web.xml添加下面一段:

以下是引用片段:

...
  
    Set Character Encoding
    com.redv.projects.eduadmin.util.filters.SetCharacterEncodingFilter
    
      encoding
      UTF-8
    

  

  
    Set Character Encoding
    /*
  

...

      其中com.redv.projects.eduadmin.util.filters.SetCharacterEncodingFilter的代码如下:

以下是引用片段:
package com.redv.projects.eduadmin.util.filters;
import java.io.IOException;
import javax.servlet.Filter;
import javax.servlet.FilterChain;
import javax.servlet.FilterConfig;
import javax.servlet.ServletException;
import javax.servlet.ServletRequest;
import javax.servlet.ServletResponse;
import javax.servlet.UnavailableException;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;

public class SetCharacterEncodingFilter
    implements Filter {

  protected String encoding = null;
  protected FilterConfig filterConfig = null;
  protected boolean ignore = true;
  public void destroy() {
    this.encoding = null;
    this.filterConfig = null;
  }
  public void doFilter(ServletRequest request, ServletResponse response,
                       FilterChain chain) throws IOException, ServletException {
    // Conditionally select and set the character encoding to be used
    if (ignore || (request.getCharacterEncoding() == null)) {
      String encoding = selectEncoding(request);
      if (encoding != null) {
        request.setCharacterEncoding(encoding);           //
Overrides the name of the character encoding used in the body of this request. This method must be called prior to reading request parameters or reading input using getReader().
      }
    }
    // Pass control on to the next filter
    chain.doFilter(request, response);
  }
  public void init(FilterConfig filterConfig) throws ServletException {
    this.filterConfig = filterConfig;
    this.encoding = filterConfig.getInitParameter("encoding");
    String value = filterConfig.getInitParameter("ignore");
    if (value == null) {
      this.ignore = true;
    }
    else if (value.equalsIgnoreCase("true")) {
      this.ignore = true;
    }
    else if (value.equalsIgnoreCase("yes")) {
      this.ignore = true;
    }
    else {
      this.ignore = false;
    }
  }
  protected String selectEncoding(ServletRequest request) {
    return (this.encoding);
  }
}

      这样,我们的request请求就是以UTT-8编码的,在JSP程序中就可以使用:request.getParameter("myKey")来直接得到UTF-8编码的字符串了,而不需要像这样:new String(request.getParameter("myKey").getBytes("ISO-8859-1"), "GBK")来解决那些乱码了。

      (二)数据库处理的双字节文字

      另外一个,就是写入数据库的问题,我们知道我们在使用mysql的时候可以改用这样的url来处理汉字编码问题:jdbc:mysql://localhost:3306/upas?useUnicode=true&characterEncoding=gb2312,那么对于那些我们无法像mysql这样解决的怎么办呢?难道我们每次都这样写吗:

以下是引用片段:
import java.sql.*;
Class.forName("org.gjt.mm.mysql.Driver");
Connection con = null;
PreparedStatement pstmt = null;
ResultSet rs = null;
try {
  con = DriverManager.getConnection("jdbc:mysql://localhost:3306/test", "root", "");
  pstmt = con.prepareStatement("SELECT f3, f4 FROM tbl1 WHERE f1 = ? AND f2 = ?");
  pstmt.setString(1, new String(f1.getBytes("GBK"), "ISO-8859-1");
  pstmt.setString(2, new String(f2.getBytes("GBK"), "ISO-8859-1");
  rs = pstmt.executeQuery();
  String f3, f4;
  while(rs.next()) {
    f3 = new String(rs.getString(1).getBytes("ISO-8859-1"), "GBK");
    f4 = new String(rs.getString(2).getBytes("ISO-8859-1"), "GBK");
  }
}
finally {
  //close resouces
  ...
}

      其实我们完全可以这样写:
 
以下是引用片段:
import java.sql.*;
import com.redv.sql.encoding.*;
Class.forName("org.gjt.mm.mysql.Driver");
Connection con = null;
PreparedStatement pstmt = null;
ResultSet rs = null;
try {
  con = DriverManager.getConnection("jdbc:mysql://localhost:3306/test", "root", "");
  //接管数据库连接实例
  boolean coding = true;
  EncodingConnection codingConnection = new EncodingConnection(con, coding, "ISO-8859-1", "GBK");
  //获得接管后的数据库连接实例,以后直接使用con已经是经过EncodingConnection重新包装过的实例
  con = codingConnection.getConnection();
  pstmt = con.prepareStatement("SELECT f3, f4 FROM tbl1 WHERE f1 = ? AND f2 = ?");
  pstmt.setString(1, f1);
  pstmt.setString(2, f2);
  rs = pstmt.executeQuery();
  String f3, f4;
  while(rs.next()) {
    f3 = rs.getString(1);
    f4 = rs.getString(2);
  }
}
finally {
  //close resouces
  ...
}

      看看,怎么样,我们只需要在获取数据库连接的地方稍微修改一下,甚至我们可以把它当作参数保存在 properties里面,改变coding的布尔值来设定是否使用自动编码转换。常常我们可以使用一个Database类来封装获取数据库连接的那段getConnection,以便于我们可以从 javax.sql.DataSource中获取到数据库连接。这个时候我们仅仅需要修改我们的Database类即可,而不用去搜索所有使用了rs.setString(), rs.getString()的地方去加入我们的编码转换代码了。

阅读(2457) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~