[转帖]Java WEB应用中乱码的解决_Android, Python及开发编程讨论区_Weblogic技术|Tuxedo技术|中间件技术|Oracle论坛|JAVA论坛|Linux/Unix技术|hadoop论坛_联动北方技术论坛  
网站首页 | 关于我们 | 服务中心 | 经验交流 | 公司荣誉 | 成功案例 | 合作伙伴 | 联系我们 |
联动北方-国内领先的云技术服务提供商
»  游客             当前位置:  论坛首页 »  自由讨论区 »  Android, Python及开发编程讨论区 »
总帖数
1
每页帖数
101/1页1
返回列表
0
发起投票  发起投票 发新帖子
查看: 2722 | 回复: 0   主题: [转帖]Java WEB应用中乱码的解决        下一篇 
    本主题由 koei 于 2014-5-2 16:25:20 移动
红与黑
注册用户
等级:上尉
经验:644
发帖:51
精华:1
注册:2013-2-25
状态:离线
发送短消息息给红与黑 加好友    发送短消息息给红与黑 发消息
发表于: IP:您无权察看 2013-2-28 16:57:36 | [全部帖] [楼主帖] 楼主

在项目中总是遇到乱码问题,有时候在网上查找到了解决方案,但是没有记录下来为什么出现的乱码。因为出现乱码的方式有好几种,我简单总结一下吧,为以后留着用,也算总结学习一下。 

一般来讲,为了处理乱码问题,在javaweb中我们需要注意哪些地方? 

1、java文件的编码格式 

2、jsp页面的编码格式 

3、在servlet中对request、response对象的编码格式的设定 

4、浏览器中查看页面的字符集编码格式 

前提: 

1.开发和编译代码时指定字符集,JBuilder和Eclipse都可以在项目属性中设置。页面的编码格式一致: 

所有页面的编码格式应该尽量一样,因为有时候在两个页面之间跳转的时候,如果编码格式不一,那么服务器不知道该用哪一种编码格式。 

2.页面编码格式和tomcat配置文件中的编码格式保持一致: 

tomcat/conf/server.xml配置文件中Connector(连接器)标签URIEncoding(统一资源标示符编码)的属性为GBK或UTF-8。 

3.使用过滤器,如果所有请求都通过一个servlet控制分配器,那么使用servlet的filter的执行语句,将浏览器发送过来的请求都设置编码为utf-8. 

在web.xml文件中: 

Xml代码 北京联动北方科技有限公司北京联动北方科技有限公司北京联动北方科技有限公司

  1. <filter>
  2. <filter-name>SetCharacterEncodingFilter</filter-name>
  3. <filter-class>com.struts.beans.SetCharacterEncodingFilter</filter-class>
  4. <init-param>
  5. <param-name>encoding</param-name>
  6. <param-value>utf-8</param-value>
  7. </init-param>
  8. </filter>
  9. <filter-mapping>
  10. <filter-name>SetCharacterEncodingFilter</filter-name>
  11. <url-pattern>/*</url-pattern>
  12. </filter-mapping> 

 <filter>
<filter-name>SetCharacterEncodingFilter</filter-name>
<filter-class>com.struts.beans.SetCharacterEncodingFilter</filter-class>
<init-param>
<param-name>encoding</param-name>
<param-value>utf-8</param-value>
</init-param>
</filter>
<filter-mapping>
<filter-name>SetCharacterEncodingFilter</filter-name>
<url-pattern>/*</url-pattern>
</filter-mapping>


在类中: 

Java代码 

北京联动北方科技有限公司北京联动北方科技有限公司北京联动北方科技有限公司

  1. public class SetCharacterEncodingFilter implements Filter {
  2.       private String encoding;
  3.       public void init(FilterConfig filterConfig) throws ServletException {
  4.             // TODO Auto-generated method stub 
  5.             this.encoding = filterConfig.getInitParameter(encoding);
  6.       }
  7.       public void doFilter(ServletRequest request, ServletResponse response,
  8.       FilterChain chain) throws IOException, ServletException {
  9.             
  10.             request.setCharacterEncoding(this.encoding);
  11.             chain.doFilter(request, response);
  12.       }} 

public class SetCharacterEncodingFilter implements Filter {
      private String encoding;
      public void init(FilterConfig filterConfig) throws ServletException {
            // TODO Auto-generated method stub
            this.encoding = filterConfig.getInitParameter(encoding);
      }
      public void doFilter(ServletRequest request, ServletResponse response,
      FilterChain chain) throws IOException, ServletException {
            request.setCharacterEncoding(this.encoding);
            chain.doFilter(request, response);
      }}


4.设定数据库连接方式是utf-8. 

易出现乱码的方式: 

1.通过<a>超链接传递中文乱码。超链接地址栏传参和form表单的get方法,都是以get()方式向服务器提交的数据。这个时候我们会发现地址栏中出现的是中文被编码之后的一串%的东东, 

Java代码 

北京联动北方科技有限公司北京联动北方科技有限公司北京联动北方科技有限公司

  1. <a href=some.jsp?key=<%=java.net.URLEncoder.encode(可能包含中文的参数,UTF-8)%>>联结</a> 


<a href=some.jsp?key=<%=java.net.URLEncoder.encode(可能包含中文的参数,UTF-8)%>>联结</a> 

2.通过javascript传递中文乱码 

Java代码 

北京联动北方科技有限公司北京联动北方科技有限公司北京联动北方科技有限公司

  1. function getName(){

  2. var name=jQuery(#name).val(); 

  3. name= encodeURI(encodeURI(name));//需要经过两次编码 

  4. window.location.href=user.action?name=+name;

function getName(){

var name=jQuery(#name).val();

name= encodeURI(encodeURI(name));//需要经过两次编码

window.location.href=user.action?name=+name;

}

在后台Action类中需要解码: 

Java代码 

北京联动北方科技有限公司北京联动北方科技有限公司北京联动北方科技有限公司

  1. String name= request.getParameter(name);

  2. try {

  3. name= URLDecoder.decode(name, UTF-8);

  4. } catch (UnsupportedEncodingException e) {

  5. e.printStackTrace();

String name= request.getParameter(name);

try {

name= URLDecoder.decode(name, UTF-8);

} catch (UnsupportedEncodingException e) {

e.printStackTrace();

}

因为iso-8859-1是Java中网络传输使用的标准字符集,request.getParameter(name)得到的还是ISO-8859-1字符集,所以要转换一下才不会是乱码。 

3.通过表单get提交中文乱码 

第一:先解码然后转码 

第二:get走的是url提交方式,而在进入url之前已经进行了iso-8859-1的编码。要想影响这个编码可以在server.xml文件中Connector节点中添加userBodyEncodingURI=true,就可以控制tomcat对get方式的汉字编码。 

4.通过表单post提交中文乱码 

第一:其实这也和tomcat的内置编码有关,如果没有设置URIEncoding=UTF-8,那么默认的编码是iso8859-1,需要在servlet中String str=new String(request.getParameter(name).getBytes(ISO-8859-1),UTF-8).每一个汉字都需要这样编码,很麻烦。 

第二:设定执行请求编码的格式request.setCharactorEncoding(UTF-8); 

String str=request.getParameter(name);但是这种方法只针对post提交的参数有效,对于get和上传的方式则是无能为力的。 

以我自己的了解,在进行struts开发的过程中,总也是出现很多的乱码问题 ,但归根到底,也只是以下三种情况: 

㈠页面显示中文乱码 

㈡传递参数中文乱码 

㈢国际化资源文件乱码 

下面就这三中情况介绍怎么在具体项目中处理这些乱码问题。而对于整体的处理思想,是要统一编码为: UTF-8.(以myeclipse6支持的struts1.3为准) 

㈠页面显示中文乱码 

对于在页面中显示出现乱码,这个问题比较简单,便是检查你的JSP文件里是不是出现了中文要处理,因为JSP默认的编码格式为“ISO-8859-1”,当JSP中出现要处理的中文时,其显示就出现乱码了,这种情况一般出现在手写JSP,或修改时。因为在myeclipse6.0中,如果出现了编码错误时,程序不会让你保存,而是会提示你注意编码,这点很好。具体的修改办法是把 

Html代码 

北京联动北方科技有限公司北京联动北方科技有限公司北京联动北方科技有限公司

  1. <%.@ page language=java import=java.util. pageEncoding=ISO-8859-1> 

<%.@ page language=java import=java.util. pageEncoding=ISO-8859-1>

改成: 

Html代码 

北京联动北方科技有限公司北京联动北方科技有限公司北京联动北方科技有限公司

  1. <%.@ page language=java import=java.util. pageEncoding=UTF-8> 

 <%.@ page language=java import=java.util. pageEncoding=UTF-8> 

㈡传递参数中文乱码 

传递参数出现的乱码,参数的内容为中文。比如在struts应用中,简单的一个登录界面中,需要传递的登录名为中文时,你没经处理之前,是会出现乱码传递的,为了让我们能看到显示的乱码,我们在对应的Action类的子类里,修改一下,用System.out把接受到的参数输出,代码如下: 

Java代码 北京联动北方科技有限公司北京联动北方科技有限公司北京联动北方科技有限公司

  1. public ActionForward execute(ActionMapping mapping, ActionForm form, HttpServletRequest request,

  2. HttpServletResponse response) ...{

  3. DynaActionForm loginForm = (DynaActionForm) form;



  4. String username = (String) loginForm.get(username);

  5. String password = (String) loginForm.get(password);

  6. System.out.println(username:+username);

  7. System.out.println(password:+password);

  8. if (username.equals(ivorytower) && password.equals(123456)) ...{

  9. return mapping.findForward(success);

  10. }

  11. return mapping.findForward(fail);

public ActionForward execute(ActionMapping mapping, ActionForm form, HttpServletRequest request,

HttpServletResponse response) ...{

DynaActionForm loginForm = (DynaActionForm) form;

String username = (String) loginForm.get(username);

String password = (String) loginForm.get(password);

System.out.println(username:+username);

System.out.println(password:+password);

if (username.equals(ivorytower) && password.equals(123456)) ...{

return mapping.findForward(success);

}

return mapping.findForward(fail);

}

那么当你提交了中文输入后就会出现乱码了。 

具体的解决方法: 

①修改Tomcat---->conf----->server.xml文件,在修改端口的标签后面加一行代码,如下: 

Xml代码 

北京联动北方科技有限公司北京联动北方科技有限公司北京联动北方科技有限公司

  1. <Connector port=8080 protocol=HTTP/1.1

  2. connectionTimeout=20000

  3. redirectPort=8443 URIEncoding=UTF-8/> 
 <Connector port=8080 protocol=HTTP/1.1

connectionTimeout=20000

redirectPort=8443 URIEncoding=UTF-8/>

②编写过滤器Filter 

Java代码 北京联动北方科技有限公司北京联动北方科技有限公司北京联动北方科技有限公司



  1. import java.io.IOException;



  2. import javax.servlet.Filter;

  3. import javax.servlet.FilterChain;

  4. import javax.servlet.FilterConfig;

  5. import javax.servlet.ServletException;

  6. import javax.servlet.ServletRequest;

  7. import javax.servlet.ServletResponse;



  8. public class CharacterEncodingFilter implements Filter ...{



  9. @Override 

  10. public void destroy() ...{

  11. }



  12. @Override 

  13. public void doFilter(ServletRequest request, ServletResponse response, FilterChain chain) throws IOException,ServletException {

  14. request.setCharacterEncoding(utf-8);

  15. chain.doFilter(request, response);

  16. }



  17. @Override 

  18. public void init(FilterConfig arg0) throws ServletException ...{

  19. }




import java.io.IOException;

import javax.servlet.Filter;

import javax.servlet.FilterChain;

import javax.servlet.FilterConfig;

import javax.servlet.ServletException;

import javax.servlet.ServletRequest;

import javax.servlet.ServletResponse;

public class CharacterEncodingFilter implements Filter ...{

@Override

public void destroy() ...{

}

@Override

public void doFilter(ServletRequest request, ServletResponse response, FilterChain chain) throws IOException,ServletException {

request.setCharacterEncoding(utf-8);

chain.doFilter(request, response);

}

@Override

public void init(FilterConfig arg0) throws ServletException ...{

}

}

利用过滤器,把requst传递的中文参数都设成“UTF-8”编码。 

③修改web.xml文件 

打开项目里的web.xml文件,在前面加上如下代码: 

Xml代码 

北京联动北方科技有限公司北京联动北方科技有限公司北京联动北方科技有限公司



  1. <filter>

  2. <filter-name>characterEncoding</filter-name>

  3. <filter-class>com.v512.example.CharacterEncodingFilter</filter-class>

  4. </filter>

  5. <filter-mapping>

  6. <filter-name>characterEncoding</filter-name>

  7. <url-pattern>/*</url-pattern>

  8. </filter-mapping> 

<filter>

<filter-name>characterEncoding</filter-name>

<filter-class>com.v512.example.CharacterEncodingFilter</filter-class>

</filter>

<filter-mapping>

<filter-name>characterEncoding</filter-name>

<url-pattern>/*</url-pattern>

</filter-mapping>

注意其过滤的URL为“/*”,表示当前的request请求。为了使设置生效,重起tomcat。 

㈢国际化资源文件乱码 

①利用JDK的native2ascii工具进行编码转换 

国际化问题,主要是为了处理文件在浏览器上的显示问题,还是以登录界面来说,比如在中文浏览器上,我们要看到中文显示,对应在英文浏览器上要显示英文。那么我们在登录那个界面处理上,就不能直接写上我们的“用户名”“密码”等标识了。就要用标记转换输出了,修改为: 

Html代码 

北京联动北方科技有限公司北京联动北方科技有限公司北京联动北方科技有限公司



  1. <bean:message key=example.login.username/> 

<bean:message key=example.login.username/>


再者,打开项目下的资源配置文件ApplicationResources.properties,依据上面所写key值,设定成我们要的默认值(显示英文),比如 

引用

#Resource for Parameter com.v512.example.struts.ApplicationResources
#Project webexample2
example.login.username=username
example.login.password=password


现在我们动手新建一个资源文件,让其能显示中文,直接Ctrl+C,Ctrl+V。改名为ApplicationResources_zh.properties,代码如下: 

引用

#Resource for Parameter com.v512.example.struts.ApplicationResources
#Project webexample2


example.login.username=用户名 

example.login.password=密码

但保存,myeclipse会报错,这时我们需要修改资源文件的编码格式。Windons---->Preferences---->Content Type------>Text----->JavaPropertiesFile,把其Default encoding改为“utf-8”,按“update”更新。这样就能进行保存了。但是当我们进行验证会不是成功时,仍然给我们的是乱码。 

不急,我们还得做一项任务,打开DOS窗口,CMD到资源文件所在目录,运用JDK的native2ascii工具把我们新建的资源文件改成另一个名字的资源文件,例如bank.properties。命令如下: 

引用

>native2ascii -encoding gbk ApplicationResources_zh.properties bank.properties


打开bank.properties资源文件,自动生成的代码如下: 

引用

#Generated by ResourceBundle Editor (http://eclipse-rbe.sourceforge.net)
example.login.username = u7528u6237u540D
example.login.password = u5BC6u7801


然后在myeclipse窗口中,把原来新建ApplicationResources_zh.properties 删除,并把bank.properties改为ApplicationResources_zh.properties (为了方便记忆,管理)。然后重起tomcat或进行reload文件,我们发现乱码问题没有了。 

②利用Eclipse ResourceBundle Editor插件工具 

以上我们是利用了JDK的native2ascii工具来处理国际化问题,但在EC中,还有一种更方便的工具专门用来处理编辑java的资源文件国际化乱码问题,即Eclipse ResourceBundle Editor插件工具。安装了这个插件后,我们能进行方便的可视化资源文件编辑。推荐。。

该贴由koei转至本版2014-5-2 16:25:20




赞(0)    操作        顶端 
总帖数
1
每页帖数
101/1页1
返回列表
发新帖子
请输入验证码: 点击刷新验证码
您需要登录后才可以回帖 登录 | 注册
技术讨论