在项目中总是遇到乱码问题,有时候在网上查找到了解决方案,但是没有记录下来为什么出现的乱码。因为出现乱码的方式有好几种,我简单总结一下吧,为以后留着用,也算总结学习一下。
一般来讲,为了处理乱码问题,在javaweb中我们需要注意哪些地方?
1、java文件的编码格式
2、jsp页面的编码格式
3、在servlet中对request、response对象的编码格式的设定
4、浏览器中查看页面的字符集编码格式
前提:
1.开发和编译代码时指定字符集,JBuilder和Eclipse都可以在项目属性中设置。页面的编码格式一致:
所有页面的编码格式应该尽量一样,因为有时候在两个页面之间跳转的时候,如果编码格式不一,那么服务器不知道该用哪一种编码格式。
2.页面编码格式和tomcat配置文件中的编码格式保持一致:
tomcat/conf/server.xml配置文件中Connector(连接器)标签URIEncoding(统一资源标示符编码)的属性为GBK或UTF-8。
3.使用过滤器,如果所有请求都通过一个servlet控制分配器,那么使用servlet的filter的执行语句,将浏览器发送过来的请求都设置编码为utf-8.
在web.xml文件中:
Xml代码
- <filter>
- <filter-name>SetCharacterEncodingFilter</filter-name>
- <filter-class>com.struts.beans.SetCharacterEncodingFilter</filter-class>
- <init-param>
- <param-name>encoding</param-name>
- <param-value>utf-8</param-value>
- </init-param>
- </filter>
- <filter-mapping>
- <filter-name>SetCharacterEncodingFilter</filter-name>
- <url-pattern>/*</url-pattern>
- </filter-mapping>
<filter>
<filter-name>SetCharacterEncodingFilter</filter-name>
<filter-class>com.struts.beans.SetCharacterEncodingFilter</filter-class>
<init-param>
<param-name>encoding</param-name>
<param-value>utf-8</param-value>
</init-param>
</filter>
<filter-mapping>
<filter-name>SetCharacterEncodingFilter</filter-name>
<url-pattern>/*</url-pattern>
</filter-mapping>
在类中:
Java代码
- public class SetCharacterEncodingFilter implements Filter {
- private String encoding;
- public void init(FilterConfig filterConfig) throws ServletException {
- // TODO Auto-generated method stub
- this.encoding = filterConfig.getInitParameter(encoding);
- }
- public void doFilter(ServletRequest request, ServletResponse response,
- FilterChain chain) throws IOException, ServletException {
-
- request.setCharacterEncoding(this.encoding);
- chain.doFilter(request, response);
- }}
public class SetCharacterEncodingFilter implements Filter {
private String encoding;
public void init(FilterConfig filterConfig) throws ServletException {
// TODO Auto-generated method stub
this.encoding = filterConfig.getInitParameter(encoding);
}
public void doFilter(ServletRequest request, ServletResponse response,
FilterChain chain) throws IOException, ServletException {
request.setCharacterEncoding(this.encoding);
chain.doFilter(request, response);
}}
4.设定数据库连接方式是utf-8.
易出现乱码的方式:
1.通过<a>超链接传递中文乱码。超链接地址栏传参和form表单的get方法,都是以get()方式向服务器提交的数据。这个时候我们会发现地址栏中出现的是中文被编码之后的一串%的东东,
Java代码
- <a href=some.jsp?key=<%=java.net.URLEncoder.encode(可能包含中文的参数,UTF-8)%>>联结</a>
<a href=some.jsp?key=<%=java.net.URLEncoder.encode(可能包含中文的参数,UTF-8)%>>联结</a>
2.通过javascript传递中文乱码
Java代码
- function getName(){
- var name=jQuery(#name).val();
- name= encodeURI(encodeURI(name));//需要经过两次编码
- window.location.href=user.action?name=+name;
- }
function getName(){
var name=jQuery(#name).val();
name= encodeURI(encodeURI(name));//需要经过两次编码
window.location.href=user.action?name=+name;
}
在后台Action类中需要解码:
Java代码
- String name= request.getParameter(name);
- try {
- name= URLDecoder.decode(name, UTF-8);
- } catch (UnsupportedEncodingException e) {
- e.printStackTrace();
- }
String name= request.getParameter(name);
try {
name= URLDecoder.decode(name, UTF-8);
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
因为iso-8859-1是Java中网络传输使用的标准字符集,request.getParameter(name)得到的还是ISO-8859-1字符集,所以要转换一下才不会是乱码。
3.通过表单get提交中文乱码
第一:先解码然后转码
第二:get走的是url提交方式,而在进入url之前已经进行了iso-8859-1的编码。要想影响这个编码可以在server.xml文件中Connector节点中添加userBodyEncodingURI=true,就可以控制tomcat对get方式的汉字编码。
4.通过表单post提交中文乱码
第一:其实这也和tomcat的内置编码有关,如果没有设置URIEncoding=UTF-8,那么默认的编码是iso8859-1,需要在servlet中String str=new String(request.getParameter(name).getBytes(ISO-8859-1),UTF-8).每一个汉字都需要这样编码,很麻烦。
第二:设定执行请求编码的格式request.setCharactorEncoding(UTF-8);
String str=request.getParameter(name);但是这种方法只针对post提交的参数有效,对于get和上传的方式则是无能为力的。
以我自己的了解,在进行struts开发的过程中,总也是出现很多的乱码问题 ,但归根到底,也只是以下三种情况:
㈠页面显示中文乱码
㈡传递参数中文乱码
㈢国际化资源文件乱码
下面就这三中情况介绍怎么在具体项目中处理这些乱码问题。而对于整体的处理思想,是要统一编码为: UTF-8.(以myeclipse6支持的struts1.3为准)
㈠页面显示中文乱码
对于在页面中显示出现乱码,这个问题比较简单,便是检查你的JSP文件里是不是出现了中文要处理,因为JSP默认的编码格式为“ISO-8859-1”,当JSP中出现要处理的中文时,其显示就出现乱码了,这种情况一般出现在手写JSP,或修改时。因为在myeclipse6.0中,如果出现了编码错误时,程序不会让你保存,而是会提示你注意编码,这点很好。具体的修改办法是把
Html代码
- <%.@ page language=java import=java.util. pageEncoding=ISO-8859-1>
<%.@ page language=java import=java.util. pageEncoding=ISO-8859-1>
改成:
Html代码
- <%.@ page language=java import=java.util. pageEncoding=UTF-8>
<%.@ page language=java import=java.util. pageEncoding=UTF-8>
㈡传递参数中文乱码
传递参数出现的乱码,参数的内容为中文。比如在struts应用中,简单的一个登录界面中,需要传递的登录名为中文时,你没经处理之前,是会出现乱码传递的,为了让我们能看到显示的乱码,我们在对应的Action类的子类里,修改一下,用System.out把接受到的参数输出,代码如下:
Java代码
- public ActionForward execute(ActionMapping mapping, ActionForm form, HttpServletRequest request,
- HttpServletResponse response) ...{
- DynaActionForm loginForm = (DynaActionForm) form;
- String username = (String) loginForm.get(username);
- String password = (String) loginForm.get(password);
- System.out.println(username:+username);
- System.out.println(password:+password);
- if (username.equals(ivorytower) && password.equals(123456)) ...{
- return mapping.findForward(success);
- }
- return mapping.findForward(fail);
- }
public ActionForward execute(ActionMapping mapping, ActionForm form, HttpServletRequest request,
HttpServletResponse response) ...{
DynaActionForm loginForm = (DynaActionForm) form;
String username = (String) loginForm.get(username);
String password = (String) loginForm.get(password);
System.out.println(username:+username);
System.out.println(password:+password);
if (username.equals(ivorytower) && password.equals(123456)) ...{
return mapping.findForward(success);
}
return mapping.findForward(fail);
}
那么当你提交了中文输入后就会出现乱码了。
具体的解决方法:
①修改Tomcat---->conf----->server.xml文件,在修改端口的标签后面加一行代码,如下:
Xml代码
- <Connector port=8080 protocol=HTTP/1.1
- connectionTimeout=20000
- redirectPort=8443 URIEncoding=UTF-8/>
<Connector port=8080 protocol=HTTP/1.1
connectionTimeout=20000
redirectPort=8443 URIEncoding=UTF-8/>
②编写过滤器Filter
Java代码
- import java.io.IOException;
- import javax.servlet.Filter;
- import javax.servlet.FilterChain;
- import javax.servlet.FilterConfig;
- import javax.servlet.ServletException;
- import javax.servlet.ServletRequest;
- import javax.servlet.ServletResponse;
- public class CharacterEncodingFilter implements Filter ...{
- @Override
- public void destroy() ...{
- }
- @Override
- public void doFilter(ServletRequest request, ServletResponse response, FilterChain chain) throws IOException,ServletException {
- request.setCharacterEncoding(utf-8);
- chain.doFilter(request, response);
- }
- @Override
- public void init(FilterConfig arg0) throws ServletException ...{
- }
- }
import java.io.IOException;
import javax.servlet.Filter;
import javax.servlet.FilterChain;
import javax.servlet.FilterConfig;
import javax.servlet.ServletException;
import javax.servlet.ServletRequest;
import javax.servlet.ServletResponse;
public class CharacterEncodingFilter implements Filter ...{
@Override
public void destroy() ...{
}
@Override
public void doFilter(ServletRequest request, ServletResponse response, FilterChain chain) throws IOException,ServletException {
request.setCharacterEncoding(utf-8);
chain.doFilter(request, response);
}
@Override
public void init(FilterConfig arg0) throws ServletException ...{
}
}
利用过滤器,把requst传递的中文参数都设成“UTF-8”编码。
③修改web.xml文件
打开项目里的web.xml文件,在前面加上如下代码:
Xml代码
- <filter>
- <filter-name>characterEncoding</filter-name>
- <filter-class>com.v512.example.CharacterEncodingFilter</filter-class>
- </filter>
- <filter-mapping>
- <filter-name>characterEncoding</filter-name>
- <url-pattern>/*</url-pattern>
- </filter-mapping>
<filter>
<filter-name>characterEncoding</filter-name>
<filter-class>com.v512.example.CharacterEncodingFilter</filter-class>
</filter>
<filter-mapping>
<filter-name>characterEncoding</filter-name>
<url-pattern>/*</url-pattern>
</filter-mapping>
注意其过滤的URL为“/*”,表示当前的request请求。为了使设置生效,重起tomcat。
㈢国际化资源文件乱码
①利用JDK的native2ascii工具进行编码转换
国际化问题,主要是为了处理文件在浏览器上的显示问题,还是以登录界面来说,比如在中文浏览器上,我们要看到中文显示,对应在英文浏览器上要显示英文。那么我们在登录那个界面处理上,就不能直接写上我们的“用户名”“密码”等标识了。就要用标记转换输出了,修改为:
Html代码
- <bean:message key=example.login.username/>
<bean:message key=example.login.username/>
再者,打开项目下的资源配置文件ApplicationResources.properties,依据上面所写key值,设定成我们要的默认值(显示英文),比如
引用
#Resource for Parameter com.v512.example.struts.ApplicationResources
#Project webexample2
example.login.username=username
example.login.password=password
现在我们动手新建一个资源文件,让其能显示中文,直接Ctrl+C,Ctrl+V。改名为ApplicationResources_zh.properties,代码如下:
引用
#Resource for Parameter com.v512.example.struts.ApplicationResources
#Project webexample2
example.login.username=用户名
example.login.password=密码
但保存,myeclipse会报错,这时我们需要修改资源文件的编码格式。Windons---->Preferences---->Content Type------>Text----->JavaPropertiesFile,把其Default encoding改为“utf-8”,按“update”更新。这样就能进行保存了。但是当我们进行验证会不是成功时,仍然给我们的是乱码。
不急,我们还得做一项任务,打开DOS窗口,CMD到资源文件所在目录,运用JDK的native2ascii工具把我们新建的资源文件改成另一个名字的资源文件,例如bank.properties。命令如下:
引用
>native2ascii -encoding gbk ApplicationResources_zh.properties bank.properties
打开bank.properties资源文件,自动生成的代码如下:
引用
#Generated by ResourceBundle Editor (http://eclipse-rbe.sourceforge.net)
example.login.username = u7528u6237u540D
example.login.password = u5BC6u7801
然后在myeclipse窗口中,把原来新建ApplicationResources_zh.properties 删除,并把bank.properties改为ApplicationResources_zh.properties (为了方便记忆,管理)。然后重起tomcat或进行reload文件,我们发现乱码问题没有了。
②利用Eclipse ResourceBundle Editor插件工具
以上我们是利用了JDK的native2ascii工具来处理国际化问题,但在EC中,还有一种更方便的工具专门用来处理编辑java的资源文件国际化乱码问题,即Eclipse ResourceBundle Editor插件工具。安装了这个插件后,我们能进行方便的可视化资源文件编辑。推荐。。
该贴由koei转至本版2014-5-2 16:25:20