在项目中总是遇到乱码问题,有时候在网上查找到了解决方案,但是没有记录下来为什么出现的乱码。因为出现乱码的方式有好几种,我简单总结一下吧,为以后留着用,也算总结学习一下。
一般来讲,为了处理乱码问题,在javaweb中我们需要注意哪些地方?
1、java文件的编码格式
2、jsp页面的编码格式
3、在servlet中对request、response对象的编码格式的设定
4、浏览器中查看页面的字符集编码格式
前提:
1.开发和编译代码时指定字符集,JBuilder和Eclipse都可以在项目属性中设置。页面的编码格式一致:
所有页面的编码格式应该尽量一样,因为有时候在两个页面之间跳转的时候,如果编码格式不一,那么服务器不知道该用哪一种编码格式。
2.页面编码格式和tomcat配置文件中的编码格式保持一致:
tomcat/conf/server.xml配置文件中Connector(连接器)标签URIEncoding(统一资源标示符编码)的属性为GBK或UTF-8。
3.使用过滤器,如果所有请求都通过一个servlet控制分配器,那么使用servlet的filter的执行语句,将浏览器发送过来的请求都设置编码为utf-8.
在web.xml文件中:
Xml代码
- <filter>
- <filter-name>SetCharacterEncodingFilter</filter-name>
- <filter-class>com.struts.beans.SetCharacterEncodingFilter</filter-class>
- <init-param>
- <param-name>encoding</param-name>
- <param-value>utf-8</param-value>
- </init-param>
- </filter>
- <filter-mapping>
- <filter-name>SetCharacterEncodingFilter</filter-name>
- <url-pattern>/*</url-pattern>
- </filter-mapping>
<filter>
<filter-name>SetCharacterEncodingFilter</filter-name>
<filter-class>com.struts.beans.SetCharacterEncodingFilter</filter-class>
<init-param>
<param-name>encoding</param-name>
<param-value>utf-8</param-value>
</init-param>
</filter>
<filter-mapping>
<filter-name>SetCharacterEncodingFilter</filter-name>
<url-pattern>/*</url-pattern>
</filter-mapping>
在类中:
Java代码
- public class SetCharacterEncodingFilter implements Filter {
- private String encoding;
- public void init(FilterConfig filterConfig) throws ServletException {
- // TODO Auto-generated method stub
- this.encoding = filterConfig.getInitParameter(encoding);
- }
- public void doFilter(ServletRequest request, ServletResponse response,
- FilterChain chain) throws IOException, ServletException {
-
- request.setCharacterEncoding(this.encoding);
- chain.doFilter(request, response);
- }}
public class SetCharacterEncodingFilter implements Filter {
private String encoding;
public void init(FilterConfig filterConfig) throws ServletException {
// TODO Auto-generated method stub
this.encoding = filterConfig.getInitParameter(encoding);
}
public void doFilter(ServletRequest request, ServletResponse response,
FilterChain chain) throws IOException, ServletException {
request.setCharacterEncoding(this.encoding);
chain.doFilter(request, response);
}}
4.设定数据库连接方式是utf-8.
易出现乱码的方式:
1.通过<a>超链接传递中文乱码。超链接地址栏传参和form表单的get方法,都是以get()方式向服务器提交的数据。这个时候我们会发现地址栏中出现的是中文被编码之后的一串%的东东,
Java代码
- <a href=some.jsp?key=<%=java.net.URLEncoder.encode(可能包含中文的参数,UTF-8)%>>联结</a>
<a href=some.jsp?key=<%=java.net.URLEncoder.encode(可能包含中文的参数,UTF-8)%>>联结</a>
2.通过javascript传递中文乱码
Java代码
- function getName(){
- var name=jQuery(#name).val();
- name= encodeURI(encodeURI(name));//需要经过两次编码
- window.location.href=user.action?name=+name;
- }
function getName(){
var name=jQuery(#name).val();
name= encodeURI(encodeURI(name));//需要经过两次编码
window.location.href=user.action?name=+name;
}
在后台Action类中需要解码:
Java代码
- String name= request.getParameter(name);
- try {
- name= URLDecoder.decode(name, UTF-8);
- } catch (UnsupportedEncodingException e) {
- e.printStackTrace();
- }
String name= request.getParameter(name);
try {
name= URLDecoder.decode(name, UTF-8);
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
因为iso-8859-1是Java中网络传输使用的标准字符集,request.getParameter(name)得到的还是ISO-8859-1字符集,所以要转换一下才不会是乱码。
3.通过表单get提交中文乱码
第一:先解码然后转码
第二:get走的是url提交方式,而在进入url之前已经进行了iso-8859-1的编码。要想影响这个编码可以在server.xml文件中Connector节点中添加userBodyEncodingURI=true,就可以控制tomcat对get方式的汉字编码。
4.通过表单post提交中文乱码
第一:其实这也和tomcat的内置编码有关,如果没有设置URIEncoding=UTF-8,那么默认的编码是iso8859-1,需要在servlet中String str=new String(request.getParameter(name).getBytes(ISO-8859-1),UTF-8).每一个汉字都需要这样编码,很麻烦。
第二:设定执行请求编码的格式request.setCharactorEncoding(UTF-8);
String str=request.getParameter(name);但是这种方法只针对post提交的参数有效,对于get和上传的方式则是无能为力的。
该贴由koei转至本版2014-5-2 16:22:00