solaris上开发J2EE应用中文问题解决_Tomcat, WebLogic及J2EE讨论区_Weblogic技术|Tuxedo技术|中间件技术|Oracle论坛|JAVA论坛|Linux/Unix技术|hadoop论坛_联动北方技术论坛  
网站首页 | 关于我们 | 服务中心 | 经验交流 | 公司荣誉 | 成功案例 | 合作伙伴 | 联系我们 |
联动北方-国内领先的云技术服务提供商
»  游客             当前位置:  论坛首页 »  自由讨论区 »  Tomcat, WebLogic及J2EE讨论区 »
总帖数
1
每页帖数
101/1页1
返回列表
0
发起投票  发起投票 发新帖子
查看: 3433 | 回复: 0   主题: solaris上开发J2EE应用中文问题解决        下一篇 
jfl
注册用户
等级:少校
经验:1112
发帖:95
精华:0
注册:2012-8-10
状态:离线
发送短消息息给jfl 加好友    发送短消息息给jfl 发消息
发表于: IP:您无权察看 2012-8-31 13:42:16 | [全部帖] [楼主帖] 楼主


关于JSPJ2EE的中文问题和处理方法,网上已经有很多文章。一般在中文内核的操作系统(如中文NTwindows2000)上,该问题不是很突出,而在其他一些系统(如linuxsolaris)中就比较明显了。近日在solaris上开发一个J2EE的应用系统,环境是solaris 2.7+minij2ee+mysql。系统在windowslinux下均没有出现中文处理的问题,但部署到solaris上面后所有中文显示为?。

后来经过分析,发现原因出在系统编码上。由于安装solaris时默认的系统编码为ASCII,因此以默认的系统编码处理字符串时汉字高位信息丢失。下面一段简单的jsp程序说明了这个问题:

在浏览器中输入foo.jspi=中文,结果显示为??。如果将byte[] b=str.getBytes();换成上面注释掉的byte[] b=str.getBytes“iso-8859-1”;,则正常显示出中文二字。查阅了mysql JDBC的驱动程序,问题相同。

考虑解决的方法有两个,一个是修改JDBC驱动程序,另一个是将汉字编码成7位,从实现方便的角度选择了后者。不过后者的缺点是字符串长度增加,并且无法直接通过sql工具来修改数据库了。网上有一种汉字编码的方法,是将汉字高位去1,英文则补一个0表示。这种方法有缺陷,因为特定的汉字编码后会出现“‘”SQL语句中有歧义的字符,导致sql失败。我摘取了minij2eeuniString的编码方法,该方法将字节表示为其16进制编码,下面是源代码:

public String encode()
{
      try
      {
            StringBuffer sb=new StringBuffer();
            byte[] bytes=m_enc.compareTo(“”)==0?m_str.getBytes():m_str.getBytes(m_enc);
            for(int i =0;i {
                  char ch;
                  ch=Character.forDigit((bytes[i]》》4)&0xF,16);
                  sb.append(ch);
                  ch=Character.forDigit(bytes[i]&0xF,16);
                  sb.append(ch);
            }
            return sb.toString();
      }
      catch(java.io.UnsupportedEncodingException e)
      {
            throw new RuntimeException(“Unsupported encoding type.”);
      }
}
public void decode(String encodestr)
{
      StringBuffer sb=new StringBuffer();
      int i=0;
      while(i!=encodestr.length())
      {
            sb.append((char)Integer.parseInt(encodestr.substring(i,i+2),16));
            i+=2;
      }
      m_str=new uniString(sb.toString(),“iso-8859-1”).cvt(m_enc);
}


使用编码后,问题解决。

另外提一下,minij2ee最新版本中提供了一个uniString类,解决了在所有操作系统上的中文问题。使用uniString对象,无需关心字符串本身编码,使用时只要调用函数来获得需要的编码即可,如在jsp里调用uniString.gb()即可以以gb2312输出字符串,在数据库存储时调用uniString.iso()即可以以iso-8859-1编码输出字符串,无论在中文内核还是英文内核的操作系统上均通用。




赞(0)    操作        顶端 
总帖数
1
每页帖数
101/1页1
返回列表
发新帖子
请输入验证码: 点击刷新验证码
您需要登录后才可以回帖 登录 | 注册
技术讨论