自从接触Java和JSP以来,就不断与Java的中文乱码
问题打交道,现在终于得到了彻底的解决,现将我们的解决心得与大家共享。
一、Java中文问题的由来
Java的内核和class文件是基于unicode的,这使Java程序具有良好的跨平台性,但也带来了一些中文乱码
问题的麻烦。原因主要有两方面,Java和JSP文件本身编译时产生的乱码
问题和Java程序于其他媒介交互产生的乱码
问题。
首先Java(包括JSP)源文件中很可能包含有中文,而Java和JSP源文件的保存方式是基于字节流的,如果Java和JSP编译成class文件过程中,使用的编码方式与源文件的编码不一致,就会出现乱码
。基于这种乱码
,建议在Java文件中尽量不要写中文(注释部分不参与编译,写中文没关系),如果必须写的话,尽量手动带
参数
-ecoding GBK或-ecoding
gb2312编译;对于JSP,在文件头加上<%@ page contentType="text/html;charset=GBK"%>或<%@
page contentType="text/html;charset=gb2312"%>基本上就能解决这类乱码
问题。
本文要重点讨论的是第二类乱码
,即Java程序与其他存储媒介交互时产生的乱码
。很多存储媒介,如数据库,文件,流等的存储方式都是基于字节流的,Java程序与这些媒介交互时就会发生字符(char)与字节(byte)之间的转换,具体情况如下:
从页面form提交数据到java程序 byte->char
从java程序到页面显示 char—>byte
从数据库到java程序 byte—>char
从java程序到数据库 char—>byte
从文件到java程序 byte->char
从java程序到文件 char->byte
从流到java程序 byte->char
从java程序到流 char->byte
request.setCharacterEncoding("UTF-8");
response.setContentType("text/html;charset=UTF-8");
如果在以上转换过程中使用的编码方式与字节原有的编码不一致,很可能就会出现乱码
。
二、解决方法
前面已经提到了Java程序与其他媒介交互时字符和字节的转换过程,如果这些转换过程中容易产生乱码
。解决这些乱码
问题的关键在于确保转换时使用的编码方式与字节原有的编码方式保持一致,下面分别论述(Java或JSP自身产生的乱码
请参看第一部分)。
1、JSP与页面参数
之间的乱码
JSP获取页面参数
时一般采用系统默认的编码方式,如果页面参数
的编码类型和系统默认的编码类型不一致,很可能就会出现乱码
。解决这类乱码
问题的基本方法是在页面获取参数
之前,强制指定request获取参数
的编码方式:request.setCharacterEncoding("GBK")或request.setCharacterEncoding("gb2312")。
如果在JSP将变量输出到页面时出现了乱码
,可以通过设置response.setContentType("text/html;charset=GBK")或
response.setContentType("text/html;charset=gb2312")解决。
如果不想在每个文件里都写这样两句话,更简洁的办法是使用Servlet规范中的过虑器指定编码,过滤器的在web.xml中的典型配置和主要代码如下:
web.xml:
<filter>
<filter-name>CharacterEncodingFilter</filter-name>
<filter-class>net.vschool.web.CharacterEncodingFilter</filter-class>
<init-param>
<param-name>encoding</param-name>
<param-value>GBK</param-value>
</init-param>
</filter>
<filter-mapping>
<filter-name>CharacterEncodingFilter</filter-name>
<url-pattern>/*</url-pattern>
</filter-mapping>
CharacterEncodingFilter.java:
public class CharacterEncodingFilter implements Filter
{
protected String encoding = null;
public void init(FilterConfig filterConfig) throws ServletException
{
this.encoding = filterConfig.getInitParameter("encoding");
}
public void doFilter(ServletRequest request, ServletResponse response,
FilterChain chain) throws IOException, ServletException
{
request.setCharacterEncoding(encoding);
response.setContentType("text/html;charset="+encoding);
chain.doFilter(request,
response);
}
}
2、Java与数据库之间的乱码
大部分数据库都支持以unicode编码方式,所以解决Java与数据库之间的乱码
问题比较明智的方式是直接使用unicode编码与数据库交互。很多数据库驱动自动支持unicode,如Microsoft的SQLServer驱动。其他大部分数据库驱动,可以在驱动的url参数
中指定,如如mm的mysql驱动:jdbc:mysql://localhost/WEBCLDB?useUnicode=true&characterEncoding=GBK。
3、Java与文件/流之间的乱码
Java读写文件最常用的类是FileInputStream/FileOutputStream和FileReader/FileWriter。其中FileInputStream和FileOutputStream是基于字节流的,常用于读写二进制文件。读写字符文件建议使用基于字符的FileReader和FileWriter,省去了字节与字符之间的转换。但这两个类的构造函数默认使用系统的编码方式,如果文件内容与系统编码方式不一致,可能会出现乱码
。在这种情况下,建议使用FileReader和FileWriter的父类:InputStreamReader/OutputStreamWriter,它们也是基于字符的,但在构造函数中可以指定编码类型:InputStreamReader(InputStream
in, Charset cs) 和OutputStreamWriter(OutputStream out, Charset cs)。
4、其他
上面提到的方法应该能解决大部分乱码
问题,如果在其他地方还出现乱码
,可能需要手动修改代码。解决Java乱码
问题的关键在于在字节与字符的转换过程中,你必须知道原来字节或转换后的字节的编码方式,转换时采用的编码必须与这个编码方式保持一致。我们以前使用Resin服务器,使用smartUpload组件上传文件,上传文件同时传递的中文参数
获取没有乱码
问题。当在Linux中把Resin设置成服务后,上传文件同时的中文参数
获取出现了乱码
。这个问题困扰了我们很久,后来我们分析smartUpload组件的源文件,因为文件上传采用的是字节流的方式,里面包含的参数
名称和值也是字节流的方式传递的。smartUpload组件读取字节流后再将参数
名称和值从字节流中解析出来,问题就出现在smartUpload将字节流转换成字符串时采用了系统默认的编码,而将Resin设置成服务后,系统默认的编码可能发生了改变,因此出现了乱码
。后来,我们更改了smartUpload的源文件,增加了一个属性charset和setCharset(String)方法,将upload()方法中提取参数
语句:
String value =
new String(m_binArray, m_startData, (m_endData - m_startData) + 1
);
改成了
String value = new String(m_binArray, m_startData, (m_endData -
m_startData) + 1, charset );
终于解决了这个乱码
问题。
三、后记
接触Java和JSP已经有一年多了,这一年来最大的收获是越来越喜欢上了Java,开始把问题当作乐事去研究,没有了以前的恐惧心理,我相信我会继续坚持下去。这一年来,从网上学习了很多同行的宝贵经验,在此表示感谢。这是我第一篇自己总结的Java学习心得,由于水平有限,本文中偏颇和错误之处,欢迎指正。如果对你有些价值,在保留作者信息和文章原始出处的前提下可以随处转载。
撰写该文之前已参考了很多关于Java中文问题的文章,其中影响比较大的有owen1944在“Java研究组织”中发表的《这是我们公司总结的一些关于中文乱码
问题的一些解决方案和经验和大家分享!》等。本文谈到的解决方法已应用到“基于网络的协作学习系统-WebCL”
等项目中,并通过资源绑定的方式实现了该平台中文文两个版本的即时切换。Google根据浏览器自动选择语言,一个页面同时显示多种语言的国际化应用和车东的《Java中文处理学习笔记——Hello
Unicode》
一文引起了我极大的兴趣,日后想将继续探讨Java的国际化问题,欢迎大家一起讨论。
分享到:
相关推荐
解决乱码的各种方法总结,包括数据库的解决方案,个人觉得比较详细有使用价值
java 中出现的乱码问题,包括jsp乱码,数据传输乱码等
基于jsp后台java解决ajax异步传输中文乱码问题.
自从接触Java和JSP以来,就不断与Java的中文乱码问题打交道,现在终于得到了彻底的解决,现将我们的解决心得与大家共享。
在利用Servlet/JSP技术开发java Web应用程序的时候,不可避免的会遇到中文乱码问题,本文首先介绍了Web应用中常用的编码方式,然后分析了J2EE平台下Web应用中文乱码问题产生的原因,并在此基础上针对不同情况提出了解决...
网页资料收集 JAVA与JAVASCRIPT通信乱码问题 java javascript jsp的url提交带中文参数时后台取到的是乱码问题的解决 网页资料收集 JAVA与JAVASCRIPT通信乱码问题 java javascript jsp的url提交带中文参数时后台取到...
解决JAVA编程中遇到的各种乱码问题,对乱码问题的分析
最近实验室做了一个项目,使用jspsmartupload来实现的文件的上传下载,原来在windows平台运行的挺好,但是后来系统移植到linux平台上,结果在上传或下载的文件名中有中文时就会出现乱码。后来查了网上一些人的解决...
utf8解决JSP中文乱码问题 Tomcat 5.5中文乱码 JDBC ODBC Bridge的Bug及其解决方法 Solaris下Servlet编程的中文问题及解决办法
利用过滤器解决JavaWeb(JSP)的乱码问题
在Java编程中,经常会碰到汉字的处理及显示问题,以不小心就会产生一大堆乱码或者问号。造成这种问题的根本原因是Java中默认...在这里,主要针对Tomcat中JSP开发容易出现的中文乱码问题进行讨论,一般有以下几种情况:
将任意字符(包括汉字)加密并编码成数字+数字,解密时先解码后解密还原成相应字符。 例如: 原文:测试 helloworld ... 3,可用于解决jsp,servlet的中文乱码问题。 数据加密后传出去,在调用的地方解密即可。
Jsp输出中文的乱码问题,获取表单提交的数据时的中文乱码问题,url中的中文问题,数据库中采取的编码方式不同于utf-8怎么办
解决Java_Web开发中Jsp存储读取MySQL数据中文乱码的问题
JSP中文乱码问题综述,中文乱码解决大全,表单使用Post方式提交后接收到的乱码问题,表单get提交方式的乱码处理方式,上传文件时的乱码解决,Java代码关于url请求,接受参数的乱码,关于jsp在MyEclipse中打开的乱码问题,...
这个文档很好的解决了CentOS中的中文乱码问题,希望对大家有用。
本ppt内容主要是解决方案Eclipse 开发JSP中文乱码问题,为初学使用ECLIPSE开发JAVA WEB项目的人提供方便。
主要是数据库方面的编码修改,jsp还有tomcat中的修改很简单,这里不做赘述了。
jsp常用经典代码(md5java实现,生成中文/数字验证码,解决中文乱码) 自己平时收集的好资料和大家一起分享!!
web项目中中文乱码问题总结,几解决方法。