在Servlet中,请求参数如果存在中文,不管是POST请求还是GET请求,都会出现请求参数乱码的问题,本篇博将分别给出解决方案!
POST请求参数获得的中文之所以发生乱码是因为POST请求获取参数的时候,底层是以getReader()这种字符流的方式获取POST的请求体参数,getReader()底层对于获取的中文字符串的编码方式是“ISO_8859_1”,所以控制台输出时是乱码,因此在获取POST请求参数时,先要设置编码方式,然后获取参数,例如:
//解决乱码:POST,getReader()
request.setCharacterEncoding("UTF-8");//设置字符输入流的编码// 获取username参数
String username = request.getParameter("username");
然后就OK了!
对于GET请求乱码的处理就不像POST这么简单,要处理GET的乱码问题哦,你先要探究这个中文乱码是怎么出现的,这其实是因为浏览器对于中文的URL编码和Tomcat服务器对于URL中中文参数的解码方式不同而导致的!
先来了解一下浏览器URL编码的规则:
这里是以UTF-8对汉字进行编码的,一个汉字三个字节,而Tomcat服务器解码时却是以“ISO_8859_1”(编码只一个字节),所以出现乱码。
但是Tomcat的这个解码方式是在获取GET请求的方法getQueryString()底层写死的,也没提供可以修改的接口,因此就需要其他解决方案!
不管什么方式的编码解码,他们的二进制都是一样的,因此我们可以先对乱码数据进行编码(解码时是ISO_8859_1,编码时要一致):转为字节数组,然后再对这个字节数组以UTF-8的方式解码,就获得正常的汉字啦!
//GET,获取参数的方式:getQueryString
//乱码原因:tomcat进行URL解码,默认的字符集ISO-8859-1
//先对乱码数据进行编码:转为字节数组
byte[] bytes = username.getBytes(StandardCharsets.ISO_8859_1);
//字节数组解码
username = new String(bytes, StandardCharsets.UTF_8);//一行代码的写法
username = new String(username.getBytes(StandardCharsets.ISO_8859_1),StandardCharsets.UTF_8);
这样就解决GET请求参数的乱码问题了!当然这个方式是通用的,也能解决POST的乱码问题!
需要注意:Tomcat 8.0之后,已将 GET 请求乱码问题解决,设置默认的解码方式为 UTF-8
但是我们在开发中用的Maven的tomcat插件最新版本却还是tomcat7,这也是因为社区版无法导入本地Tomcat(社区版有Tomcat插件可以试试),所以如果开发中用的tomcat7,还是要了解!
上一篇:搭建一个中心化的定时服务