java字符编码和oracle乱码

编码问题我仍旧没搞懂,最根本的从哪里来就没搞懂。当页面发送请求,编码到后台是什么编码呢?好吧,我默认的都是utf-8.后台接收参数后,可以在控制台打印出来,我也不清楚是什么编码。然后,就是数据库问题。

在mysql数据库,首先会设置mysql安装的字符集为utf-8,然后在连接的jdbc上注明characterEncoding是utf-8.一直这样统一下去,没有出现乱码。

连接oracle就出现问题了,我使用的一个已经安装好的oracle数据库。字符集是American,us7ascii.我插入和查询的中文都是乱码。百度了很久之后,还是进行转码工作。

关于java编码,先看String中的几个方法:

getBytes()

1 byte[] java.lang.String.getBytes(String charsetName) throws UnsupportedEncodingException
2 
3 
4 Encodes this String into a sequence of bytes using the named charset, storing the result into a new byte array. 
5 
6 The behavior of this method when this string cannot be encoded in the given charset is unspecified. The java.nio.charset.CharsetEncoder class should be used when more control over the encoding process is required.

这里先要搞清楚编码(encode)和解码(decode).下面是个人推测,没有考证的解释:

encode:编码,将字符依据某种规则(字符集)解释为一串数字
decode:解码,将一串数字依据某种规则翻译为字符

理解了编码和解码后,从一个字符串开始解析。

字符串str="中文",str是一串字符,通过str.getBytes()可以编码成byte数组。通过new String(bytes)来解码为字符串。下面是测试:

 1  @Test
 2     public void getEncod() throws UnsupportedEncodingException {
 3         String sysencod = System.getProperty("file.encoding");
 4         System.out.println("系统默认编码:"+sysencod);
 5         String str = "中文";
 6         System.out.println("字符实例:"+str);
 7         System.out.println("===============getbytes无参:===============");
 8         byte[] bytes = str.getBytes();
 9         for (int i = 0; i < bytes.length; i++) {
10             System.out.print(bytes[i]);
11         }
12         System.out.println();
13         System.out.println("通过默认字符集,将字符数组解码为字符:"+new String(bytes));
14         System.out.println("通过utf-8字符集,将字符数组解码为字符:"+new String(bytes,"utf-8"));
15         System.out.println("通过gbk字符集,将字符数组解码为字符:"+new String(bytes,"gbk"));
16         System.out.println("通过iso-8859-1字符集,将字符数组解码为字符:"+new String(bytes,"iso-8859-1"));
17 
18 
19         System.out.println("===============getbytes(utf-8):===============");
20         byte[] bytes2 = str.getBytes("utf-8");
21         for (int i = 0; i < bytes.length; i++) {
22             System.out.print(bytes[i]);
23         }
24         System.out.println();
25         System.out.println("通过默认字符集,将字符数组解码为字符:"+new String(bytes2));
26         System.out.println("通过utf-8字符集,将字符数组解码为字符:"+new String(bytes2,"utf-8"));
27         System.out.println("通过gbk字符集,将字符数组解码为字符:"+new String(bytes2,"gbk"));
28         System.out.println("通过iso-8859-1字符集,将字符数组解码为字符:"+new String(bytes2,"iso-8859-1"));
29         System.out.println("===============getbytes(gbk):===============");
30         byte[] bytes3 = str.getBytes("gbk");
31         for (int i = 0; i < bytes.length; i++) {
32             System.out.print(bytes[i]);
33         }
34         System.out.println();
35         System.out.println("通过默认字符集,将字符数组解码为字符:"+new String(bytes3));
36         System.out.println("通过utf-8字符集,将字符数组解码为字符:"+new String(bytes3,"utf-8"));
37         System.out.println("通过gbk字符集,将字符数组解码为字符:"+new String(bytes3,"gbk"));
38         System.out.println("通过iso-8859-1字符集,将字符数组解码为字符:"+new String(bytes3,"iso-8859-1"));
39         System.out.println("===============getbytes(iso-8859-1):===============");
40         byte[] bytes4 = str.getBytes("iso-8859-1");
41         for (int i = 0; i < bytes.length; i++) {
42             System.out.print(bytes[i]);
43         }
44         System.out.println();
45         System.out.println("通过默认字符集,将字符数组解码为字符:"+new String(bytes4));
46         System.out.println("通过utf-8字符集,将字符数组解码为字符:"+new String(bytes4,"utf-8"));
47         System.out.println("通过gbk字符集,将字符数组解码为字符:"+new String(bytes4,"gbk"));
48         System.out.println("通过iso-8859-1字符集,将字符数组解码为字符:"+new String(bytes4,"iso-8859-1"));
49     }

结果:

奇诡的是,虽然getBytes打印的byte数组内容看起来是一样的,但此编码结构却是不同的。并不是一串字符通过某种字符集编码,再解码就可以还原的。这要看该字符是属于何种编码。中文字符只有utf-8和gbk能够存储成功,别的编码会出现漏码像7位编码之类的。而我要解决的就是中文乱码问题。因此,中文编码是关于utf-8和gbk的。

对于存储于oracle的中文字符,采用iso-8859-1.因此,需要考虑的就是utf-8还是gbk转储为iso-8859-1.

经过测试,存储的时候:p=new String(p.getBytes("gbk"),"iso-8859-1");而getBytes("utf-8")失败。

查询结果的时候:result = new String(str.getBytes("ISO-8859-1"),"gbk")可以将oracle的中文正常显示。

附上我用oracle的字符集:

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏达摩兵的技术空间

js代码规范

20. 判断是否相等时候 采用=== 判断包括类型的相等 21. 尽量使用语法严格模式 消除代码之中的不友好;代码运行更快 ;保证运行的安全 ;为新版本的...

603
来自专栏个人随笔

JavaScript 网页脚本语言 由浅入深

1)基础 学习目的: 1. 客户端表单验证 2. 页面动态效果 3. jQuery的基础 什么是JavaScript? 一种描述性语言,也是一种基于对象和事件驱...

33410
来自专栏C/C++基础

C/C++文字常量与常变量

在C/C++编程时,经常遇到以下几个概念:常量、文字常量、字面常量、符号常量、字符常量、常变量、字符串常量等,网上的资料描述的不尽相同,弄得大家云里雾里。本文将...

1072
来自专栏机器学习入门

POJ 刷题系列:2159. Ancient Cipher

POJ 刷题系列:2159. Ancient Cipher 传送门:POJ 2159. Ancient Cipher 题意: 给定两个长度相等的字符串a, b...

1816
来自专栏专注 Java 基础分享

访问权限控制

访问权限控制又称「隐藏具体实现」,也就是说,我们可以通过它来决定某个类或者类中的成员在程序中的可见范围。例如,被修饰为 public 的元素在全局范围可见,而被...

3065
来自专栏前端布道

ES6新特性概览

前言 ECMAScript 6(以下简称ES6)是JavaScript语言的下一代标准,已经在2015年6月正式发布了。它的目标,是使得JavaScript语言...

37311
来自专栏CaiRui

Shell-4-让文本飞

1.正则表达式 ^ 行起始标志 $ 行尾标记 . 匹配任意一个字符 [ ] 匹配包含在[字符]之中...

1759
来自专栏郭耀华‘s Blog

全面掌握IO(输入/输出流)

File类: 程序中操作文件和目录都可以使用File类来完成即不管是文件还是目录都是使用File类来操作的,File能新建,删除,重命名文件和目录,但File不...

34915
来自专栏开心的学习之路

JavaScript概览

近日的项目需要用JavaScript完成,于是决定通读《JavaScript高级程序设计第三版》,书是2012年的,比较老了,但是可以用来快速了解JavaScr...

2824
来自专栏python学习指南

Python爬虫(十六)_JSON模块与JsonPath

本篇将介绍使用,更多内容请参考:Python学习指南 数据提取之JSON与JsonPATH JSON(JavaScript Object Notation...

2385

扫描关注云+社区