使用JDBC向Kudu表插入中文字符-双引号的秘密

温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。

1.问题描述

使用Impala JDBC向Kudu表中插入中文字符,插入的中文字符串乱码,中文字符串被截断。

2.问题复现

测试环境:

  • CDH5.12.0
  • Kudu1.4.0
  • ImpalaJDBC41_2.5.35

1.使用ImpalaJDBC代码进行测试,测试代码

static String JDBC_DRIVER = "com.cloudera.impala.jdbc41.Driver";
static String CONNECTION_URL = "jdbc:impala://ip-172-31-10-118:21050/default";

public static void main(String[] args) {
    Connection con = null;
 ResultSet rs = null;
 PreparedStatement ps = null;

    try {
        Class.forName(JDBC_DRIVER);
 con = DriverManager.getConnection(CONNECTION_URL);
 String insertsql = "insertinto my_first_table values(46, '测试中文字符')";

 ps = con.prepareStatement(insertsql);
 ps.execute();
 ps.close();

 ps = con.prepareStatement("select* from my_first_table order by id asc");
 rs = ps.executeQuery();
        while (rs.next()) {
            System.out.println(rs.getLong(1) + "\t" +rs.getString(2));
 }

    } catch (Exception e) {
        e.printStackTrace();
 } finally {
 try { // 关闭rs、ps和con
 rs.close();
 ps.close();
 con.close();
 } catch (SQLException e) {
 // TODO Auto-generated catch block
 e.printStackTrace();
 }

    }
}

2.向Kudu表中分别插入测试数据,如“测试”,“测试中文”,“测试中文字符”

String insertsql = "insert into my_first_table values(44, '测试')";
String insertsql = "insert into my_first_table values(45, '测试中文')";
String insertsql = "insert into my_first_table values(46, '测试中文字符')";

如下是按测试顺序插入的数据

通过以上操作重现问题。

3.解决方法

修改程序中插入语句,将插入字符串的单引号修改为双引号

String insertsql = "insert into my_first_table values(51, \"测试中文字符\")";
String insertsql = "insert into my_first_table values(52, \"测试中文\")";
String insertsql = "insert into my_first_table values(53, \"测试\")";

修改后重新向Kudu中插入测试数据:“测试中文字符”,“测试中文”,“测试”

使用Hue查询显示如下:

中文字符串插入Kudu显示正常。

4.备注

1.使用Cloudera官网最新的JDBC驱动,插入中文字符时也有上述问题

下载地址:https://downloads.cloudera.com/connectors/impala_jdbc_2.5.38.1058.zip

2.通过Impala-shell插入中文字符串正常

[172.31.10.118:21000] > insert into my_first_table values(66,'插入中文字符');
Modified 1 row(s), 0 row error(s) in 0.11s
[172.31.10.118:21000] > select * from my_first_table where id=66;
+----+--------------+
| id | name         |
+----+--------------+
| 66 | 插入中文字符 |
+----+--------------+
Fetched 1 row(s) in 0.21s
[172.31.10.118:21000] >

[172.31.10.118:21000] > insert into my_first_table values(77, "测试中文字符");
Modified 1 row(s), 0 row error(s) in 0.11s
[172.31.10.118:21000] > select * from my_first_table where id=77;
+----+--------------+
| id | name         |
+----+--------------+
| 77 | 测试中文字符 |
+----+--------------+
Fetched 1 row(s) in 0.18s
[172.31.10.118:21000] > 

醉酒鞭名马,少年多浮夸! 岭南浣溪沙,呕吐酒肆下!挚友不肯放,数据玩的花!

温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。

欢迎关注Hadoop实操,第一时间,分享更多Hadoop干货,喜欢请关注分享。

原创文章,欢迎转载,转载请注明:转载自微信公众号Hadoop实操

原文发布于微信公众号 - Hadoop实操(gh_c4c535955d0f)

原文发表时间:2017-09-09

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Albert陈凯

4.4 共享变量

4.4 共享变量 一般来说,当一个被传递给Spark操作(例如,Map和Reduce)的函数在一个远程集群上运行时,该函数实际上操作的是它用到的所有变量的独立...

33212
来自专栏JackieZheng

Hadoop阅读笔记(七)——代理模式

  关于Hadoop已经小记了六篇,《Hadoop实战》也已经翻完7章。仔细想想,这么好的一个框架,不能只是流于应用层面,跑跑数据排序、单表链接等,想得其精髓,...

21510
来自专栏Danny的专栏

探秘BOF 和EOF

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/huyuyang6688/article/...

1153
来自专栏编码小白

activiti学习笔记(五) 流程部署

activiti流程部署 activit部署方法api     activiti共有六种部署方式,最终实现都是DeploymentEntityImpl的addR...

6817
来自专栏java 成神之路

Java 序列化 之 Serializable

37413
来自专栏屈定‘s Blog

设计模式--动态代理的思考

在一些第三方框架中经常能看到动态代理的案例,尤其是RPC框架,ORM框架等,该篇将分析这些实现的原理,另外延伸在业务中的使用示例.

1323
来自专栏IT笔记

JAVA实现一个简单的RPC+项目源码

论坛中说到聊一聊RPC远程过程调用协议 http://www.52itstyle.com/thread-22564-1-1.html RPC(Remote Pr...

4769
来自专栏木木玲

Netty in Action ——— The codec framework

1292
来自专栏技术博客

Asp.Net Web API 2第十六课——Parameter Binding in ASP.NET Web API(参数绑定)

阅读本文之前,您也可以到Asp.Net Web API 2 系列导航进行查看 http://www.cnblogs.com/aehyok/p/3446289.h...

953
来自专栏一名合格java开发的自我修养

Strom序列化机制

  Storm 中的 tuple可以包含任何类型的对象。由于Storm 是一个分布式系统,所以在不同的任务之间传递消息时Storm必须知道怎样序列化、反序列化消...

862

扫码关注云+社区

领取腾讯云代金券