前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >0680-5.16.1-impala-shell导出数据存在中文异常问题

0680-5.16.1-impala-shell导出数据存在中文异常问题

作者头像
Fayson
发布2019-07-31 14:43:15
2.1K0
发布2019-07-31 14:43:15
举报
文章被收录于专栏:Hadoop实操Hadoop实操

问题描述

Fayson在使用impala-shell -i hosts -d default -f test.sql -o test.txt, 导出结果数据时,发现执行SQL 报错,提示错误信息如下Unknown Exception : 'ascii' codec can't encode characters in position 61-62: ordinal not in range(128),看到这个异常,想必熟悉python的朋友知道这是python中文乱码的问题,Fayson下面会详细描述该问题和解决办法

  • 测试环境:

1.RedHat7.4

2.CDH5.16.1

问题重现

首先我们使用impala-shell 创建一张表并插入一条数据包含中文字符,然后进行查看

代码语言:javascript
复制
[hadoop2.macro.com:21000] > create table testimpala_shell (s1 string,s2 string);
[hadoop2.macro.com:21000] > insert into testimpala_shell values ("hello","你好");
[hadoop2.macro.com:21000] > select * from testimpala_shell;

然后执行下列命令,并查看日志,发现异常如下:

代码语言:javascript
复制
impala-shell -i hadoop2.macro.com -d default -f test.sql -o test1.log
或者
impala-shell -i hadoop2.macro.com -d default -f test.sql > test.log 2>&1
或者
impala-shell -i hadoop2.macro.com -d default -q “select * from testimpala_shell” -o test1.log

同样的语句在没有中文字符的情况下可以正常执行和导出结果数据

问题解决

由于查询在impala-shell 中没有问题,在导出数据的时候才有问题,这是impala-shell的客户端是由python编写的,而Python无法自动将unicode对象写入没有设置默认编码的输出流,所以导致该异常。对于该问题,修改impala-shell默认编码为utf-8即可解决该问题

代码语言:javascript
复制
vim /opt/cloudera/parcels/CDH/lib/impala-shell/impala_shell.py
#添加如下代码:
import sys
reload(sys)
sys.setdefaultencoding('utf-8')

然后重新执行,发现已经可以正常执行

该问题经Cloudera确认为C5 版本的BUG,目前已在C6版本中修复

详细参考:https://issues.apache.org/jira/browse/IMPALA-2717

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-07-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Hadoop实操 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
专用宿主机
专用宿主机(CVM Dedicated Host,CDH)提供用户独享的物理服务器资源,满足您资源独享、资源物理隔离、安全、合规需求。专用宿主机搭载了腾讯云虚拟化系统,购买之后,您可在其上灵活创建、管理多个自定义规格的云服务器实例,自主规划物理资源的使用。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档