前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >0762-5.16.2-Impala查询HBase表字段顺序不正确异常分析

0762-5.16.2-Impala查询HBase表字段顺序不正确异常分析

作者头像
Fayson
发布2020-04-24 17:50:13
6920
发布2020-04-24 17:50:13
举报
文章被收录于专栏:Hadoop实操Hadoop实操

异常说明

按照官方文档在Hive中建表关联HBase,然后在Hue中用Impala查询,查询结果中字段的顺序与在Hive中的建表顺序不一致,Hue中使用Impala查询出来的字段顺序是按照字母排序的。

问题重现和说明

在Hive中建表关联HBase

代码语言:javascript
复制
CREATE EXTERNAL TABLE `hbasestringids`(            |
|   `id` string COMMENT 'from deserializer',         |
|   `bool_col` boolean COMMENT 'from deserializer',  |
|   `tinyint_col` tinyint COMMENT 'from deserializer',  |
|   `smallint_col` smallint COMMENT 'from deserializer',  |
|   `int_col` int COMMENT 'from deserializer',       |
|   `bigint_col` bigint COMMENT 'from deserializer',  |
|   `float_col` float COMMENT 'from deserializer',   |
|   `double_col` double COMMENT 'from deserializer',  |
|   `date_string_col` string COMMENT 'from deserializer',  |
|   `string_col` string COMMENT 'from deserializer',  |
|   `timestamp_col` timestamp COMMENT 'from deserializer') |
| ROW FORMAT SERDE                                   |
|   'org.apache.hadoop.hive.hbase.HBaseSerDe'        |
| STORED BY                                          |
|   'org.apache.hadoop.hive.hbase.HBaseStorageHandler'  |
| WITH SERDEPROPERTIES (                             |
|   'hbase.columns.mapping'=':key,boolsCF:bool_col,intsCF:tinyint_col,intsCF:smallint_col,intsCF:int_col,intsCF:bigint_col,floatsCF:float_col,floatsCF:double_col,stringsCF:date_string_col,stringsCF:string_col,stringsCF:timestamp_col',  |
|   'serialization.format'='1')                      |
| TBLPROPERTIES (                                    |
|   'hbase.table.name'='hbasealltypessmall',         |
|   'transient_lastDdlTime'='1585032011')

Hive中的建表顺序如下

在Impala-shell中查询出的表字段顺序如下,与Hive建表顺序不一致

在Hue中用询出来的表字段顺序如下,与在Impala-shell中的查询结果一直,但是与Hive中的建表顺序不一致。

经确认,此问题是Impala中的一个bug,目前正在修复中。目前有一个Jira在跟踪这个问题,链接如下,如果要保持字段顺序可以在select后按照自己想要的顺序自己编写。

https://issues.apache.org/jira/browse/IMPALA-886

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-04-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Hadoop实操 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
TDSQL MySQL 版
TDSQL MySQL 版(TDSQL for MySQL)是腾讯打造的一款分布式数据库产品,具备强一致高可用、全球部署架构、分布式水平扩展、高性能、企业级安全等特性,同时提供智能 DBA、自动化运营、监控告警等配套设施,为客户提供完整的分布式数据库解决方案。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档