前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >CDH impala hive hbase 整合

CDH impala hive hbase 整合

作者头像
shengjk1
发布2018-10-24 15:28:36
2K0
发布2018-10-24 15:28:36
举报
文章被收录于专栏:码字搬砖码字搬砖

impala hive hbase 整合

这里写图片描述
这里写图片描述

最终达到的效果是这样的:hbase是数据的存储中心。impala、hive可以增查habse数据,不支持insert overwrite impala hive hbase的增删改在三者任何之一处操作,另两处均可以查到

1、habse 创建表 create 'test_info', 'info' 表名test_info 列族: info 2.hive中创建外部表 不支持impala

代码语言:javascript
复制
CREATE EXTERNAL TABLE sho.test_info(
     user_id string,
     user_type tinyint,
     gender string,
     birthday string)
ROW FORMAT SERDE 'org.apache.hadoop.hive.hbase.HBaseSerDe'
STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES ("hbase.columns.mapping" = ":key, info:user_type, info:gender, info:birthday")
TBLPROPERTIES("hbase.table.name" = "test_info");

hbase中的RowKey为 user_id ,其余的为列族 info:列名

3.同步元数据 修改完hive表后也要同步元数据

代码语言:javascript
复制
INVALIDATE METADATA; 

同步hive的Metastore中的元数据

注意: 1.ROW FORMAT SERDE ‘org.apache.hadoop.hive.hbase.HBaseSerDe’ STORED BY ‘org.apache.hadoop.hive.hbase.HBaseStorageHandler’ WITH SERDEPROPERTIES 是严格区分大小写的 2.如果要改变test_info的字段,则只需删除test_info表,然后重建即可。 3.新老test_info的字段名个数可以不同,甚至表名都可以不同 4.重建若想要查询之前已有的数据,需保证字段名字一样。 5.insert into会自动覆盖相同字段名字的数据 6.用hive、impala每次查出的都是最新的数据

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2016年07月29日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档