首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

玩转大数据系统系列

Hive与 HBase各有各的功能,各有各的特点,但归根结底, hive与 hbase的数据最终都存储在 hdfs之上,一般我们用 hdfs来存储磁盘空间,不会将一个数据存储到多个地方,造成浪费磁盘空间,我们可以直接将数据存入 hbase,然后通过 hive整合 hbase,直接使用 sql语句分析 hbase内部的数据,这样就很方便

需求一:将hive分析结果的数据,保存到HBase当中去

1、拷贝hbase的五个依赖jar包到hive的lib目录下

将我们HBase的五个jar包拷贝到hive的lib目录下

hbase的jar包都在/export/servers/hbase-1.2.0-cdh5.14.0/lib

我们需要拷贝五个jar包名字如下

在node03中,我们通过创建软连接的方式直接执行以下命令,以实现 jar包的依赖性

2、修改hive的配置文件

编辑node03服务器上面的hive的配置文件hive-site.xml添加以下两行配置

3、修改hive-env.sh配置文件添加以下配置

4、hive当中建表并加载以下数据

hive当中建表

进入hive客户端

创建hive数据库与hive对应的数据库表

准备数据内容如下

加载数据格式如下

进行加载数据

进入hive客户端进行加载数据

5、创建hive管理表与HBase进行映射

通过在 hbase中创建一个与 hbase中的表进行映射的 hive管理表,将 hbase中的数据存储到 hbase中

hive当中创建内部表

通过insert overwrite select 插入数据

6、hbase当中查看表hbase_score

进入hbase的客户端查看表hbase_score,并查看当中的数据

需求二:创建hive外部表,映射HBase当中已有的表模型,直接通过

1、HBase当中创建表并手动插入加载一些数据

进入HBase的shell客户端,手动创建一张表,并插入加载一些数据进去

操作成功结果如下:

2、建立hive的外部表,映射HBase当中的表以及字段

在hive当中建立外部表,

进入hive客户端,然后执行以下命令进行创建hive外部表,就可以实现映射HBase当中的表数据

到此整合成功!!!!!!!!!!!!

如果觉得对你有所帮助。记得收藏和关注呦!(每日更新各种大数据框架)

如需转载请注明出处(创作不易请见谅)

和巨婴程序猿一起成长。让自己变得更优秀

想了解更多精彩内容,快来关注跟着巨婴去逆袭

我最近一直在思考(大数据通俗讲解)的问题,你的看法是什么呢?关注我快说出来一起交流一下吧~

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20200721A071O100?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券