前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Kettle 7.1 连接HBase数据表

Kettle 7.1 连接HBase数据表

作者头像
kongxx
发布2018-10-11 16:06:52
2K0
发布2018-10-11 16:06:52
举报

设置Hadoop环境

在Tools -> Hadoop Distribution 中选择 “HortonWorks HDP 2.5.x”。

复制 hbase-site.xml 文件

从hbase集群中复制 hbase-site.xml 文件到 kettle 安装目录下的 “plugins/pentaho-big-data-plugin/hadoop-configurations/hdp25” 目录下。

准备数据表

这里准备测试从一个hbase表导数据到另一个hbase表,其实往别存储介质也都是类似,比如文件,数据库。这里主要是为了说明怎样连hbase。

这里使用两个表,user和user2,测试从user表导数据到user2表。

代码语言:javascript
复制
# 启动shell
$ bin/hbase shell

################################################################################
# 创建 user 表

# 创建 user 表,其中包括两个列族 base 和 address。
# base列族用来保存用户基本信息,username和password
# address列族用来保存家庭和办公地址 
> create 'user', 'base', 'address'

# 向 user 表写入数据
> put 'user', 'row1', 'base:username', 'user1'
> put 'user', 'row1', 'base:password', 'user1'
> put 'user', 'row1', 'address:home', 'user1 home'
> put 'user', 'row1', 'address:office', 'user1 office'

> put 'user', 'row2', 'base:username', 'user2'
> put 'user', 'row2', 'base:password', 'user2'
> put 'user', 'row2', 'address:home', 'user2 home'
> put 'user', 'row2', 'address:office', 'user2 office'

################################################################################
# 创建 user2 表
> create 'user', 'base', 'address'

测试导入

  • 添加一个Transformations。
  • 在 View -> Transformations -> Hadoop clusters 添加一个新的 Hadoop 集群。配置大致如下:(修改后可以测试一下) Cluster Name: myhdfs Storage: HDFS HDFS: (可以参考core-site.xml文件) Hostname: <ip> Port: 8020 Username: <user> Password: <password> JobTracker: Hostname: <ip> Port: 8032 Zookeeper: Hostname: <ip> Port: 2181
  • 在工作区,拖拽一个 “HBase Input” 和 “HBase Output”,并建立关联。
  • 设置 “HBase Input”
    • 首先在 “Configure query” 中设置 “Hadoop Cluster”。
    • 在 “Create/Edit mappings” 中 “HBase table name” 选择 user。
    • 在 “Create/Edit mappings” 中 “Mapping name” 输入 user_mapping。
    • 在 “Create/Edit mappings” 中 表格中定义下面几项,然后 “Save mapping”

    Alias Key Column family Column Type ROW Y String username N base username String password N base password String home N address home String office N address office String

    • 回到 “Configure query”,HBase table name” 选择 user, “Mapping name” 选择 user_mapping。
  • 设置 “HBase Output
    • 首先在 “Configure query” 中设置 “Hadoop Cluster”。
    • 在 “Create/Edit mappings” 中 “HBase table name” 选择 user2。
    • 在 “Create/Edit mappings” 中 “Mapping name” 输入 user2_mapping。
    • 在 “Create/Edit mappings” 中 表格中定义下面几项,然后 “Save mapping”

    Alias Key Column family Column Type ROW Y String username N base username String password N base password String home N address home String office N address office String

    • 回到 “Configure query”,HBase table name” 选择 user2, “Mapping name” 选择 user2_mapping。
  • 运行Transformations,然后检查结果。
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018.10.10 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 设置Hadoop环境
  • 复制 hbase-site.xml 文件
  • 准备数据表
  • 测试导入
相关产品与服务
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档