前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Kettle 7.1 连接Hadoop集群

Kettle 7.1 连接Hadoop集群

作者头像
kongxx
发布2018-10-11 16:07:16
1.8K0
发布2018-10-11 16:07:16
举报

设置Hadoop环境

在Tools -> Hadoop Distribution 中选择 “HortonWorks HDP 2.5.x”。

复制core-site.xml文件

复制 Hadoop 环境下的的 core-site.xml 文件到 kettle 安装目录下的 “plugins/pentaho-big-data-plugin/hadoop-configurations/hdp25” 目录下。

做完上面两步后,重新启动 Kettle。

测试Hadoop集群连接

  • 添加一个Transformations。
  • 在 View -> Transformations -> Hadoop clusters 添加一个新的 Hadoop 集群。配置大致如下:(修改后可以测试一下) Cluster Name: myhdfs Storage: HDFS HDFS: (可以参考core-site.xml文件) Hostname: <ip> Port: 8020 Username: <user> Password: <password> JobTracker: Hostname: <ip> Port: 8032 Zookeeper: Hostname: <ip> Port: 2181
  • 在工作区,拖拽一个 “Hadoop File Input” 和 “Hadoop File Output”,并建立关联。
  • 修改“Hadoop File Input” Environment: myhdfs File/Folder: /tmp/users.dat
  • 修改“Hadoop File Output” Hadoop cluster: myhdfs Folder/File: /tmp/users_new.dat
  • 运行Transformations,然后检查结果。
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018.10.10 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 设置Hadoop环境
  • 复制core-site.xml文件
  • 测试Hadoop集群连接
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档