首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >码云推荐 | 基于 Hadoop 的 Kafka On Yarn

码云推荐 | 基于 Hadoop 的 Kafka On Yarn

作者头像
码云Gitee
发布2018-03-29 11:21:41
1.7K0
发布2018-03-29 11:21:41
举报
文章被收录于专栏:开源项目开源项目
该项目用于把 Kafka 运行在 Yarn 的辅助项目,项目依赖: kafka, kafka-offset-console. 见 kafka-yarn.properties 的配置

项目文件

kafka lib(kafka.zip):

./avro-1.7.7.jar ./avro-ipc-1.7.7.jar ./commons-cli-1.2.jar ./commons-collections-3.2.1.jar ./commons-configuration-1.6.jar ./commons-io-2.4.jar ./commons-lang-2.6.jar ./commons-logging-1.1.1.jar ./guava-14.0.1.jar ./hadoop-annotations-2.6.5.jar ./hadoop-auth-2.6.5.jar ./hadoop-common-2.6.5.jar ./hadoop-hdfs-2.6.5.jar ./hadoop-mapreduce-client-core-2.6.5.jar ./hadoop-yarn-api-2.6.5.jar ./hadoop-yarn-client-2.6.5.jar ./hadoop-yarn-common-2.6.5.jar ./htrace-core-3.0.4.jar ./jackson-core-asl-1.9.13.jar ./jackson-mapper-asl-1.9.13.jar ./joda-time-2.3.jar ./jopt-simple-3.2.jar ./kafka-yarn-0.1.0.jar ./kafka_2.10-0.8.1.1.jar ./log4j-1.2.17.jar ./metrics-core-2.2.0.jar ./netty-3.6.6.Final.jar ./protobuf-java-2.5.0.jar ./scala-library-2.10.1.jar ./slf4j-api-1.7.5.jar ./slf4j-log4j12-1.7.5.jar ./snappy-java-1.0.5.jar ./zkclient-0.3.jar ./zookeeper-3.3.4.jar

kafka on yarn lib(kafka-yarn.zip):

./avro-1.7.7.jar ./avro-ipc-1.7.7.jar ./commons-cli-1.2.jar ./commons-collections-3.2.1.jar ./commons-configuration-1.6.jar ./commons-io-2.4.jar ./commons-lang-2.6.jar ./commons-logging-1.1.1.jar ./guava-14.0.1.jar ./hadoop-annotations-2.6.5.jar ./hadoop-auth-2.6.5.jar ./hadoop-common-2.6.5.jar ./hadoop-hdfs-2.6.5.jar ./hadoop-mapreduce-client-core-2.6.5.jar ./hadoop-yarn-api-2.6.5.jar ./hadoop-yarn-client-2.6.5.jar ./hadoop-yarn-common-2.6.5.jar ./htrace-core-3.0.4.jar ./jackson-core-asl-1.9.13.jar ./jackson-mapper-asl-1.9.13.jar ./joda-time-2.3.jar ./kafka-yarn-0.1.0.jar ./KafkaOffsetMonitor-assembly-0.2.0.jar ./log4j-1.2.17.jar ./metrics-core-2.2.0.jar ./netty-3.6.6.Final.jar ./protobuf-java-2.5.0.jar ./scala-library-2.10.1.jar ./slf4j-api-1.7.5.jar ./slf4j-log4j12-1.7.5.jar ./snappy-java-1.0.5.jar

上述两个包,打包后放置到HDFS /lib/kafka 下。

部署指导

该项目基于Apache Hadoop 2.6.5 开发,已经在 hadoop2.6上充分测试,运行稳定。但在其他版本 Hadoop 没有测试,该项目代码架构基于我编写的其它 On Yarn 的架构,最早在hadoop 2.2.0上测试过,运行稳定。因此我认为基本可以在 Hadoop 2.2.0 之后的版本上运行。

众所周知,Hadoop 2.0 Yarn 程序都由 ApplicationMaster 管理。Yarn 上基本可以运行所有的 Master-Slave 架构。而 Kafka 是大数据工具的通用型技术,使之运行在 Yarn 上很有必要。

Kafka 是没有 Master,Slave 概念的,而 Kafka 也没有集成 Web 管理界面。github 上 Yahoo 开源的 KafkaOffsetMonitor-assembly 可以当做 Kafka 的管理界面,在 Yarn 上当做 ApplicationMaster 运行。

因此会出现如上的两个打包。

  1. kafka-yarn.zip 是包含了 KafkaOffsetMonitor-assembly,yarn lib,avro rpc lib 的包集合;
  2. kafka.zip 是 Kafka Broker 节点的包集合;

如果你使用的是其它的 Hadoop 版本,把内部的 Hadoop lib 换为你所使用的版本。并使用标准的 zip 打包,可以到 下载。

  1. 把如上两个打包后上传到 HDFS 的 /lib/kafka/ 下;
  2. 把该项目打包后,把 manual/kaffa-on-yarn copy 到你 kafka home 的 bin 下;
  3. 把 conf 下的 server.properties copy 到你 kafka 的 conf 下;
  4. 把 kafka-yarn.properties copy 到你 kafka 的 conf 下;
  5. 修改 kafka-yarn.properties yarn.kafka.appmaster.args.zk 为你的 ZooKeeper 地址;
  6. 把Hadoop 的配置文件 core-site.xml, hdfs-site.xml yarn-site.xml copy 到 kafka conf 下;

然后启动 bin/kafka-on-yarn yarn -conf conf/server.properties;

可以通过 bin/kafka-on-yarn yarn-add -appid id -brokerid 0..n 增加 Kafka Broker

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2016-12-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Gitee 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档