前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >hadoop中Yarn的配置与使用示例

hadoop中Yarn的配置与使用示例

作者头像
超哥的杂货铺
发布2019-12-18 10:58:47
2.9K0
发布2019-12-18 10:58:47
举报
文章被收录于专栏:超哥的杂货铺超哥的杂货铺

前面我们学习了如何在Mac OS上进行hadoop的搭建,参考MAC OS搭建Hadoop伪分布式集群。hadoop2.0之后,出现了Yarn框架用于作业的调度和集群资源的管理,因此对yarn的配置也必不可少。yarn的配置相对来讲比较简单,只需要修改mapred-site.xmlyarn-site.xml两个配置文件即可,这两个文件与前文提到过的三个配置文件都在$HADOOPHOME/etc/hadoop文件夹下。

1.mapred-site.xml配置

进入相应的文件夹下编辑mapred-site.xml文件,添加mapreduce.framework属性即可。

配置文件所在位置

mapred-site.xml的配置 2.yarn-site.xml配置

yarn-site.xml的配置

同样的,在yarn-site.xml中添加nodemanager的服务即可。

3.启动yarn相关进程并验证是否启动成功

启动yarn相关进程

代码语言:javascript
复制
./start-yarn.sh #在sbin目录下执行该命令可以启动yarn# 注意在这之前要先启动HDFS,从控制台的输出中可以看出,# 启动了resourcemanager和nodemanager进程,jps验证也输出了相应的进程号。# 启动之后可以通过访问http://localhost:8088来访问yarn的管理界面。
./stop-yarn.sh #停止yarn相关进程

4.在yarn上运行hadoop示例程序

任务正在运行:RUNNING

任务运行结束:FINISHED

与前文一样,我们依然运行hadoop自带jar包例子中计算PI的程序。此处有几点需要说明。

1)web页面可以随时跟踪任务的执行状态,刚提交时是running,执行结束后会变成finished。如上图所示。

2)配置了yarn之后,会在计算时链接yarn的服务。从控制台输出中我们可以看到连接了ResourceManger。ResourceManager就是yarn的资源管理器。

配置yarn之后的计算PI日志

3)对比没有配置yarn之前的控制台上输出。可以看出配置yarn之后的日志更简洁。配置之前的(部分)日志见下图,配置之后的(部分)日志见上图。配置之前日志信息告诉我们,执行的是一个MapReduce过程,有map task,reduce task等。而配置之后,只有mapreduce job。可以理解为是运行在yarn之上的一个map reduce作业。配置之后运行时间虽然不一定快,但yarn的统一管理对整个集群来讲是更优化的。

配置yarn之前的计算PI日志

以上就是hadoop中关于yarn的配置和思考,欢迎大家留言交流~

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-06-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 超哥的杂货铺 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档