首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Hadoop学习笔记(四)之YARN

之前,MapReduce 是 Master/Slave 结构,也就是集群中一个 Job Tracker 多个 Task Tracker 。 Job Tracker 负责资源管理和作业调度,Task Tracker 负责定期向 Job Tracker 报告节点的状态(节点死活,资源使用情况、任务执行情况)以及接收 Job Tracker 的命令来执行。不知你是否发现,问题就出现在这一个 Job Tracker 上,它挂掉,整个集群都完蛋。而且它由于负责了所有节点的RPC 请求,压力可想而知,也因此成为了节点规模扩大的瓶颈。最后一点便是集群仅支持 MapReduce,不支持其他计算框架。如果想使用 Spark 呢?对不起,再搭建一个集群,想使用 HBase 只能再搭建一个集群。这样的一堆集群既不好管理,又使得资源利用率极低(一段时间内这个集群忙,那个集群闲),同时跨集群的数据转移更是问题。于是乎,YARN 诞生了。更多精彩文章请关注公众号『Pythonnote』或者『全栈技术精选』

03

Yarn篇--搭建yarn集群

<property>         <name>yarn.nodemanager.aux-services</name>         <value>mapreduce_shuffle</value>//定义yarn的机制     </property> <property>    <name>yarn.resourcemanager.ha.enabled</name>//是否使用HA    <value>true</value>  </property>  <property>    <name>yarn.resourcemanager.cluster-id</name//集群Id    <value>cluster1</value>  </property>  <property>    <name>yarn.resourcemanager.ha.rm-ids</name>//集群逻辑节点    <value>rm1,rm2</value>  </property>  <property>    <name>yarn.resourcemanager.hostname.rm1</name>//集群物理节点    <value>node03</value>  </property>  <property>    <name>yarn.resourcemanager.hostname.rm2</name>//集群物理节点    <value>node04</value>  </property>  <property>    <name>yarn.resourcemanager.zk-address</name>//与zookeeper通信    <value>node02:2181,node03:2181,node04:2181</value>  </property>

02
领券