首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >在具有HA功能的Hadoop Yarn集群上部署Apache Spark

在具有HA功能的Hadoop Yarn集群上部署Apache Spark
EN

Stack Overflow用户
提问于 2016-03-23 14:13:55
回答 2查看 1.5K关注 0票数 0

我是大数据环境的新手,刚开始使用Zookeeper安装具有HA功能的3节点Hadoop集群2.6。

现在一切运行正常,我已经在NN1和NN2上使用zookeeper测试了故障转移场景,并且运行良好。

现在我正在考虑在我的Hadoop Yarn集群上安装Apache Spark,同样具有HA功能。

有人能指导我安装步骤吗?我只能找到如何将Spark设置为独立模式,并且我已经成功设置了它。现在我想在Yarn集群中安装相同的软件以及HA功能,

我有三个节点集群(NN1、NN2、DN1),下面的守护进程当前在每个服务器上运行,

代码语言:javascript
运行
复制
Nodes running in Master NameNode (NN1)
Jps 
DataNode    
DFSZKFailoverController 
JournalNode 
ResourceManager 
NameNode    
QuorumPeerMain  
NodeManager 

Nodes running in StandBy NameNode (NN2)
Jps 
DFSZKFailoverController 
NameNode    
QuorumPeerMain  
NodeManager 
JournalNode 
DataNode    

Nodes running in DataNode (DN1)

QuorumPeerMain  
Jps 
DataNode    
JournalNode 
NodeManager 
EN

回答 2

Stack Overflow用户

发布于 2016-03-23 15:33:15

您应该设置ResourceManager HA (http://hadoop.apache.org/docs/current/hadoop-yarn/hadoop-yarn-site/ResourceManagerHA.html)。Spark when run on YARN不会运行自己的守护进程,因此在YARN模式下没有需要HA的spark部分。

票数 0
EN

Stack Overflow用户

发布于 2016-03-23 18:44:47

您可以配置Spark Yarn模式,在Yarn模式下,您可以根据集群容量配置驱动程序和执行器。

代码语言:javascript
运行
复制
spark.executor.memory <value>

执行器的数量是根据你的纱线容器内存分配的!

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/36171005

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档