hadoop集群部署怎么分主节点_hadoop集群怎么查看主节点_hadoop集群如何增加主节点 - 腾讯云开发者社区

hadoop、google-cloud-storage、google-cloud-platform、google-hadoop

“在Google Cloud平台上部署Apache HadoopHadoop将部署在单个集群中。默认部署创建1个主VM实例和2个工作VM，每个实例具有4个vCPU、15 GB内存和500 GB磁盘。创建一个临时部署协调器VM实例来管理集群设置。Hadoop集群使用云存储存储桶作为其默认文件系统，可通过Goo

浏览 7提问于2014-11-23得票数 0

2回答

通过Ambari安装Hadoop多节点群集

hadoop、ambari

为了通过ambari在hadoop中设置多节点集群，我们是否需要在两个主机上使用相似类型的操作系统，或者不同的操作系统也可以工作。例如，我的1台主机的操作系统为7分，而其他主机的操作系统为6分，因此设置是否成功，或者会出现错误。

浏览 1提问于2017-08-10得票数 0

1回答

Google计算引擎上的Hadoop

hadoop、google-compute-engine、google-hadoop

我试图通过“启动点击部署软件”在中安装hadoop集群，.I创建了一个主节点和一个从节点，并尝试使用主节点中的start-all.sh脚本启动集群，而我得到了“拒绝权限(公开密钥)”。我在从节点和主节点中都生成了公钥和私钥。目前，我用用户名登录了主用户，是否必须以"hadoop“用户.If的身份登录主用户，那么，该u

浏览 2提问于2014-11-11得票数 1

回答已采纳

1回答

运行并行作业本地动态spark集群

apache-spark、spark-streaming

我是spark的新手，我们需要设置一个动态spark集群来运行多个作业。通过参考一些文章，我们可以使用EMR (Amazon)服务来实现这一点。有没有什么方法可以在本地完成相同的设置？一旦Spark集群可用于在不同服务器上的不同端口上运行的服务，如何为每个作业将迷雾指向新的spark集群。提前谢谢。

浏览 9提问于2020-03-16得票数 0

1回答

添加pyspark脚本作为AWS步骤

amazon-web-services、pyspark、amazon-emr

spark.yarn.submit.waitAppCompletion=true,<s3 location of pyspark script>],ActionOnFailure=CONTINUE conf = SparkConf().setAppName('Project').set("spark.jars", "&#x

浏览 7提问于2020-03-23得票数 0

3回答

hadoop集群中的边缘节点

hadoop、bigdata

有人能给我解释一下hadoop中Edge节点的架构吗？我只能在互联网上找到定义，我有以下问题- 1)边缘节点必须是集群的一部分吗(如果它在集群内，我们有什么优势？)它是否在hdfs中存储任何数据块。2)边缘节点可以在集群外吗？

浏览 5提问于2013-05-22得票数 12

3回答

假设有一个拥有20台机器的Hadoop集群。在这20台机器中，有18台机器是从机，19台机器用于NameNode，20台机器用于JobTracker。现在我知道hadoop软件必须安装在所有这20台机器上。但我的问题是，将文件xyz.txt加载到Hadoop Cluster涉及到哪台机器。客户端机器是否是一台独立机器。我们需要在那台clinet机器上安装Hadoop软件吗？客户端机器如何识别Hadoop集群？

浏览 1提问于2014-03-07得票数 14

1回答

在hadoop集群中添加节点而不重新启动主服务器

hadoop、hdfs、hadoop-yarn

我已经创建了hadoop集群，并希望在集群中添加一个新节点，作为从节点运行，而不重新启动主节点。这怎么能办到

浏览 3提问于2022-05-05得票数 0

1回答

从hdfs、集群设置和使用中获取弹性搜索中的数据

hadoop、elasticsearch、apache-spark、cluster-computing、elasticsearch-hadoop

我在相同的实例上有hdfs数据节点和火花主节点。所有的实例都是相同的，16G双核(不幸)。我还有3台机器，同样的规格。现在我有三个选择，1.在这3台机器上部署es。集群看起来像1-主(火花和hdfs) 6-火花工作者和hdfs数据节点3-elasticsearch节点。在1上部署es主程序，扩展spark和hdfs，在所有

浏览 1提问于2016-12-22得票数 0

1回答

如何结合hadoop streaming使用docker工具箱解决多节点集群的map reduce问题

docker、mapreduce、cluster-computing

我能够使用docker使用单个节点来解决map reduce问题。但现在对于多节点，我需要连接到另一台PC。如何获取docker容器内作为我的从节点的其他计算机的IP地址？

浏览 11提问于2019-04-04得票数 0

1回答

apache-flink、amazon-emr

我刚开始使用flink，并试图在EMR集群上部署jar。我使用了3个节点集群(1个主服务器和2个从节点)进行默认配置。我没有做任何配置更改，并坚持默认配置。在我的主节点上运行以下命令：我得到了以下错误： INFO org.apache.flink.yarn.YarnCl

浏览 1提问于2018-05-11得票数 0

1回答

在非集群计算机上编译Hadoop MapReduce并在Hadoop集群上运行。

java、maven、hadoop、mapreduce、cloudera

我已经阅读了很多关于Hadoop的文档和信息，但是我不知道如何实现这个简单的工作流：我希望能够将这些MapReduce作业集成到外部应用程序中，并能够透明地运行它们。看起来，所有的开发/编译/运行都应该在存在bin/hadoop命

浏览 4提问于2016-01-04得票数 0

回答已采纳

1回答

在Hadoop集群中为MapReduce作业部署JAR

hadoop

我在CentOS linux中有一个5节点hadoop集群。我写了一张地图，还原并编译了这个罐子。我需要将JAR部署到哪个节点？提前谢谢。

浏览 7提问于2015-06-15得票数 2

1回答

如何指定在提交Spark应用程序时从HDFS读取数据的位置？

apache-spark、hdfs

我一直试图在三台机器(主、slave1和slave2)上部署一个火花多节点集群。我已经成功地部署了spark集群，但是对于如何在从服务器上分发我的HDFS数据感到困惑吗？是否需要手动将数据放在从节点上，以及如何指定从客户端提交应用程序时从何处读取数据？我已经搜索了多个论坛，但没有找到如何在没有使用Hadoop的情况下使用HDFS与Spark。

浏览 0提问于2017-12-03得票数 0

回答已采纳

1回答

为Hadoop Namenode备份添加QJM或NFS

hadoop

我计划在云上部署一个hadoop集群，其中包含1个主节点、3个Datanodes和1个边缘节点。在这样做之前，我想记住部署策略，以便为Namenode创建一个备份节点。我读过辅助namenode帮助主节点更快地启动并更新Editlog和fsimage。但是，如果主节点失败，则不能将其用作Namenode。如果我能得到一些澄清，我会很高兴。另外，我想知道关于Namenode高可用性的

浏览 2提问于2014-06-12得票数 0

回答已采纳

点击加载更多