hadoop群集+禁用spark应用程序在特定数据节点上运行的任何方式

apache-spark、spark-streaming、ambari、hdp、datanode

我们有Hadoop集群(带有ambari的HDP 2.6.5集群，有25台数据节点机器) 我们正在使用spark流媒体应用程序(在Hortonworks 2.6.x上运行的spark 2.1) 目前的情况是，spark streaming应用程序在所有数据节点机器上运行但是

浏览 14提问于2020-07-01得票数 0

回答已采纳

1回答

Apache &火花流: Twitter示例只在本地工作

apache-spark、apache-spark-sql、spark-streaming、apache-zeppelin

我刚刚从 (“流数据教程”一节)中将示例项目添加到Zeppelin笔记本中。我现在遇到的问题是，应用程序似乎只在本地工作。如果我将Spark解释器设置"master“从"local*”更改为“SQL ://master:7077”，则在执行相同的SQL语句时，应用程序将不再带来任何结果。我做错什么了吗？我使用以下安装： Spark 1.5.1 ( Hadoop 2.6+预构

浏览 2提问于2015-12-15得票数 2

回答已采纳

1回答

从ECS码头集装箱运行EMR作业

amazon-emr、amazon-ecs

我已经将用python编写的ML作业代码包含到一个码头容器中，并能够使用Amazon作为码头服务运行。我想使用星星之火以分布式方式运行，并在亚马逊EMR.Can上部署，建立ECS和EMR之间的连接？

浏览 3提问于2017-05-25得票数 9

回答已采纳

1回答

如何使PySpark在集群上工作

apache-spark、google-cloud-platform、google-cloud-storage、google-cloud-dataproc

我有一系列问题(很抱歉，Google文档太糟糕了，而且不方便用户使用)：在Google，Dataproc上，亚马逊的EMR相当于什么？当我在本地运行Spark作业并尝试访问时，我这样做是没有问题的。当我尝试使用Dataproc时，它会崩溃。中的主节点和工作节点上。我在我的主节点和工作节点上将以下内容添加到/etc

浏览 3提问于2019-01-18得票数 3

1回答

与星火历史服务器正在运行的群集通信

apache-spark

我有一个可以工作的Spark集群，其中一个主节点和一些工作节点运行在Kubernetes上。此群集已用于多个星火提交作业，并已开始运行。在主节点上，我使用$ Spark _HOME/sbin/start历史记录-server.sh脚本和一些信任来确定历史服务器的日志应该写在哪里，从而启动了一个星火历史服务器： spark.ev

浏览 2提问于2021-09-16得票数 1

回答已采纳

3回答

hadoop集群中的边缘节点

hadoop、bigdata

有人能给我解释一下hadoop中Edge节点的架构吗？我只能在互联网上找到定义，我有以下问题- 1)边缘节点必须是集群的一部分吗(如果它在集群内，我们有什么优势？)它是否在hdfs中存储任何数据块。2)边缘节点可以在集群外吗？

浏览 5提问于2013-05-22得票数 12

1回答

Google Dataproc集群属性

google-cloud-platform、google-cloud-dataproc

我想了解更多关于这些属性是针对整个集群\每个节点还是两者的组合的详细信息。对于示例spark:spark.executor.instances

浏览 1提问于2019-11-12得票数 1

2回答

如何将数据加载到来自远程HDFS的spark中？

apache-spark、hadoop、hdfs

我们的数据存储在远程Hadoop集群中，但是为了执行某些PoC，我需要在我的机器上本地运行spark应用程序。如何从远程HDFS加载数据？

浏览 12提问于2022-04-22得票数 -3

2回答

在hadoop的映射阶段写入本地文件

hadoop、mapreduce

Hadoop将中间结果写入本地磁盘，将reducer的结果写入HDFS。HDFS是什么意思。它在物理上翻译成什么？

浏览 1提问于2012-09-14得票数 0

回答已采纳

1回答

我应该使用多少个火花节点来使用Mesos或Yarn？

apache-spark、hadoop-yarn、mesos

目前，我运行的集群包含4个火花节点和1个solr节点。我希望快速地将集群扩展到20个节点，然后再扩展到大约100个节点。我只是不确定在多大的集群大小下使用Mesos或Yarn是有意义的？当我的节点少于100个时，添加Yarn或Mesos是否有意义？谢谢

浏览 3提问于2016-04-01得票数 0

回答已采纳

3回答

Apache火花多节点聚类

apache-spark、apache-spark-sql、spark-streaming、hadoop-streaming

我是阿帕奇·斯派克的新手。我尝试过使用apache独立模式。我可以通过在客户机上提交具有部署模式的jar来运行我的代码。但是我不能运行多节点集群。我曾经用过工人节点是不同的机器。$$anon$1.run(DriverRunner.scala:79) 据我所知，驱动程序将数据和应用程序代码发送到worker节点。我不知道我的理解是否正确。因此，请帮助我在</

浏览 3提问于2015-10-20得票数 0

1回答

有没有办法在Hadoop中为数据块提供辅助存储或备份？

hadoop、backup、hdfs

我让Hadoop运行在具有非专用节点的集群上(即，它与其他应用程序/用户共享节点)。当其他用户正在使用群集的节点时，不允许在该节点上运行Hadoop作业。因此，在给定时刻可能只有几个节点可用，并且这几个节点并不具有Hadoop作业所需的所有

浏览 0提问于2012-03-16得票数 0

回答已采纳

1回答

HDInsigh Spark如何使用以下代码

apache-spark、pyspark、azure-hdinsight

我是Spark和HDInsight的新手。我想知道下面的代码是如何工作的？我的意思是如何在集群节点之间调度作业。假设我有2个头节点和4个工作节点，哪些代码将在头节点上运行，哪些代码将在工作节点上运行？我如何让Spark知道我想要在工作节点上执行一些代码？// the code is fro

浏览 30提问于2019-09-24得票数 0

1回答

Hadoop-3.0.0与老版本的Hive、Pig、Sqoop和Spark的兼容性如何

hadoop、apache-spark、hive、apache-pig、sqoop

我们目前在10节点群集上使用hadoop-2.8.0，并计划升级到最新的hadoop-3.0.0。我想知道如果我们将hadoop-3.0.0与旧版本的Spark和其他组件如Hive、Pig和Sqoop一起使用会不会有任何问题。

浏览 16提问于2017-12-21得票数 1

3回答

独立经理诉。纱线Vs。梅索斯

hadoop、apache-spark、hadoop-yarn、mesos

在3个节点上，哪个调度器(Manager)能有效地工作？目前，我使用的是独立管理器，但对于每个火花作业，我必须明确指定所有资源参数(例如:内核、内存等)，这是我想要避免的。我也尝试过Yarn，但是它的运行速度比独立管理器慢10倍。集群详细信息：Spark1.2.1和Hadoop2.7.1

浏览 4提问于2015-08-04得票数 21

回答已采纳

1回答

运行在单个节点上的Apache和Mesos

apache-spark、hdfs、mesos

我对在Mesos上测试火花运行感兴趣。我在Virtualbox中创建了Hadoop2.6.0单节点集群，并在其上安装了Spark。我可以成功地在HDFS中使用Spark处理文件。然后，我在同一个节点上安装了Mesos主和从服务器。我尝试使用将Spark作为一个框架在Mesos中运行。我在Spark</e

浏览 4提问于2016-04-12得票数 0

1回答

为什么HDInsight上的Python失败了，没有一个模块名为numpy？

python、azure、apache-spark、azure-hdinsight

我使用HDInsight脚本操作创建了一个带有的集群，如中所述您可以使用HDInsight上的Script 集群定制在Hadoop中的任何类型的集群上安装Spark。脚本操作只允许在创建群集时运行脚本来自定义群集。有关更多信息，请参见。我运行了一个基本的Python (word计数示例)脚本，但是当我启动一个使用NumPy<

浏览 0提问于2014-12-23得票数 1

1回答

如何在不查询每个节点的情况下使用PySpark对Elasticsearch运行查询？

python、apache-spark、elasticsearch、pyspark、elasticsearch-hadoop

我的最终目标是使用PySpark在Elasticsearch (ES)中高效地索引大量数据，然后对索引运行大量查询，并记录结果的统计信息。我尝试在ES查询中表达限制，但显然Spark忽略了这一点，所以我用数据框过滤器来表达它。即使我将查询更改为专门按单个文档ID进行搜索，它也会通过主节点对每个单独的分片运行查询，方法是在每次调用时指定一个特定的分

浏览 20提问于2019-02-13得票数 0

2回答

火花独立模式不将作业分配给其他员工节点

apache-spark

我正在运行一个独立模式的火花作业。我已将我的工作节点配置为连接到主节点。他们正在成功地连接起来，但是当我在火花公子上运行作业时，任务并没有被分发。我一直在收到以下信息- 我尝试在worker节点上以本地<

浏览 2提问于2016-03-21得票数 0

1回答

如何管理Hadoop集群

hadoop

我已经运行了4个节点hadoop集群，并且我询问了任何远程管理该集群的方法。从我的膝上型计算机管理群集有办法远程这么做吗？

浏览 0提问于2013-01-06得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Apache &火花流: Twitter示例只在本地工作

从ECS码头集装箱运行EMR作业

如何使PySpark在集群上工作

与星火历史服务器正在运行的群集通信

hadoop集群中的边缘节点

Google Dataproc集群属性

如何将数据加载到来自远程HDFS的spark中？

在hadoop的映射阶段写入本地文件

我应该使用多少个火花节点来使用Mesos或Yarn？

Apache火花多节点聚类

有没有办法在Hadoop中为数据块提供辅助存储或备份？

HDInsigh Spark如何使用以下代码

Hadoop-3.0.0与老版本的Hive、Pig、Sqoop和Spark的兼容性如何

独立经理诉。纱线Vs。梅索斯

运行在单个节点上的Apache和Mesos

为什么HDInsight上的Python失败了，没有一个模块名为numpy？

如何在不查询每个节点的情况下使用PySpark对Elasticsearch运行查询？

火花独立模式不将作业分配给其他员工节点

如何管理Hadoop集群

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐