Spark限制每个服务的执行器数量_增加spark实例的执行器数量_手动指定spark执行器的数量 - 腾讯云开发者社区

apache-spark、spark-streaming

我们使用Spark streaming (java)进行实时计算。Deployment有6个节点的spark集群(配置设置用于跨节点的200个执行器)。目前有一个服务在Rabbitmq队列中发布事件。现在我们计划再添加两个服务。在我为每个队列创建spark接收器的情况下，是否可以限制在负载情况下为一个服务提供服务的最大执行器<e

浏览 14提问于2019-10-18得票数 0

1回答

在火花中，spark.executor.pyspark.memory配置选项的含义是什么？

apache-spark、pyspark

文件说明如下：除非另有规定，否则在每个执行器中分配给PySpark的内存量，在MiB中分配。如果设置了，执行器的PySpark内存将被限制在此数量之内。如果没有设置，Spark将不会限制Python的内存使用，这取决于应用程序避免超过与其他非JVM进程共享的开销内存空间。当PySpark在YARN或Kubernetes中运行时，此内存将添加到执行器资源请求中。注意:此特性依赖于

浏览 5提问于2021-07-04得票数 6

回答已采纳

1回答

Apache Spark:限制Spark App使用的执行器数量

apache-spark、pyspark、hadoop-yarn

是否可以在Spark上限制应用程序使用的executors数量？我可以用spark.executor.instances设置执行器的初始数量，但后来在我的应用程序中，似乎Spark会自己添加所有可用的执行器。这使得群集上不能同时运行任何其他作业。谷歌搜索让我知道了解决方案，但spark.cores.max似乎不能限制执行者的总

浏览 1提问于2017-11-07得票数 0

1回答

如何限制每个执行器的并发map任务数？

mapreduce、apache-spark

我的Spark应用程序中的映射操作将RDD[A]作为输入，并使用自定义映射函数func(x:A):B将RDD[A]中的每个元素映射到B类型的另一个对象。由于func()在计算每个输入x时需要大量内存，因此我希望限制每个执行器的并发映射任务的数量，以便同一执行器上的所有任务所需的内存总量不会超过节点上可用

浏览 1提问于2015-01-02得票数 5

1回答

Dataproc对每个作业是否有资源分配限制

google-cloud-dataproc

假设我有一个包含100个工作节点的Dataproc集群，这些节点具有特定的规范。当我向dataproc提交作业时，每个作业是否有使用分配限制例如，作业A运行的节点不能超过所有节点总数的50% 我们有这样的限制吗？或者任何作业都可以分配集群的所有资源

浏览 22提问于2020-06-26得票数 1

回答已采纳

1回答

使用mesos，我可以在火花提交中每个节点启动一个执行器，这是真的吗？

apache-spark、mesos、spark-submit

我想知道在mesos上每个节点只有一个执行器是否是真的？spark.executor.cores将给出执行者的数量。我已经玩了一个星期的火花提交设置，并且我能够在我的集群上得到的执行者的最大数量是5 (1用于驱动程序，4用于实际工作)。这是基于Spark中的Executors选项卡。在Mesos部分的调度程序中，它说在粗粒度模式下，每个Mes

浏览 1提问于2018-01-31得票数 2

回答已采纳

1回答

如何让spark* kafka流中的消费群体，将消费者分配到消费群体中*

java、apache-spark、apache-kafka

我有一个名为topic_1的主题，并创建了4个分区。我需要在Kafka spark stream中并行阅读。所以我需要创建一个消费者组和消费者。你能帮帮我吗?我该怎么做？现在Kafka星火流，一次接受来自Kafka的一个请求。

浏览 0提问于2020-10-15得票数 0

1回答

如果spark.executor.instances和spark.cores.max不工作，如何在Spark独立模式下增加执行器的数量

apache-spark、pyspark

我到处找都找不到我需要的答案。我在独立模式下运行Spark1.5.2，SPARK_WORKER_INSTANCES=1，因为我只想在每个主机上每个worker上运行一个executor。我想要的是为我的工作增加主机数量，从而增加执行器的数量。我尝试更改spark-defaults.conf中的spark.executor.instances和<e

浏览 0提问于2016-05-19得票数 0

1回答

Spark -上限从服务器的CPU核心或内存数量

apache-spark

我使用的是Spark 2.1。这个问题适用于一些Spark从服务器也运行其他应用程序的用例。有没有办法告诉Spark Master服务器只使用从服务器的特定数量的CPU核心或内存？谢谢。

浏览 18提问于2017-06-23得票数 2

1回答

Oozie作业调度导致超时错误

apache-spark、ssh、oozie

我在通过Oozie运行Spark作业时遇到了一个问题，因为有依赖作业，比如第一个作业将触发第二个作业，第二个作业将触发第三个作业，在某些情况下，我会得到超时错误，因为SparkContext没有创建，最终数据无法加载到配置单元我通过oozie-Ssh Action在Oozie中调度了5个相互依赖的作业。如果我的描述没有意义，让我知道我会粘贴错误

浏览 4提问于2016-08-23得票数 0

1回答

Spark:最优使用执行器

apache-spark、pyspark

我正在运行一个有5个执行器的Spark应用程序，每个执行器有5个核心。然而，我注意到只有一个执行器完成了大部分工作(也就是说，大多数任务都是在那里完成的)。我正在运行的作业是高度并行的(20个分区或更多)。你如何解释这种行为？即使我减少了每个执行器的核心数量，也会导致同时在单个执行器上运行更少的任务。我是否应该限制</

浏览 0提问于2016-06-09得票数 0

2回答

使用火花-提交，

multithreading、hadoop、apache-spark、pyspark、cpu-cores

该集群目前由10个奴隶组成，每个核心有4个。怎么才能限制这个号码？更新: 但是，每个工作人员都可以并行地运行多个任务。要限制每个工作人员使

浏览 6提问于2015-05-04得票数 14

1回答

Jenkins全局限制并发运行的作业总数

jenkins

有没有办法全局限制并发运行的作业总数？我知道我可以限制每个作业/节点的并发运行次数，但我需要一种全局设置方法来将其应用于所有作业，而无需通过每个作业并对其进行修改例如:总运行次数: 100这意味着并发运行的作业/构建不能超过100个

浏览 5提问于2021-07-08得票数 0

1回答

为不同的工作节点设置不同的执行器内存限制

apache-spark

我在独立部署模式下使用spark 1.5.2，并使用脚本启动。执行器内存是通过conf/spark-defaults.conf中的'spark.executor.memory‘设置的。这将为所有工作节点设置相同的内存限制。我想让它可以为不同的节点设置不同的限制。我该怎么做呢？谢谢,

浏览 1提问于2016-01-19得票数 3

1回答

Apache Spark执行器数量

apache-spark、apache-spark-sql、spark-dataframe、databricks

我在databricks上有Spark应用程序，在32个节点的集群上运行它，每个节点有16个核心和30 16内存。我想更改一些会话配置，但无论我做什么更改，我都不能创建超过32个的executors (如executors页面spark ui所示)？我已经更改了以下配置：spark.executor.memory 在我阅读时，并发任务的最大

浏览 0提问于2017-10-20得票数 0

1回答

星星之火在细粒度模式下保存资源，即使它是空闲的，并且不执行任何操作。

apache-spark、mesos

spark-shell.sh --conf 'spark.mesos.coarse=false' --executor-memory 20g --driver-memory 5g 我可以在Mesos上看到它不使用任何资源，这是很好的。为什么火花仍然需要一些资源，如果它是空闲的，它不执行任何行动，我如何释放所有的资源，如果它是空闲的？

浏览 1提问于2016-06-02得票数 1

回答已采纳

1回答

spark.cores.max是如何工作的？

apache-spark

我搞不懂spark.cores.max的定义spark.cores.max represents the total number of CPU cores for the wholeapplication它是指每个工作节点的核心总数还是全部8个工作节点中的核心数？如果我将spark.cores.max设置为12，而

浏览 1提问于2020-12-09得票数 3

1回答

为什么在EMR上使用自定义设置来减少火花执行器的数量？

amazon-web-services、apache-spark、emr

我在EMR 4.3.0上运行SMAR1.6，集群模式，设置如下： { "properties": {"spark.executor.cores" : "16" }, "classification": "spark", "properties":

浏览 3提问于2016-04-05得票数 2

回答已采纳

1回答

spark streaming中限制Kafka消费数据

apache-kafka、spark-streaming、kafka-consumer-api

Spark从kafka获取数据。我想通过spark-streaming限制记录消耗。关于卡夫卡的数据非常庞大。我使用spark.streaming.kafka.maxRatePerPartition=1属性来限制spark中的记录。但是仍然在5分钟内，我收到了13400条消息。我的spark程序每5分钟不能处理超过1000条消息。Kafka topic有3个分区。我的spark驱动

浏览 17提问于2018-02-06得票数 0

1回答

星火显示不同数量的核心，而不是使用火花提交传递给它。

apache-spark

TL;DR更多详情：我在独立模式下运行Spark1.6。当我运行火花提交时，我传递给它一个执行器实例，其中一个是执行程序的核心，另一个是驱动程序的核心。我希望发生的是，我的应用程序将运行2个核心总数。当我检查UI上的环境选项卡时，我发现它收到了我给它的正确参数，但是它似乎仍然使用了不同数量</

浏览 3提问于2016-06-13得票数 5

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云