Spark在yarn杀死执行器后不断重新启动执行器

Spark是一个开源的大数据处理框架，主要用于在分布式环境中进行数据处理和分析。它提供了高效的数据处理能力和易用的编程接口，可以处理各种类型的数据，包括结构化数据、半结构化数据和非结构化数据。

在Spark中，执行器是负责在集群中运行任务的组件。当yarn杀死一个执行器后，Spark会不断地尝试重新启动该执行器，以保证任务的顺利执行。这是因为在分布式环境中，执行器可能会因为各种原因（如机器故障、网络问题等）被终止，为了保证任务的高可靠性和容错性，Spark会自动重新启动执行器。

Spark在yarn杀死执行器后不断重新启动执行器的优势有：

高可靠性：通过自动重新启动执行器，Spark可以在执行器被终止后快速恢复任务的执行，确保任务能够顺利完成。
容错性：Spark能够检测到执行器的终止，并及时做出相应的处理，保证任务的连续性和一致性。
提高资源利用率：由于执行器可能会被杀死或终止，Spark不断重新启动执行器可以有效利用闲置的资源，提高集群的资源利用率。

Spark的应用场景非常广泛，包括但不限于：

大数据处理和分析：Spark提供了丰富的API和工具，可以处理大规模的数据集，进行复杂的数据处理和分析任务，如数据清洗、数据聚合、机器学习等。
实时流处理：Spark支持流式数据处理，可以实时处理大量的数据流，适用于实时监控、实时推荐、实时分析等场景。
图计算：Spark提供了图计算库GraphX，可以进行复杂的图计算，适用于社交网络分析、网络拓扑分析等场景。

腾讯云提供了一系列与Spark相关的产品和服务，包括：

腾讯云EMR：基于开源的大数据平台，支持Spark等多种计算引擎，提供强大的大数据处理和分析能力。产品介绍链接：https://cloud.tencent.com/product/emr

通过腾讯云EMR，您可以轻松搭建和管理Spark集群，实现高效的大数据处理和分析。

Spark在yarn杀死执行器后不断重新启动执行器

、

spark作业在较低优先级队列中运行。当更高优先级的任务到来时，它的容器就会被抢占。然而，它在被杀死后立即重新启动容器。优先级更高的应用程序会再次杀死它们。因此，应用程序陷入了这种僵局。here讨论了执行器的无限重试。在日志中找到下面的痕迹。是否有一个标志来指示应该对executor中的所有失败进行计数，并且在发生maxFailures时作业应该失败？ spark版本2.11

浏览 131提问于2019-05-21得票数 4

1回答

为什么要增加spark.yarn.executor.memoryOverhead？

、

我试图加入两个大的星星之火数据格式，并不断地遇到这个错误： Container killed by YARN for exceeding memory limits. 24 GB of 22 GB physicalConsider boosting spark.yarn.executor.memoryOverhead.在星火用户中，这似乎是一个常见的问题，但我似乎找不到任何关于spark.yarn.executor.memoryOverheard是什么的确切描述。<em

浏览 0提问于2018-04-23得票数 16

回答已采纳

2回答

如何避免Spark executor由于内存限制而丢失和纱线容器杀死它？

、、、、

我的任务是创建一些表，并在对所有配置单元表分区进行处理后将值插入其中。现在，我们不能在执行器中执行hiveContext，所以我必须在驱动程序中的for循环中执行它，并且应该一个接一个地串行运行。当我在纱线集群中提交这个Spark作业时，几乎所有的时间我的执行器都会因为混洗找不到异常而丢失。现在发生这种情况是因为YARN因为内存过载而杀死了我的executor。我不明白为什么，因为我为每个hive分区设置了一个非常小的数据集，但它仍然会导致YARN<

浏览 0提问于2015-08-06得票数 18

回答已采纳

2回答

Spark streaming作业不删除随机播放文件

、、

我有一个火花流作业，在电子病历上运行，从卡夫卡读取消息，并输出到S3。我使用emr-5.17.0，即hadoop 2.8.4、spark 2.3.1并且在磁盘空间耗尽之前永远不会被删除这些文件如下所示: shuffle_328_127_0.index、shuffle_328_134_0.da

浏览 0提问于2018-10-22得票数 3

3回答

如何防止Spark Executor在使用YARN客户端模式时丢失？

、

我有一个Spark作业，它在本地运行良好，但数据较少，但当我在YARN上调度它执行时，我不断收到以下错误，慢慢地所有执行器都从UI中删除，我的作业失败我使用以下命令在yarn客

浏览 0提问于2015-07-30得票数 52

回答已采纳

2回答

Spark作业只是挂起了大量数据

、、、、

但当我查询总天数为15天时，作业挂起这项工作在以下情况下运行良好： var df = sqlSession.createDataFrame(sc.emptyRDD[Row], schema更新:在将mapreduce.input.fileinputformat.split.minsize设置为256 GB后，它现在可以正常工作。

浏览 2提问于2017-12-07得票数 8

2回答

齐柏林飞艇在纱线上应用火花的杀灭

、、

有没有推荐的方法在Zeppelin内部的纱线上应用kill spark (使用scala)？在我使用的spark shell中它干净地退出外壳，终止纱线上的应用程序，并释放我正在使用的内核。我发现我可以使用这确实成功地终止了yarn上的应用程序，但它也抛出了一个错误，如果我想要启动一个新会话，则需要重新启动解释器。如果我正在使用同一个解释器的单独实例运行另一个笔记本，那么sys.exit不是理想的选择，因为在完成第二个笔记本中的工作之前，我

浏览 8提问于2016-09-19得票数 0

1回答

因超过内存限制而被纱线杀死的容器.使用14.8 GB的6GB物理内存

我有一份火花工作，在这里我做以下工作我无法理解为什么错误说使用了14.8 GB的6GB物理内存?我尝试增加spark.yarn.executor.memoryOverhead，我使用了以下命令火花提交-主纱-部署模式集群-num-

浏览 2提问于2019-02-15得票数 0

2回答

在具有HA功能的Hadoop Yarn集群上部署Apache Spark

、、

现在一切运行正常，我已经在NN1和NN2上使用zookeeper测试了故障转移场景，并且运行良好。我有三个节点集群(NN1、NN2、DN1)，下面的守护进程当前在每个服务器上运行， Nodes running in Master NameNode

浏览 1提问于2016-03-23得票数 0

1回答

火花中对执行者和任务的内存分配

、、、

- 2GBmapreduce.reduce.memory.mb - 4Gbspark.yarn.driver.memoryOverhead384现在我试着运行火花壳，将值设置为主纱线，并为执行器内存、num-执行器、执行器芯设置不同值。存储内存，如火花外壳启动日志或每个执行器

浏览 1提问于2017-09-15得票数 4

3回答

纱-为什么任务不走出堆空间，但是容器会被杀死？

、、

-Xms40960m -Xmx40960m -XX:MaxPermSize=128m -Dspark.sql.shuffle.partitions=20 -Djava.io.tmpdir=/data/yarnadmin/appcache/application_1423215865404_0002/container_1423215865404_0002_01_000007/tmp org.apache.spark.executor.CoarseGrainedExecutorBackendXms40

浏览 2提问于2015-02-09得票数 4

回答已采纳

4回答

在Amazon EMR上未完全分配的星火资源

、、

当我以纱线-集群模式发送任务时，我会得到以下结果之一：星火驱动程序运行在所有可用内存的集群主上，外加2个执行器，每个执行器为9404 as(按安装有时，当我用一个执行器获得“成功”执行时，克隆和重新启动该步骤将以0执行器结束。,Args=[/home/hadoop/

浏览 7提问于2015-06-08得票数 21

回答已采纳

1回答

如何从长期运行的PySpark框架中释放看似不活跃的执行器？

、

一开始，我在许多不同的主机上分配了1,000个内核。每个任务都需要一个核心。然后，当这些任务完成时，主机将保留一个核心，并且没有活动任务。由于有大量的主机，可能发生的情况是，越来越多的核心被分配给没有任何活动任务的执行器。因此，我可以分配1000个核心，但只能分配100个活动任务。其他900个核心被分配给没有活动任务的执行器。有没有办法关闭不做任何事情的执行器？我目前使用的是PySpark 1.2，所以该版本的功能会很棒，但如果能听到新版本中的解决方案(或更好的解决方案)，我会很高兴。谢谢!

浏览 0提问于2017-03-25得票数 0

1回答

为什么在增加memoryOverhead后收集大型数据集成功

、

简介我

浏览 1提问于2018-11-27得票数 2

回答已采纳

1回答

在集群上部署特定的SPARK版本

、、、、

在我当前的项目中，我尝试在集群上部署SPARK的2.2版本，其中2.1版本是可用的。我在SPARK文档中查看了在集群上部署特定依赖项的方法，这导致我使用了以下spark-submit： spark-submit --master yarn --class MainMethodSparkApp--conf spark.driver.extraClassPath=localPath-to-jar-with-epe

浏览 20提问于2020-11-12得票数 1

0回答

在hadoop群集中运行spark时，无法通过yarn获得更快的结果

、、、

应用Spark1.4 ()中的LSH算法，我处理了一个LIBSVM格式()的文本文件(4 4GB)，以查找重复项。首先，我在一个服务器上运行了我的scala脚本，它只使用了一个具有36个核心的执行器。我在1.5小时内检索到了我的结果。因此，我提交了如

浏览 15提问于2016-12-20得票数 0

1回答

saveAsTextFile的最后阶段是非常慢的

、、、

我正在使用Mahout0.11.0 on Spark1.5.1，在cli的HDP 2.2集群上使用纱线客户端模式。我的输入大约是325 My，分成1000个部分文件。10g -D:spark.yarn.executor.memoryOverhead=1024 -D:spark.executor.cores=5 -D:spark.executor.instances=50 -D:spark.yarn.am.memory=4g -D:spark</

浏览 3提问于2015-11-05得票数 1

回答已采纳

1回答

Apache Spark的分区

、、

我有一个由1个主节点和10个工作节点组成的集群。当我将分区数设置为3时，我想知道主节点是只使用3个工作节点，还是使用所有工作节点？因为它显示了它们都被使用了。

浏览 4提问于2017-09-26得票数 0

1回答

Spark streaming JavaCustomReceiver

、、

Spark streaming java自定义接收器在EMR客户端模式和集群模式下的yarn中出现问题。我的问题是: 1.我们可以不在我们选择的特定执行器<

浏览 11提问于2017-01-23得票数 5

2回答

Spark thrift服务器仅使用2个内核

、、

/lib/spark/conf/spark-defaults.conf export SPARK_WORKER_INSTANCES=6在启动之前-thriftserver.shspa

浏览 12提问于2018-08-21得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Spark在yarn杀死执行器后不断重新启动执行器

相关·内容

Spark在yarn杀死执行器后不断重新启动执行器

为什么要增加spark.yarn.executor.memoryOverhead？

如何避免Spark executor由于内存限制而丢失和纱线容器杀死它？

Spark streaming作业不删除随机播放文件

如何防止Spark Executor在使用YARN客户端模式时丢失？

Spark作业只是挂起了大量数据

齐柏林飞艇在纱线上应用火花的杀灭

因超过内存限制而被纱线杀死的容器.使用14.8 GB的6GB物理内存

在具有HA功能的Hadoop Yarn集群上部署Apache Spark

火花中对执行者和任务的内存分配

纱-为什么任务不走出堆空间，但是容器会被杀死？

在Amazon EMR上未完全分配的星火资源

如何从长期运行的PySpark框架中释放看似不活跃的执行器？

为什么在增加memoryOverhead后收集大型数据集成功

在集群上部署特定的SPARK版本

在hadoop群集中运行spark时，无法通过yarn获得更快的结果

saveAsTextFile的最后阶段是非常慢的

Apache Spark的分区

Spark streaming JavaCustomReceiver

Spark thrift服务器仅使用2个内核

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐