开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

如何在Spark executor崩溃后重新启动它(在YARN客户端模式下)？

在Spark中，当一个executor崩溃后，可以通过以下步骤重新启动它（在YARN客户端模式下）：

确保YARN ResourceManager和NodeManager正常运行，并且Spark集群已经正确配置和启动。
在Spark应用程序中，可以通过设置spark.yarn.executor.failuresValidityInterval参数来定义executor故障的有效时间间隔。默认情况下，该参数设置为1小时。
当executor崩溃后，YARN会自动检测到executor的失败，并将其标记为失败状态。
在YARN客户端模式下，可以通过以下步骤重新启动executor：

a. 在Spark应用程序中，使用SparkContext对象的getOrCreate()方法获取一个已经存在的SparkContext对象。

b. 使用SparkContext对象的getLocalProperty("spark.executor.id")方法获取当前executor的ID。

c. 使用SparkContext对象的cancelJobGroup()方法取消当前executor所属的作业组。

d. 使用SparkContext对象的cancelAllJobs()方法取消所有作业。

e. 使用SparkContext对象的stop()方法停止SparkContext。

f. 重新启动Spark应用程序。

在重新启动的Spark应用程序中，YARN会重新分配一个新的executor，并将其加入到Spark集群中。

需要注意的是，以上步骤仅适用于YARN客户端模式下的executor崩溃重新启动。在其他模式下，如YARN集群模式或本地模式，可能需要采用不同的方法来重新启动executor。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

Zzreal的大数据笔记-SparkDay03

on YARN模式根据Driver在集群中的位置分为两种模式：一种是YARN-Client模式，另一种是YARN-Cluster模式 Yarn-Client模式中，Driver在客户端本地运行，这种模式可以使得...Spark Application和客户端进行交互，因为Driver在客户端，所以可以通过webUI访问Driver的状态，默认是http://hadoop1:4040访问，而YARN通过http://...，然后为它向ResourceManager申请资源，并启动Executor来运行Task，同时监控它的整个运行过程，直到运行完成 YARN-cluster的工作流程分为以下几个步骤 Spark Yarn...YARN-Cluster模式下，Driver运行在AM(Application Master)中，它负责向YARN申请资源，并监督作业的运行状况。...当用户提交了作业之后，就可以关掉Client，作业会继续在YARN上运行，因而YARN-Cluster模式不适合运行交互类型的作业 YARN-Client模式下，Application Master仅仅向

5869 0

Spark系列 - (4) Spark任务调度

如果有Executor节点发生了故障或崩溃， Spark应用也可以继续执行，会将出错节点上的任务调度到其他 Executor节点上继续运行。...下图描述了Spark-On-Yarn 模式下在任务调度期间， ApplicationMaster、Driver以及Executor内部模块的交互过程： Driver初始化SparkContext过程中...4.2 YARN Yarn虽然不属于Spark的组件，但是现在Spark程序基本都是依赖Yarn来调度，因此专门介绍下YARN。...Manager注册自己 AM从RM申请容器资源 AM通知 Node Manager 启动容器应用程序代码在容器中执行 客户端联系RM/AM以监控应用程序的状态 Job完成后，AM向RM取消注册 4.3...Spark程序运行流程在实际生产环境下， Spark集群的部署方式一般为 YARN-Cluster模式，之后的内核分析内容中我们默认集群的部署方式为YARN-Cluster模式。

5061 0

Spark 在Yarn上运行Spark应用程序

1.1 Cluster部署模式在 Cluster 模式下，Spark Driver 在集群主机上的 ApplicationMaster 上运行，它负责向 YARN 申请资源，并监督作业的运行状况。...1.2 Client部署模式在 Client 模式下，Spark Driver 在提交作业的主机上运行。ApplicationMaster 仅负责从 YARN 中请求 Executor 容器。...在容器启动后，Client 与容器通信以调度工作。 ?...在YARN上运行Spark Shell应用程序要在 YARN 上运行 spark-shell 或 pyspark 客户端，请在启动应用程序时使用 --master yarn --deploy-mode...在 Cluster 模式下终止 spark-submit 进程不会像在 Client 模式下那样终止 Spark 应用程序。

1.8K1 0

Pyspark学习笔记（二）--- spark部署及spark-submit命令简介

下面简述一下在不同部署模式下，提交任务的命令；参考资料：Submitting Applications - Spark 3.3.0 Documentation 1.1 本地模式该模式...一个是集群模式(cluster), 一个是客户端模式(client). 1.4 基于Kubernetes(即k8s)部署可以看到，这几种部署模式提交作业的方式都是有固定格式的，可谓大同小异，下面将介绍一下提交任务的命令及参数...它应该有和conf/spark-defaults.conf文件相同的属性设置，也是可读的。 queue 指定资源队列的名称,t (YARN-only) version 打印Spark版本。...(Spark standalone and YARN only)，在yarn模式中默认值为1 关于这几个专业术语的含义官方也有解释： Cluster Mode Overview - Spark 3.3.0...如果有 Executor 节点发生了故障或崩溃，Spark 应用也可以继续执行，会将出错节点上的任务调度到其他 Executor 节点上继续运行。

1.5K1 0

在Hadoop YARN群集之上安装，配置和运行Spark

了解客户端和群集模式 Spark作业可以在YARN上以两种模式运行：集群模式和客户端模式。了解两种模式之间的差异对于选择适当的内存分配配置以及按预期提交作业非常重要。...在此模式下，Spark驱动程序封装在YARN Application Master中。 客户端模式Spark驱动程序在客户端上运行，例如您的笔记本电脑。如果客户端关闭，则作业失败。...在群集模式配置Spark驱动程序内存分配在群集模式下，Spark驱动程序在YARN Application Master中运行。...注意从命令行给出的值将覆盖已设置的值spark-defaults.conf。在客户端模式配置Spark应用程序主内存分配在客户端模式下，Spark驱动程序不会在群集上运行，因此上述配置将不起作用。...它默认为基本内存的7％，最小值为384MB 注意：确保Executor请求的内存（包括开销内存）低于YARN容器的最大大小，否则Spark应用程序将不会初始化。

3.6K3 1

Spark on Yarn | Spark，从入门到精通

Spark 集群考虑到了未来对接一些更强大的资源管理系统（如 Yarn、Mesos 等）没有在资源管理的设计上对外封闭，所以Spark 架构设计时将资源管理抽象出了一层，通过这种抽象能够构建一种插件式的资源管理模块...； Standalone 模式：Spark 真正的集群模式，在这个模式下 Master 和 Worker 是独立的进程；第三方部署模式：构建于 Yarn 或 Mesos 之上，由它们提供资源管理。...不同于上述的 Spark on Yarn-Cluster，Spark on Yarn-Client 的客户端在提交完任务之后不会将 Spark Driver 托管给 Yarn，而是在客户端运行。...集群资源紧张时可能有一个 Executor 申请的资源在当时处于闲置状态，如果处于粗粒度模式下，这些资源在当时就浪费了。...但是在细粒度模式下，Executor 执行时所需的资源是按照它的需求分配的，这样就不存在资源闲置的情况了。

8440 0

spark入门之集群角色

Master和Worker集群资源管理 image.png Master和Worker是Spark的守护进程、集群资源管理者，即Spark在特定模式下正常运行所必须的进程。...作用： Master和Worker：只有Standalone模式中才有。 Driver和Executor：Standalone模式和YARN模式都有。...在提交程序的服务器上创建一个SparkSubmit进程,在SparkSubmit进程中也会有一个客户端Client，此时在客户端中并不会启动Driver。...yarn-cluster模式 image.png yarn-client模式与 yarn-cluster模式唯一的区别在于Dirver的运行位置不同。...在yarn-cluster模式中，Dirver将会运行在ApplicationMaster运行的服务器上。程序启动时会创建一个SparkContext进程，该进程同样维护一个Client端。

5802 0

Apache Kyuubi & Celeborn (Incubating) 助力 Spark 拥抱云原生

相比于 Spark on YARN，Spark on K8s 在很多方面有显著的优势；同时作为较新的技术，在某些特性方面还不如 Spark on YARN 完备。...客户端接入后，Kyuubi Server 会根据路由规则寻找合适的 Engine，若没有命中，则会调用 spark-submit 拉起一个新的 Spark Application，当 Spark Application...，如 YARN、Mesos、Standalone。...显然，延迟退出会造成一定的资源浪费，并且不能处理 Executor OOM 的情况，decommission 作为一个补充手段，当 Executor 闲置一段时间后，退出前将 shuffle 数据搬运到还未超时的...Kyuubi 集群部署在 K8s 集群外的物理机节点上3. Spark 作业以 Client 模式运行4.

7914 0

Spark on Yarn | Spark，从入门到精通

Spark 集群考虑到了未来对接一些更强大的资源管理系统（如 Yarn、Mesos 等）没有在资源管理的设计上对外封闭，所以Spark 架构设计时将资源管理抽象出了一层，通过这种抽象能够构建一种插件式的资源管理模块...； Standalone 模式：Spark 真正的集群模式，在这个模式下 Master 和 Worker 是独立的进程；第三方部署模式：构建于 Yarn 或 Mesos 之上，由它们提供资源管理。...不同于上述的 Spark on Yarn-Cluster，Spark on Yarn-Client 的客户端在提交完任务之后不会将 Spark Driver 托管给 Yarn，而是在客户端运行。...集群资源紧张时可能有一个 Executor 申请的资源在当时处于闲置状态，如果处于粗粒度模式下，这些资源在当时就浪费了。...但是在细粒度模式下，Executor 执行时所需的资源是按照它的需求分配的，这样就不存在资源闲置的情况了。

9031 0

2020年最新Spark企业级面试题【上】

Mesos：一个强大的分布式资源管理框架，它允许多种不同的框架部署在其上，包括 yarn； Hadoop YARN：统一的资源管理机制，在上面可以运行多套计算框架，如 mapreduce、 storm...既然spark是支持yarn调度的那你的调度流程是什么样的那？yarn这边是有两个模式分别为 yarn Clint 和yarn Cluster模式，那我这边分别讲下吧。...在YARN Cluster模式下，任务提交后会和ResourceManager通讯申请启动ApplicationMaster，随后ResourceManager分配container，在合适的NodeManager...yarn-cluster是用于生产环境，这种模式下客户端client在提交了任务以后，任务就托管给yarn了，这个时候client就可以断开连接不需要再管后续事情了，这种情况下无法直接查看到application...运行的日志，查看日志较为麻烦；而yarn-client则是主要用于测试时使用，这种模式下客户端client提交任务后，不能直接断开连接，客户端可以看到application运行的实时日志，非常方便开发调试

4552 0

大数据基础：Spark工作原理及基础概念

集群模式独立模式，在spark自己的资源调度管理框架上运行，该框架采用master/salve结构 yarn 集群模式在yarn资源管理器框架上运行，由yarn负责资源管理，spark负责任务调度和计算...worker 节点在spark master作用下创建并启用executor，executor是真正的计算单元。...在yarn 模式下运行worker节点一般指的是NodeManager节点，standalone模式下运行一般指的是slave节点。...4. spark程序在yarn上执行流程 spark on yarn分为两种模式yarn-client模式，和yarn—cluster模式，一般线上采用的是yarn-cluster模式。...（1）yarn-client模式 driver在客户端本地执行，这种模式可以使得spark application和客户端进行交互，因为driver在客户端可以通过webUI访问driver的状态。

1.4K4 0

Spark内核详解 (4) | Spark 部署模式

根据 Driver 在集群中的位置不同，分为 yarn client 和 yarn cluster； Apache Mesos：一个强大的分布式资源管理框架，它允许多种不同的框架部署在其上，包括 Yarn...由于在实际生产环境下使用的绝大多数的集群管理器是 Hadoop YARN，因此我们关注的重点是 Hadoop YARN 模式下的 Spark 集群部署。一...., use yarn.Client as a wrapper around the user class if (isYarnCluster) { // 在 yarn 集群模式下, 使用 yarn.Client...* * 它的存在使得在使用诸如ps或jps之类的工具时，很容易区分客户机模式AM和集群模式AM。...Standalone Cluster 模式 image.png 在Standalone Cluster模式下，任务提交后，Master会找到一个 Worker 启动Driver。

1.6K3 0

【Spark】Spark之what

(1) 在Standalone模式中指的就是通过Slave文件配置的Worker节点 (2) 在Spark on Yarn模式中指的就是NodeManager节点 (3) 在Spark on Mesos...它基于Spark自己的Master-Worker集群。 (2) 第二种是基于YARN的yarn-cluster模式。...(3) 第三种是基于YARN的yarn-client模式。用于测试，Driver运行在本地客户端，负责调度Application，本地可以看到所有的log。...分配Task给Executor执行，Executor运行Task并向Driver汇报运行的状态和进度，以让Client随时掌握各个任务的运行状态，从而可以在任务失败时重新启动任务； (6) 应用程序运行完成后...，从而可以在任务失败时重新启动任务； (6) 应用程序运行完成后，ApplicationMaster向ResourceManager申请注销并关闭自己。

8482 0

提高Spark姿势水平 No.73

Mesos最初是由加州大学伯克利分校的AMPLab开发的，后在Twitter得到广泛使用。 Spark on mesos，是指跑在mesos平台上。...粗粒度模式下，Spark任务在指定资源的时候，所分配的资源将会被锁定，其他应用无法share。...在细粒度模式下，Spark启动时Secheduler只会分配给当前需要的资源，类似云的想法，不会对资源进行锁定。 Spark on standalone，是指跑在 Spark 集群上。...无论是yarn-client还是yarn-cluster，都是在yarn平台的管理下完成，而Spark on yarn目前只支持粗粒度方式(Hadoop2.6.0)，所以在任务多，资源需求大的情况下，可能需要扩大...数据在 Shuffle 的时候中间数据量过大或者数据产生了倾斜，导致部分目标机器崩溃。通过分析崩溃的时候的任务，改善数据 Shuffle 时的数据分布情况。

8036 0

提高Spark姿势水平 No.73

Mesos最初是由加州大学伯克利分校的AMPLab开发的，后在Twitter得到广泛使用。Spark on mesos，是指跑在mesos平台上。...粗粒度模式下，Spark任务在指定资源的时候，所分配的资源将会被锁定，其他应用无法share。...在细粒度模式下，Spark启动时Secheduler只会分配给当前需要的资源，类似云的想法，不会对资源进行锁定。Spark on standalone，是指跑在 Spark 集群上。...将Spark任务提交到yarn上同样有两个模式，一种是yarn-client，一种是yarn-cluster。...无论是yarn-client还是yarn-cluster，都是在yarn平台的管理下完成，而Spark on yarn目前只支持粗粒度方式(Hadoop2.6.0)，所以在任务多，资源需求大的情况下，可能需要扩大

9896 0

Spark2.3.0 使用spark-submit部署应用程序

在这种设置中， client 模式比较合适。在 client 模式中，驱动程序作为集群的客户端直接在 spark-submit 进程内启动。应用程序的输入和输出直接连到控制台。...\ 100 # 以客户端部署模式在Spark独立集群上运行 ....7077 \ --executor-memory 20G \ --total-executor-cores 100 \ /path/to/examples.jar \ 1000 # 在集群部署模式下使用...# 在集群部署模式下使用supervise在Mesos集群上运行 ....yarn 以客户端模式还是以集群模式连接到YARN群集具体取决于 --deploy-mode 的值。可以根据HADOOP_CONF_DIR或YARN_CONF_DIR变量找到集群位置 6.

2.9K4 0

大数据开发面试之26个Spark高频考点

它支持从多种数据源读取数据，比如 Kafka、Flume、Twitter 和 TCP Socket，并且能够使用算子比如 map、reduce、join 和 window 等来处理数据，处理后的数据可以保存到文件系统...Spark 的有几种部署模式，每种模式特点？ 1）本地模式 Spark 不一定非要跑在 hadoop 集群，可以在本地，起多个线程的方式来指定。...19、Spark on Yarn 模式有哪些优点？...Application 部署简化，例如 Spark，Storm 等多种框架的应用由客户端提交后，由 Yarn 负责资源的管理和调度，利用 Container 作为资源隔离的单位，以它为单位去使用内存,cpu...极大的减少磁盘 I/o,通常情况下能够减少 75%的存储空间，由此可以极大的减少 spark sql 处理数据的时候的数据输入内容，尤其是在 spark1.6x 中有个下推过滤器在一些情况下可以极大的减少磁盘的

8633 0

Spark核心技术原理透视二（Spark运行模式）

上一章节详细讲了Spark的运行原理，没有关注的童鞋可以关注加米谷大数据查看上一章节的详细内容。通过Spark运行原理的讲解大家了解了Spark在底层的运行，那Spark的运行模式又是什么样的呢？...1、Spark运行模式主要分为以下几种，如图所示。 2、Spark on Standalone 模式 Standalone模式如下图所示。...4、Spark on Yarn-Client 模式 1）Yarn-Client 第一步：Spark Yarn Client向Yarn的ResourceManager申请启动Application Master...同时在SparkContent初始化中将创建DAGScheduler和TASKScheduler； 2）Yarn-Client 第二步：ResourceManager收到请求后，在集群中选择一个NodeManager...的命令、需要在Executor中运行的程序等； 2）Yarn-Cluster 第二步：ResourceManager收到请求后，在集群中选择一个NodeManager，为该应用程序分配第一个Container

1.5K7 0

【推荐】Spark知识点

Spark把运算过程中间的数据（如：shuffle阶段产生的数据存放在内存，这样迭代计算效率会更高）；在计算时，为了节省内存，不把所有的数据一次全部加载到内存中，有一种设计模式叫迭代器模式。...数目相同的 executor Yarn 通常，生产环境中，我们是把Spark程序在YARN中执行。...所以在该模式下如果结束了该进程，整个Spark任务也不会退出，因为Driver是在远程运行的；如果是Client模式，Driver就运行在提交spark程序的地方，Spark Driver是需要不断与任务运行的...在本地环境测试的时候经常使用； Spark on Yarn作业提交流程 YARN Client模式在YARN Client模式下，Driver在任务提交的本地机器上运行，Driver启动后会和ResourceManager...YARN Cluster模式在YARN Cluster模式下，任务提交后会和ResourceManager通讯申请启动ApplicationMaster，随后ResourceManager分配container

3421 0

提高Spark姿势水平 No.73

Mesos最初是由加州大学伯克利分校的AMPLab开发的，后在Twitter得到广泛使用。Spark on mesos，是指跑在mesos平台上。...粗粒度模式下，Spark任务在指定资源的时候，所分配的资源将会被锁定，其他应用无法share。...在细粒度模式下，Spark启动时Secheduler只会分配给当前需要的资源，类似云的想法，不会对资源进行锁定。Spark on standalone，是指跑在 Spark 集群上。...将Spark任务提交到yarn上同样有两个模式，一种是yarn-client，一种是yarn-cluster。...无论是yarn-client还是yarn-cluster，都是在yarn平台的管理下完成，而Spark on yarn目前只支持粗粒度方式(Hadoop2.6.0)，所以在任务多，资源需求大的情况下，可能需要扩大

7626 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭