首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Spark专题系列(三):Spark运行模式

( 利用Spark自身的资源调度方式 ) Yarn/Mesos 模式 运行在资源管理器上 , 比如Yarn或者Mesos Spark on Yarn 有两种模式  Yarn-client 模式  Yarn-cluster...yarn 负责资源管理, Spark 负责任务调度和计算 3.1、spark yarn-client模式 适用于交互和调试 , 客户端能看到application的输出,如下图: 3.2、spark yarn-cluster...一般我们在线上生产环境中,大部分采用的是YARN-cluster模式(除非你大数据框架没有使用Hadoop,那么可以考虑使用mesos) 三:yarn-client & yarn-cluster的区分...yarn-client & yarn-cluster的区分 广义区分: yarn-client : 适用于交互和调试 , 客户端能看到application的输出 yarn-cluster : 通常用于生产环境...深层次区分: 1 : yarn-cluster和yarn-client模式的区别其实就是Application Master进程的区别 2 : yarn-cluster模式下, driver运行在AM

46920
您找到你想要的搜索结果了吗?
是的
没有找到

数据分析工具篇——spark on yarn模式

spark on yarn架构有两种模式,分为Yarn-client模式和Yarn-cluster模式,本文与大家一起了解一下这两种模式: Yarn-client模式 ? ? ?...ResourceManager收到请求后,在集群中选择一个NodeManager,为该应用程序分配第一个Container,要求它在这个Container中启动应用程序的ApplicationMaster,与YARN-Cluster...汇报运行的状态和进度,以让Client随时掌握各个任务的运行状态,从而可以在任务失败时重新启动任务; 6)应用程序运行完成后,Client的SparkContext向ResourceManager申请注销并关闭自己; Yarn-cluster...申请注销并关闭自己; 在Spark作业运行过程中,一般情况下会有大量数据在Driver和集群中进行交互,所以如果是基于yarn-client的模式,则会在程序运行过程中产生大量的网络数据传输,造成网卡流量激增;而基于yarn-cluster...这种模式,因为driver本身就在集群内部,所以数据的传输也是在集群内部来完成,那么网络传输压力相对要小;所以在企业生产环境下多使用yarn-cluster这种模式,测试多用yarn-client这种模式

74810

Spark核心技术原理透视二(Spark运行模式)

5、Spark on Yarn-Cluster模式 1)Yarn-Cluster 第一步:Spark Yarn Client向Yarn中提交应用程序,包括ApplicationMaster程序、启动ApplicationMaster...的命令、需要在Executor中运行的程序等; 2)Yarn-Cluster 第二步:ResourceManager收到请求后,在集群中选择一个NodeManager,为该应用程序分配第一个Container...,要求它在这个Container中启动应用程序的ApplicationMaster,其中ApplicationMaster进行SparkContext等的初始化; 3)Yarn-Cluster 第三步...执行,Executor运行Task并向ApplicationMaster汇报运行的状态和进度,以让ApplicationMaster随时掌握各个任务的运行状态,从而可以在任务失败时重新启动任务; 6)Yarn-Cluster...6、几种模式对比(Yarn-Cluster VS Yarn-Client VS Standalone) 官网描述如下图所示,有兴趣的童鞋可以去Apache官网查询。 成都大数据培训机构就找加米谷!

1.4K70

Zzreal的大数据笔记-SparkDay03

SparkContext向Master注销,释放资源 (2)Spark on YARN模式 Spark on YARN模式根据Driver在集群中的位置分为两种模式:一种是YARN-Client模式,另一种是YARN-Cluster...应用程序运行完成后,ApplicationMaster向ResourceManager申请注销并关闭自己 Spark Client 和 Spark Cluster的区别: 理解YARN-Client和YARN-Cluster...从深层次的含义讲YARN-Cluster和YARN-Client模式的区别其实就是Application Master进程的区别。...YARN-Cluster模式下,Driver运行在AM(Application Master)中,它负责向YARN申请资源,并监督作业的运行状况。...当用户提交了作业之后,就可以关掉Client,作业会继续在YARN上运行,因而YARN-Cluster模式不适合运行交互类型的作业 YARN-Client模式下,Application Master仅仅向

56290

Spark内核分析之spark作业的三种提交方式

通过task分配算法提交到executor上面去执行; 6.executor接收到一个task任务之后,将其包装成一个TaskRunner对象并调用线程池中的一条线程去执行task; 第二种,基于yarn-cluster...Yarn-cluster模式 1.Spark提交作业到Yarn集群,向ResourceManager请求启动ApplicationMaster; 2.ResourceManager分配一个Container...Yarn-client模式 关于Yarn-client与Yarn-cluster两种模式的区别与使用场景; 区别:这两种spark作业提交方式的区别在于Driver所处的位置不同。...使用场景:Yarn-client模式主要用于测试环境,因为使用该模式提交作业的时候,可以在客户端实时观察作业运行产生的日志及作业的运行状况;Yarn-cluster模式用于实际生产环境,因为其运行的作业所产生的日志是在远程的节点上

71420
领券