开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Spark scheduler vs Spark Core？

Spark scheduler和Spark Core是Apache Spark中的两个重要组件。

Spark Core:
- 概念：Spark Core是Spark的基础核心组件，提供了Spark的基本功能和API，包括任务调度、内存管理、错误恢复、分布式存储等。
- 分类：Spark Core属于Spark的核心模块，是构建Spark应用程序的基础。
- 优势：Spark Core具有高性能、可扩展性和容错性，能够处理大规模数据处理任务。
- 应用场景：Spark Core广泛应用于大数据处理、数据分析、机器学习等领域。
- 推荐的腾讯云相关产品：腾讯云的Tencent Spark平台提供了Spark Core的支持，可用于大规模数据处理和分析任务。
- 产品介绍链接地址：Tencent Spark

Spark Scheduler:
- 概念：Spark Scheduler是Spark中的调度器，负责将任务分配给集群中的执行器（Executors）进行执行。
- 分类：Spark Scheduler属于Spark的调度模块，用于任务调度和资源管理。
- 优势：Spark Scheduler能够根据任务的特性和资源的可用性，动态地将任务分配给执行器，实现高效的任务调度和资源利用。
- 应用场景：Spark Scheduler在大规模数据处理和分析任务中起到关键作用，能够提高任务执行效率和资源利用率。
- 推荐的腾讯云相关产品：腾讯云的Tencent Spark平台提供了Spark Scheduler的支持，可用于任务调度和资源管理。
- 产品介绍链接地址：Tencent Spark

总结：Spark Core是Spark的基础核心组件，提供了基本功能和API，而Spark Scheduler是Spark的调度器，负责任务调度和资源管理。它们在大数据处理和分析任务中起到关键作用，腾讯云的Tencent Spark平台提供了对它们的支持。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

Spark Streaming 不同Batch任务可以并行计算么？

其实Stage,Task都是Spark Core里就有的概念，Job 在Streaming和Spark Core里的概念则是不一致的。Batch则是Streaming特有的概念。

03

Spark on Yarn资源配置

工作期间，我提交spark任务到yarn上，发现指定的资源（使用内存大小。使用core的个数）总是与yarn的UI页面显示的资源使用量不一致，写本文说明一下这个问题，以及介绍一下spark on yarn的资源配置。

06

Spark的调度系统

一，简介 Spark调度机制可以理解为两个层面的调度。首先，是Spark Application调度。也就是Spark应用程序在集群运行的调度，应用程序包括Driver调度和Executor调度。其次，就是每个Spark Application都会有若干Jobs(Spark Actions)，然后这些job是以何种机制，在Executor上执行的，也是需要一个调度管理的机制，该层面调度也可以理解为SparkContext内部调度。之所以会出现这种情况，主要是生产中可能会希望一个SparkContext作为服

08

spark整合hive+hbase做数据实时插入及实时查询分析

使用的spark是2.0.1，hive是1.2.1，hbase是1.2.4，hadoop是2.6.0，zookeeper是3.4.9

04

Spark异常处理与调优（更新中～）

http://blog.csdn.net/u011239443/article/details/52127689

03

Zookeeper + Hadoop2.6 集群HA + spark1.6完整搭建与所有参数解析

yum install autoconfautomake libtool cmake

02

spark 在yarn执行job时一直抱0.0.0.0:8030错误

近日新写完的spark任务放到yarn上面执行时，在yarn的slave节点中一直看到报错日志:连接不到0.0.0.0:8030 。 1 The logs are as below: 2 2014-08-11 20:10:59,795 INFO [main] org.apache.hadoop.yarn.client.RMProxy: Connecting to ResourceManager at /0.0.0.0:8030 3 2014-08-11 20:11:01,838 INFO [main] or

05

深入理解Spark 2.1 Core （三）：任务调度器的原理与源码分析

上一篇博文《深入理解Spark 2.1 Core （二）：DAG调度器的实现与源码分析》讲到了DAGScheduler.submitMissingTasks中最终调用了taskScheduler.submitTasks来提交任务。

03

Zzreal的大数据笔记-SparkDay03

Spark的运行模式 📷 Spark的运行模式多种多样，灵活多变，部署在单机上时，既可以用本地模式运行，也可以用伪分布模式运行，而当以分布式集群的方式部署时，也有众多的运行模式可供选择，这取决于集群的实际情况，底层的资源调度即可以依赖外部资源调度框架，也可以使用Spark内建的Standalone模式。对于外部资源调度框架的支持，目前的实现包括相对稳定的Mesos模式，以及hadoop YARN模式。本地模式：常用于本地开发测试，本地还分别 local 和 local cluster （1）standal

09

Spark Streaming Dynamic Resource Allocation

DRA has already been implemented since Spark 1.2 . However the existing Spark DRA on Yarn implementation does not embody the specific property of Spark Streaming.

03

[spark] TaskScheduler 任务提交与调度源码解析

在DAGScheduler划分为Stage并以TaskSet的形式提交给TaskScheduler后，再由TaskScheduler通过TaskSetMagager对taskSet的task进行调度与执行。

03

Spark的性能调优

下面这些关于Spark的性能调优项，有的是来自官方的，有的是来自别的的工程师，有的则是我自己总结的。

02

Spark2.x学习笔记：8、 Spark应用程打包与提交

09

日志分析实战之清洗日志小实例1：使用spark&Scala分析Apache日志

问题导读 1.如何进入spark shell？ 2.spark shell中如何加载外部文件？ 3.spark中读取文件后做了哪些操作？ about云日志分析，那么过滤清洗日志。该如何实现。这里参考国外的一篇文章，总结分享给大家。使用spark分析网站访问日志，日志文件包含数十亿行。现在开始研究spark使用，他是如何工作的。几年前使用hadoop，后来发现spark也是容易的。下面是需要注意的：如果你已经知道如何使用spark并想知道如何处理spark访问日志记录，我写了这篇短的文章，介

08

Spark Tips 1: RDD的collect action 不适用于单个element size过大的情况

collect是Spark RDD一个非常易用的action，通过collect可以轻易获得一个RDD当中所有的elements。当这些elements是String类型的时候，可以轻易将整个RDD转化成一个List<String>,简直不要太好用。不过等一等，这么好用的action有一个弱点，它不适合size比较的element。举个例子来说吧。请看下面这段代码： ... ... JavaPairInputDStream<String, String> messages = KafkaUtils.cr

09

Spark作业调度

Spark在standalone模式下，默认是使用FIFO的模式，我们可以使用spark.cores.max 来设置它的最大核心数，使用spark.executor.memory 来设置它的内存。在YARN模式下，使用--num-workers设置worker的数量，使用--worker-memory设置work的内存，使用--worker-cores设置worker的核心数。下面介绍一下怎么设置Spark的调度为Fair模式。　　在实例化SparkContext之前，设置sp

07

org.apache.spark.streaming.dstream.MappedDStream@5a69b104 has not been initialized现象原因及方案

现象执行Spark Streaming Application时报错 15/07/09 11:26:55 INFO scheduler.JobGenerator: Stopping JobGenerator immediately 15/07/09 11:26:55 INFO util.RecurringTimer: Stopped timer for JobGenerator after time -1 15/07/09 11:26:55 INFO streaming.CheckpointWriter:

02

Spark2.x学习笔记：5、Spark On YARN模式

09

Spark Streaming Dynamic Resource Allocation 文档(非官方特性)

减少资源时，采用启发式算法。根据之前周期的处理时间，计算需要保留的资源量(A)，然后尝试分多轮试探性的减少(B),每个计算周期都会重复A,B动作，最后会收敛到一个具体的数值。

03

深入理解Spark 2.1 Core （五）：Standalone模式运行的原理与源码分析

前几篇博文都在介绍Spark的调度，这篇博文我们从更加宏观的调度看Spark，讲讲Spark的部署模式。Spark部署模式分以下几种：

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭