Spark和Executor在本地模式下的行为_在YARN CUSTER模式下的本地文件中捕获spark executor日志_Spark程序在本地模式和集群模式下的区别 - 腾讯云开发者社区

在StackOverflow中有几个关于Spark的本地模式的问题得到了很好的回答，但我找不到我的问题的答案，那就是；我知道在本地模式下，spark为驱动程序和executor创建了一个JVM，所以这意味着我们有一个executor，它的内核数量与我们的计

浏览 38提问于2021-01-18得票数 1

1回答

火花-提交：“-主local[n]”和“--主本地-执行器-核m”之间的区别

、

我使用两个不同的spark-submit参数运行了一个火花作业。spark-submit --master local[4] 这两个例子真的有什么区别吗？我试图让火花使用4个总线程的火花“任务”，2个线程在每个物理核心。

浏览 2提问于2016-10-09得票数 1

回答已采纳

1回答

在纱线集群上分配sparkContext错误

、

我的代码在本地模式下工作，但在yarn (客户端或集群模式)下，它停止了，并显示以下错误： Exception in thread "main" org.apache.spark.SparkExceptionin stage 0.0 failed 4 times, most recent failure: Lost task 1.3 in stage 0.0 (TID 6, hadoopdatanode, executor:70)

浏览 27提问于2019-02-27得票数 0

回答已采纳

1回答

增加spark实例的执行器数量

我正在通过pyspark启动一个spark实例。我使用的系统是EC2上的r3.8x，内存为244gb，vCPU为32。文件设置了一些参数，如下所示spark.executor.cores 2spark.executor.memory220g spark.memory.fraction 0.07

浏览 1提问于2017-07-24得票数 1

3回答

限制Apache火花CPU的使用

我使用的是Apache (独立模式) ALS推荐算法和60 GB的数据，问题是当算法启动时CPU Spike为100%，我如何设置限制CPU使用的火花？例如，只需使用50%的CPU。我尝试过用较少的CPU核心，但它不会改变任何有关CPU的使用。我在服务器上以独立模式运行spark，配置如下：OS Name: Micro

浏览 1提问于2019-07-21得票数 4

3回答

使用单个开发/测试机器并发地处理Spark进程分区

、

我天真地在本地模式下测试并发性，使用以下spark上下文 .builder .master但是，我希望看到我的应用程序将在生产和测试期间压缩所有可用的机器资源，以便发现更多并发错误的机会将会提高。到目前为止，我的机器显然不是这种情况:在inpu

浏览 0提问于2019-08-25得票数 4

1回答

参数化的pytest fixture，在本地和Yarn模式下运行PySpark

、、

我有一个我认为是相当常见的用例。我有一些为PySpark编写的函数，我想在本地和Yarn模式下进行测试。pytest fixtures在这方面工作得很好--您可以简单地编写一个在两种模式下运行的参数化fixture。setMaster("yarn-client") .setAppName("pytest-pyspark-yarn-testing"

浏览 0提问于2015-11-13得票数 2

1回答

pyspark local[] vs spark*.executor.cores“

、、

我使用python pyspark在本地模式下运行spark集群。其中一个spark配置选项设置为："spark.executor.cores": "8" "spark.cores.max": "8" 设置完所有选项后： SparkSession.builder.config(conf=spark_configuration) 我构建了<

浏览 51提问于2021-08-12得票数 0

1回答

在单个机器上设置带有火花放电的任务槽

、、

我试图使用SparkTrials从hyperopt库中运行ML模型的优化。我在一台有16个核的机器上运行这个程序，但是当我运行下面的代码(将核数设置为8个)时，我会得到一个警告，似乎只使用了一个核心。接受spark_session作为一个论点，理论上它是我设置核数目的地方。谢谢!= SparkSession.builder.master("local").config('spark.local.dir', './').

浏览 5提问于2020-11-02得票数 0

回答已采纳

1回答

如何在“本地集群”模式下测试星火程序？

、

我有一个Spark程序，它在本地模式下拥有非常完整的测试套件，但是当部署在Spark集群上时，它演示了几个序列化和同步问题，测试套件无法检测到这些问题。.set("spark.executor.classpath", sys.props("java

浏览 1提问于2015-10-09得票数 0

回答已采纳

1回答

在kubernetes集群中使用spark_sklearn

、、、

我最初使用的是scikit-learn (sklearn)库。在模型优化的过程中，我使用了sklearn中的经典GridSearchCV类。集群的资源(pyspark和spark_sklearn库)。我设法设置了一个spark集群，其中有一个master和2个worker。下面的代码运行与前面相同的任务，但是使用spark集群资源。使用spark集群中的所有可用资

浏览 0提问于2019-11-07得票数 0

1回答

火花局部模式下执行者的数量

、

所以我在本地模式下运行一个火花作业。scala-2.10/spark_proj-assembly-1.0.jar 0 large.csv 100 outputFolder2 10val conf = new SparkConf().setMaster("local[*]").setAppName(&qu

浏览 0提问于2017-06-16得票数 12

回答已采纳

2回答

具有多个执行器的火花独立配置

、

我正在尝试设置一个独立的Spark2.0服务器，以并行处理分析功能。要做到这一点，我希望有一个具有多个执行者的单个工作人员。我在用：我的配置如下：s

浏览 6提问于2016-10-11得票数 8

回答已采纳

1回答

火花提交参数是否在本地模式下工作？

当我运行spark-submit --master local[10] --num-executors 8 --executor-cores 5 --executor-memory 5g foo.jar(这意味着我在本地模式下运行一个应用程序)时，--num-executors 8 --executor-cores 5 --executor-memory会与local[10]一起工作吗？换句话说，--num-executors 8 -

浏览 2提问于2021-04-06得票数 0

回答已采纳

1回答

为什么即使spark.executor.memory配置大于节点的内存大小，也没有IllegalArgumentException

我在本地模式下使用了spark2.0.1和测试。.config("spark.executor.memory", "2000g") .master("local[*]") .config("spark.app.name

浏览 0提问于2016-11-28得票数 0

1回答

sparklyr的Spark内存问题

、、

我在Spark running和sparklyr上有一些奇怪的问题。我目前在一台R生产服务器上，通过spark://<my server>:7077以客户端模式连接到my Spark Cluster，然后从MS SQL server拉取数据。我最近可以做到这一点，没有任何问题，但我最近得到了一个更大的集群，现在有内存问题。首先，我在处理过程中遇到了莫名其妙的“内存不

浏览 19提问于2018-06-01得票数 0

回答已采纳

2回答

在纱线上以群集模式运行Spark时不使用SparkConf设置

、、、

", "1");conf.set("spark.executor.cores", "3"); conf.set("spark.executor</

浏览 2提问于2017-05-04得票数 5

回答已采纳

1回答

在Dataproc中将spark.master更改为纱线

、、、、

我将作业提交到Dataproc中的星火集群(使用Hadoop )。我看到，无论我为spark.master和部署模式设置了哪些属性，当我进入Spark时，作业的环境选项卡总是显示spark.master的本地属性，而且作业的不同阶段总是使用相同的executor id，即使有更多的空间。'spark.executor.

浏览 1提问于2019-10-12得票数 2

3回答

如何在本地模式下更改执行程序的数量？

、、

是否可以使用某些Spark设置在本地模式下为Spark流应用程序设置多个执行器？目前，当我将spark.executor.instances参数更改为4时，我无法看到Spark在性能或执行器数量上有任何变化。

浏览 3提问于2018-09-05得票数 8

回答已采纳

4回答

如何在独立集群模式下为每个工作人员分配更多的执行器？

我在一个由5个工作节点组成的集群中使用Spark1.3.0，每个节点有36个核心和58 36内存。我想配置Spark的独立集群，每个工作人员拥有许多执行者。我已经看到了合并的，但是还不清楚如何实际配置多个执行程序。下面是集群的最新配置：spark.executor.instances = "10

浏览 4提问于2015-04-29得票数 12

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云