在纱线集群上分配sparkContext错误_图像集群-在GPU上分配内存_java.lang.NoSuchMethodError:在纱线集群上使用spark-submit时 - 腾讯云开发者社区

、

我的代码在本地模式下工作，但在yarn (客户端或集群模式)下，它停止了，并显示以下错误： Exception in thread "main" org.apache.spark.SparkExceptionorg.apache.spark.rdd.ParallelCollectionPartition.readObject(ParallelCollectionRDD.scala:70) 我不明白为什么它在本地模式下工作，而不是在纱线模式下工作问题出在rdd.foreach内部的<em

浏览 27提问于2019-02-27得票数 0

回答已采纳

2回答

Apache Zeppelin可以在一段时间后自动关闭SparkContext并重新打开它吗？

、、

我在独立模式下设置了一个简单的Spark集群，并希望使用Apache Zeppelin作为交互式Spark "scratchpad“。不幸的是，当SparkContext启动时，它会占用我的实验集群上的所有内核。我知道有一个名为“动态分配”的新功能，但它只适用于纱线。我在这个集群上没有YARN，我也不想运行一个成熟的Hadoop堆栈，因为我想使用Cassandra作为数据后端。在不使用纱线</em

浏览 3提问于2015-09-06得票数 1

1回答

Apache Spark在多节点hadoop集群中的应用

、、、

此代码在hadoop单节点集群中工作。但是，当我试图在hadoop多节点集群中使用它时，它会将错误抛出 org.apache.spark.SparkException: Detected yarn-cluster mode, but isn'tDeployment to YARN is not supported directly by SparkContext. Please use spark-submit.注:我已使用主机作为本地单节点，纱线集群

浏览 0提问于2015-08-04得票数 1

回答已采纳

4回答

使用纱线群集模式初始化SparkContext时出错

、、、

我正在运行一个简单的代码来在hdfs上创建一个文件，并向其写入内容并关闭该文件。我能够在本地模式以及纱线-客户端模式下运行此代码。但是，当我使用纱线-集群模式运行相同的代码时，我得到的代码与Error initializing SparkContext相同。os = file.create(new Path(uri))os.close()

浏览 2提问于2017-01-27得票数 3

2回答

如何使用python多处理在Spark中运行多个并发作业

、、、

我已经在我的笔记本电脑上的纱线集群上设置了一个Spark，并且使用python多处理在Spark中运行多个并发作业时遇到了问题。我运行的模式是纱-客户模式。我尝试了两种方法来实现这个目标：设置一个SparkContext并创建多个进程来提交作业。此方法不起作用，程序崩溃。我想单个SparkContext不支持python多个进程。对于每个进程，设置一个SparkContext并提交作业。在这种情况下，作业成功地提交给纱线

浏览 2提问于2015-11-09得票数 2

1回答

HDInsigh Spark如何使用以下代码

、、

我的意思是如何在集群节点之间调度作业。假设我有2个头节点和4个工作节点，哪些代码将在头节点上运行，哪些代码将在工作节点上运行？我如何让Spark知道我想要在工作节点上执行一些代码？

浏览 30提问于2019-09-24得票数 0

6回答

星火中的纱线客户模式是什么？

、

我的问题是，纱线-客户模式到底意味着什么？文件中说：与纱线独立模式的具体区别是什么？

浏览 5提问于2013-12-27得票数 53

回答已采纳

1回答

如何从python应用程序中查询spark？

、、

我已经设置了一个测试卡桑德拉+星火集群。web上的所有文档似乎都显示了如何使用spark的python (其中上下文'sc‘是隐式提供的)。我需要能够从一个独立的python脚本(可能是一个为web页面服务的脚本)中运行激发SQL。我没有找到任何文档，也没有在频道上找到任何帮助。我只是想错了吗？是否还有其他工具可以向技术含量较低的用户提供spark？我是全新的火花。

浏览 4提问于2016-01-06得票数 0

回答已采纳

1回答

在星火纱线集群中，容器如何工作取决于RDD分区的数量？

、、、

我有一个关于Apache (纱线集群)的问题。 val sparktest = sc.textFile("/spark_test/58GB.dat",10) val test = sparktest.flatMap(line=> line.split(

浏览 1提问于2015-03-13得票数 0

回答已采纳

1回答

PySpark在纱线客户端模式下运行，但在集群模式下失败，因为“用户没有初始化火花上下文！”

、、、、

标准dataproc映像2.0 testing_dep.pyimport os我可以在客户端模式下运行testing_dep.py (默认情况下为dataproc)： gcloud dataproc jobs submit/testing_dep.py --cluster=pyspark

浏览 33提问于2022-01-11得票数 3

回答已采纳

1回答

为火星团上的jupyter笔记本指定python文件

、、、

我在星团上运行一个jupyter笔记本(与纱线)。我正在使用"findspark“包来设置笔记本，它工作得非常好(我通过SSH隧道连接到集群主机)。(appName='myApp')a.take(10)火花的工作完全分配给工人们。但是，当我想使用我编写的python包时，将文件丢失在workers上。)然后 spark-submit

浏览 2提问于2017-12-08得票数 6

回答已采纳

3回答

星火提交会自动上传jar到集群吗？

我正在尝试提交一个星火应用程序从本地机器终端到我的集群。我在用--master yarn-cluster。我也需要在集群上运行驱动程序，而不是在我提交应用程序的机器上，即我的本地机器上。当我在本地机器中提供到应用程序jar的路径时，是否会自动将其上传到集群？--num-executors 50 /Users/nish1013/proj1/target/x-service-1.0.0-2015121411

浏览 4提问于2015-12-21得票数 20

4回答

纱线簇上的PySpark分布式处理

、、、

我在ClouderaCDH5.3集群上运行了Spark，使用Spark作为资源管理器。我正在用Python (PySpark)开发火花应用程序。我可以提交作业，它们可以成功地运行，但是它们似乎从来不运行在多台机器上(我提交的本地机器)。我尝试过多种选择，比如将部署模式设置为集群，--主从于纱线客户端和纱线集群，但它似乎从未在多台服务器上运行过。我有一个非常简单的Python脚本，处理来自HDFS的数据，如下所示： import sim

浏览 3提问于2015-01-30得票数 12

回答已采纳

1回答

SparkContext.addJar在本地模式下不工作。

如果我以纱线集群模式提交spark作业，如果jar文件没有包含在根据addJar命令的选项--jars中，那么 ()将无法工作。如果您将SparkContext.addJar函数与本地文件一起使用并在纱线集群模式下运行，则--jars选项允许它工作。原因是驱动程序运行在与客户端不同的机器上。因此，命令中的选项--jars似乎来自客户端，函数addJar()只能在驱动程序中的jars上工作。然后我做了一个本地模式的测试。1.spark-shell --master local --jar

浏览 3提问于2017-03-22得票数 3

回答已采纳

1回答

SparkContext Java从AWS部署作业和MapReduce

、、、

Hi正在搜索web和amazon文档，以了解如何在aws上现有的emr纱线集群上运行spark作业。 private static SparkConf conf;

浏览 0提问于2019-02-10得票数 1

回答已采纳

1回答

自动设置Dataproc集群后Yarn/Spark的内存分配不正确

、、

我正尝试在Dataproc集群上运行Spark作业，但由于Yarn配置错误，Spark无法启动。从shell运行"spark-shell“时(在主机上本地运行)，以及从本地计算机通过web-GUI和gcloud命令行实用程序上传作业时，我收到以下错误： 15/11/08 21:27:16 ERRORorg.apache.spark.SparkContext: Error initializing SparkContext</

浏览 0提问于2015-11-09得票数 10

回答已采纳

1回答

如果没有在工人节点上安装火花(纱线)，如何启动火花执行器？

、、

我有一个关于在集群模式下在纱线上运行Apache的问题。根据，Spark本身不必安装在集群中的每个(worker)节点上。我的问题是火花执行者:一般来说，纱线，或者更确切地说，是由资源经理来决定资源分配。因此，可以在集群中的任意(worker)节点上随机启动火花执行器。但是，如果没有在任何(工人)节点上安装火花，那么如何通过纱线启动火花执行器呢？

浏览 7提问于2016-12-16得票数 2

回答已采纳

1回答

应用程序母版或群集管理器是否启动容器/执行者-火花？

让我们说，我们有一个火花作业运行在集群模式，其中集群管理器是纱线。用户向集群管理器提交一个预编译的JAR、Python .集群管理器告诉特定的节点管理器启动应用程序母版。是火花驱动程序，然后在应用程序母版上运行。驱动程序将包含转换和操作的用户代码转换为一个名为DAG的逻辑计划。然后将DAG转换为物理执行计划应用程序主程序，然后与集群管理器通信并协商资源。此时，集群管理器是分配纱线

浏览 0提问于2020-05-31得票数 0

回答已采纳

3回答

如何使笔记本在第一项工作中运行得更快

、

 由于您可以参考快照，当您第一次运行笔记本时，完成这项工作需要很长时间(大约是。超过1分钟)。

浏览 7提问于2017-02-05得票数 2

回答已采纳

1回答

SparkConf和sparkContext的用途

sparkContext和sparkConf的用途是什么？寻找细节上的差异。超过下面的定义： Spark Context是任何spark应用程序的入口点，用于访问所有spark特性，并且需要一个包含所有集群配置和参数的sparkConf来创建Spark Context对象。

浏览 0提问于2020-05-02得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云