spark提交作业_使用spark-submit提交spark scala作业时出错_java中的Spark rest url作业提交 - 腾讯云开发者社区

apache-spark、pyspark、google-cloud-dataproc、dataproc

火花作业的定义是：sc.parallelize(range(1000),10).collect() sc.parallelize(range(1000),10).collect()

浏览 3提问于2022-01-21得票数 2

回答已采纳

1回答

即使内部任务返回错误，气流仍将DAG标记为成功。

airflow、airflow-2.x

所以我有一个DAG，它使用BashOperator在我们的服务器上触发一个火花作业。spark作业从S3存储桶中读取数据，该桶被隔离到按天划分的分区中并执行操作，如果桶中没有数据，则返回一个'path不退出‘错误，即如果桶中没有数据。$$anonfun$org$apache$spark$sql$execution$datasources$DataSource$$checkAndGlobPathIfNecessary$1.apply($$anonfun$org$apache$spark$sql$e

浏览 4提问于2022-11-17得票数 0

0回答

运行未在UI中显示的spark作业

apache-spark、apache-spark-1.6

我已经提交了我在这里提到的spark作业，bin/spark-submit --class DataSet BasicSparkJob-assembly-1.0.jar没有提到--master参数或spark.master而不是将作业提交到我3节点spark集群。但我想知道它在哪里提交作业，因为它在Running Applications中没有显示任何信息

浏览 7提问于2016-07-11得票数 4

回答已采纳

1回答

gcloud dataproc作业提交星星之火，以root用户的身份提交作业

apache-spark、google-cloud-platform、hadoop-yarn、gcloud

我试图提交一个火花作业使用'gcloud数据提交作业提交火花‘，我已经设置为纱线的spark.master。当作业在dataproc集群上执行时，是否可以使用我在gcloud中通过身份验证的google用户或在命令中设置代理用户来运行它？示例命令：- --cluster gov-demo --region europe-west4 \ --classor

浏览 0提问于2019-10-14得票数 1

2回答

数据库SparkSQL作业

apache-spark-sql、databricks、google-cloud-dataproc

Databricks是否支持提交类似于Google Cloud Dataproc的SparkSQL作业？ Databricks job API似乎没有用于提交Spark SQL作业的选项。

浏览 41提问于2020-07-01得票数 0

3回答

仅允许在spark集群上执行一个驱动程序

apache-spark、cluster-computing

我们有一个包含8个节点的spark集群。每小时向群集提交一个spark作业。如果spark作业已经在集群上运行，我如何配置集群或编写一些不允许在集群上提交spark作业的代码？

浏览 2提问于2017-06-13得票数 0

1回答

Kubernetes (Docker for Mac)上的Apache Spark无法解析我的VPN主机

docker、apache-spark、kubernetes、apache-spark-sql

我正在尝试通过Kubernetes提交作业。已通过，并通过以下命令成功提交作业：--master k8s://https://<k8s-apiserver-host>:<k8s-apiserver-port> \--name spark-pi \ --class org.apache.spark.exam

浏览 0提问于2020-01-27得票数 0

3回答

如何使用Spark-submit命令获取提交给Spark集群的作业的应用Id/Job Id？

apache-spark

我正在使用spark-submit命令提交Apache Spark作业。我想检索使用spark-submit命令提交的作业的应用程序Id或Job Id。推荐的方式是什么？

浏览 0提问于2018-09-08得票数 4

1回答

如何按顺序运行spark作业？

python、apache-spark、pyspark

我正在提交多个Spark作业。一个作业使用一个工人。目前，我一次提交了30个作业，5个作业正在运行，25个作业正在等待。但是，此操作会给服务器带来沉重的负载。(有时无法分配作业端口并发生错误。)当前我的运行代码：： ~/spark-submit ~test1.py & ~/spark-submit ~test2.py & ~/spark

浏览 28提问于2020-11-30得票数 0

回答已采纳

1回答

如何使用火花提交提交火花源作业？

python、apache-spark、pyspark

这个命令足够提交作业了吗？在哪里提交这条命令？

浏览 5提问于2020-01-09得票数 0

1回答

使用Marathon运行spark-submit应用程序

apache-spark、mesos、marathon

我有spark应用程序，用spark-submit运行它，如下所示：--master mesos://dispatcher_ip:7077当我从远程ip或直接在Mesos从机上运行这个spark应用程序时，它可以按预期工作，例如，我可以看到在Mesos主机上运行的框架/驱动程序，日志也显示任务正在运行。我想使用Marathon运行同样的程序，但是当我使用Marathon运行时

浏览 3提问于2016-09-18得票数 1

2回答

如何使用python多处理在Spark中运行多个并发作业

python-2.7、apache-spark、hadoop-yarn、pyspark

我已经在我的笔记本电脑上的纱线集群上设置了一个Spark，并且使用python多处理在Spark中运行多个并发作业时遇到了问题。我运行的模式是纱-客户模式。我尝试了两种方法来实现这个目标：设置一个SparkContext并创建多个进程来提交作业。此方法不起作用，程序崩溃。我想单个SparkContext不支持python多个进程。对于每个进程，设置一个SparkContext并提交作业。在这种情况下，作业成功地提交给纱线，但<e

浏览 2提问于2015-11-09得票数 2

1回答

如何使PySpark在集群上工作

apache-spark、google-cloud-platform、google-cloud-storage、google-cloud-dataproc

我正在使用这个文档来运行一个火花作业： sudo dataproc作业提交pyspar

浏览 3提问于2019-01-18得票数 3

2回答

用Java api调用Kubernetes Spark运算符

java、apache-spark、kubernetes、spark-operator

有很多使用Kubernetes Spark操作符创建Spark作业并简单地提交具有以下内容的请求的示例可以在this 中找到spark-pi.yaml有没有人知道用Java提交这样的作业最简单的方法是什么？

浏览 15提问于2020-06-04得票数 0

0回答

如何从本地提交spark Job并连接到Cassandra集群

apache-spark、cassandra、spark-cassandra-connector

谁能让我知道如何从本地提交spark Job并连接到Cassandra集群。目前，我正在通过putty登录到Cassandra节点后提交Spark作业，并提交以下dse-spark-submit job命令。命令：dse spark-submit --class ***** --total-executor-cores 6 --executor-memory 2G **/**/**.jar --config-filebuild&#x

浏览 8提问于2016-12-23得票数 0

2回答

集群中MapReduce和Spark作业的资源分配

hadoop、apache-spark、mapreduce、hadoop-yarn

我无法理解为Map Reduce和Spark作业分配资源的内部机制。在同一个集群中，我们可以运行Map Reduce和Spark作业，但是对于运行map reduce作业，内部资源管理器将为作业分配可用的资源，如数据节点和任务跟踪器。当涉及到Spark上下文时，它需要工作节点和执行器(内部为JVM)来计算程序。这是否意味着Map Reduce和Spark作业将有不同的节点？如果不是，任务跟踪器和执行器之间的区别将如何发生。集群管理器

浏览 1提问于2017-06-10得票数 1

1回答

使用java代码将星火作业提交给AWS EMR，等待执行并获得最终状态。

java、apache-spark、amazon-emr

我正试图通过AWS向AWS EMR提交一个spark作业。我希望流程提交作业，然后等待作业完成/失败，并获得相应的状态。new HadoopJarStepConfig() .withArgs("spark-submitsparkJarPath) .withArgs(args)

浏览 3提问于2017-07-28得票数 2

回答已采纳

1回答

资源匮乏下Kubernetes上的Spark作业无限期等待SPARK_MIN_EXECUTORS

apache-spark、kubernetes

我正在使用Spark 3.0.1，并在Kubernetes上进行项目spark部署，其中Kubernetes代理spark作业的集群管理器，spark使用客户端模式提交作业。假设集群配置为： total Memory=204Gifree memory= 4GiSPARK.DYNAMICALLOCTION.MINEXECUTORS=4 S

浏览 7提问于2021-02-05得票数 0

2回答

Submitted在提交员工节点/作业IOException后无休止地重新提交

java、scala、apache-spark、pyspark

在我们的应用程序中，我们有一个内置的火花独立集群(Version2.4.3)，它通过submit主URL接收主数据引擎加载程序提交的作业。2020-04-28 11:31:15,466 INFO spark.SecurityManager: Secur

浏览 1提问于2020-04-28得票数 0

回答已采纳

1回答

为什么dataproc不承认论点: spark.submit.deployMode=cluster？

google-cloud-dataproc

我以这种方式向dataproc提交了一个火花作业： gcloud dataproc作业提交星星之火--集群=$集群--region=$REGION --properties spark.jars.packages=com.google.cloud.spark:spark-bigquery-with-dependencies_2.11:0.19.1，spark.submit.deployMode=cluster错误：(gcloud.dataproc.jo

浏览 2提问于2021-04-29得票数 4

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

为什么在dataproc中只有一个作业id，而在pyspark脚本中有多个操作？

即使内部任务返回错误，气流仍将DAG标记为成功。

运行未在UI中显示的spark作业

gcloud dataproc作业提交星星之火，以root用户的身份提交作业

数据库SparkSQL作业

仅允许在spark集群上执行一个驱动程序

Kubernetes (Docker for Mac)上的Apache Spark无法解析我的VPN主机

如何使用Spark-submit命令获取提交给Spark集群的作业的应用Id/Job Id？

如何按顺序运行spark作业？

如何使用火花提交提交火花源作业？

使用Marathon运行spark-submit应用程序

如何使用python多处理在Spark中运行多个并发作业

如何使PySpark在集群上工作

用Java api调用Kubernetes Spark运算符

如何从本地提交spark Job并连接到Cassandra集群

集群中MapReduce和Spark作业的资源分配

使用java代码将星火作业提交给AWS EMR，等待执行并获得最终状态。

资源匮乏下Kubernetes上的Spark作业无限期等待SPARK_MIN_EXECUTORS

Submitted在提交员工节点/作业IOException后无休止地重新提交

为什么dataproc不承认论点: spark.submit.deployMode=cluster？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐