文章/答案/技术大牛

发布

spark pi示例运行，但未分配任何工作资源

Spark Pi是一个简单的示例应用程序，用于估计圆周率的值。在运行Spark Pi示例之前，需要配置和分配工作资源。以下是一个完善且全面的答案：

Spark是一个开源的大数据处理框架，它提供了分布式数据处理和计算能力。Pi示例是Spark中的一个经典示例应用程序，它使用Monte Carlo方法来估计圆周率的值。

该示例应用程序的运行需要分配和管理资源。资源可以是计算资源、存储资源以及网络带宽资源。通过配置资源，可以确保Spark Pi应用程序能够在集群上正确运行。

以下是一些常见的资源配置和分配步骤：

集群部署：首先，需要设置一个具有足够计算能力和存储能力的集群环境。这可以是一个独立的服务器集群，也可以是云平台提供的虚拟机集群。
Spark安装和配置：在集群中的每个节点上安装和配置Spark框架。确保Spark的各个组件（如Spark Driver和Spark Executor）都能够正常运行。
网络配置：确保集群中的各个节点能够互相通信。这通常需要配置网络规则和防火墙规则，以允许节点之间的通信。
资源调度：使用Spark的资源管理器来分配和管理资源。Spark提供了多种资源管理器，如Standalone模式、YARN模式和Mesos模式。根据实际情况选择合适的资源管理器。
Spark Pi运行：在Spark集群中提交Spark Pi应用程序。可以使用Spark自带的命令行工具或者编写一个启动脚本来提交应用程序。确保应用程序的运行参数正确配置。

Spark Pi应用程序的优势是它简单易懂，用于演示和学习Spark的基本概念和功能。它还可以作为一个基准测试工具，用于评估和比较不同集群配置和硬件资源的性能表现。

Spark Pi示例应用程序的应用场景包括但不限于以下几个方面：

学术研究：用于在分布式环境下进行高性能计算和数值模拟。
大数据处理：作为一个简单的示例应用程序，可以用来学习和理解Spark的基本概念和编程模型。
性能测试和调优：用于测试和比较不同集群配置和硬件资源的性能表现，并进行性能优化。

对于腾讯云用户，推荐使用腾讯云的云原生服务和产品来支持Spark Pi应用程序的运行和部署。

以下是一些推荐的腾讯云产品和产品介绍链接地址，用于支持Spark Pi应用程序的运行和部署：

云服务器（CVM）：提供可扩展的计算资源，用于搭建Spark集群环境。详情请参考：腾讯云云服务器产品介绍
弹性伸缩（Auto Scaling）：自动调整计算资源，根据Spark应用程序的需求动态分配和回收计算节点。详情请参考：腾讯云弹性伸缩产品介绍
云原生容器服务（TKE）：提供容器化的部署环境，支持Spark应用程序的容器化部署和管理。详情请参考：腾讯云云原生容器服务产品介绍
弹性MapReduce（EMR）：基于Hadoop和Spark的大数据处理服务，提供集群资源的自动管理和调度。详情请参考：腾讯云弹性MapReduce产品介绍
云数据库 TencentDB：提供高性能的数据库服务，用于存储和管理Spark应用程序的数据。详情请参考：腾讯云云数据库 TencentDB产品介绍

请注意，答案中没有提及亚马逊AWS、Azure、阿里云、华为云、天翼云、GoDaddy、Namecheap、Google等品牌商，以充分满足问题要求。同时，腾讯云的相关产品和链接仅供参考，实际选择应根据具体需求和情况进行评估和决策。

spark pi示例运行，但未分配任何工作资源

、

我正在运行pi示例。它可以很好地执行并返回结果。但是，对于工作人员，我只能看到它是活的，没有使用任何资源！没有填写职务详细信息，什么也没有。我在本地运行spark。start-master.sh -h 127.0.0.1 start-slave.sh spark://127.0.0.1:7077 ? ?

浏览 22提问于2020-07-09得票数 0

回答已采纳

1回答

在k8的问题上点燃装罐

、

我正试图在kubernetes上运行一个示例星星之火应用程序(在星火示例jar中提供)，并试图理解其行为。在这个过程中，我做了以下工作， --class org.apache.spark.examples

浏览 2提问于2019-03-29得票数 1

回答已采纳

2回答

火花动态分配不起作用

、、、

=org.apache.spark.network.yarn.YarnShuffleService .\--executor-memory 512m\当我测试提交带有指定数

浏览 3提问于2016-07-20得票数 0

1回答

动态资源分配和排队应用程序

、、、、

根据这个启用星火动态资源分配时，所有资源都分配给第一个可用的提交作业，从而导致随后的应用程序排队。若要允许应用程序并行获取资源，请将资源分配到池中并运行这些池中的应用程序，并允许抢占在池中运行的应用程序。我看到的是，如果我提交多个星火应用程序(对spark-submit的不同调用)，当我在EMR上查找我的资源管理器时，所有的应用程序都会被接受，但一次只运行一个。现在，这可能是因

浏览 10提问于2017-10-31得票数 0

1回答

我是在CDH 5.7.0，我可以看到一个奇怪的问题，火花2运行在纱线集群。以下是我的工作提交命令 spark2 2-提交--主纱--部署模式集群--conf "spark.executor.instances=8“--conf "spark.executor.cores=4”--conf "spark.executor.memory=8g“--conf "spark.driver.cores=4”--conf "<em

浏览 3提问于2017-03-22得票数 1

2回答

星火如何独立实施资源分配

我一直在阅读Spark的源代码，但我仍然无法理解Spark是如何独立实现资源隔离和分配的。例如，Mesos使用LXC或Docker来实现容器，以限制资源。那么，如何独立地实现这一点。例如，我在一个执行器中运行了10个线程，但是Spark只给了执行器一个内核，那么如何保证这10个线程只在一个cpu内核上运行。经过下面的测试代码，发现火花独立资源分配在某种程度上是假的。我只有一个执行者(执行者)，只给执行者一个核心(机

浏览 10提问于2016-11-26得票数 3

回答已采纳

2回答

Helm -火花操作员示例/火花-pi.yaml不存在

、、、、

我已经使用将Spark运算符部署到GKE，并将其部署到自定义命名空间中：并使用helm status sparkoperator确认了运行在集群中的操作符。然而，当我试图运行Spark示例kubectl apply -f examples/spark</

浏览 0提问于2020-02-20得票数 0

回答已采纳

1回答

“SparkSession”对象没有属性“sparkContext”

、、

我有Spark 2.0.0，我正在尝试运行Spark源代码中的一些Python示例。spark-submit pi.py 2Traceback (most recent call last): File "/home/docker-user/src/hellospark/src/main/python/pi.py"

浏览 1提问于2016-07-21得票数 0

1回答

YARN申请的资源处于非活动状态，其他作业会使用吗？

、、

我运行了一个spark任务，在纱线上分配了大量的资源，而且这个任务持续了很长时间。最后，spark作业的任务只是活动的一个核心和两个核心。我想知道不活跃的资源是不是可以被其他spark工作或mr工作使用。或者只完成第一个spark作业，资源就可以被其他作业使用。

浏览 12提问于2021-08-09得票数 0

回答已采纳

1回答

解释星火配置的区别

、

我必须将我的spark应用程序中的执行器数设置为20个。spark.dynamicAllocation.initialExecutors = 20 spark.dynamicAllocation.enabled

浏览 5提问于2020-09-13得票数 1

回答已采纳

1回答

使用Apache Spark* Hidden REST API提交python脚本*

、

我需要使用Apache Spark Hidden REST API提交一个py文件，因为我遵循了教程，我找不到任何关于如何提交py文件的示例或文档。curl -X POST http://spark-cluster-ip:6066/v1/submissions/create --header "Content-Type": "/path/to/py/file

浏览 33提问于2018-05-22得票数 2

回答已采纳

1回答

覆盖Spark应用程序资源需求

我目前正在建立一个Spark集群，将由几组客户使用，我对Spark中的资源分配方法有点困惑。似乎Spark集群的治理模型有点欠缺，因为每个应用程序都可以指定自己的资源需求，从而有效地消耗整个集群并阻塞其他应用程序。我知道我可以使用spark.deploy.defaultcores来避免应用程序意外地请求所有可用内核的情况，但这仍然会导致应用程序指定的spark.cores.max远远高于其实际应该获得的值。有什么方法可以覆盖单个应用程序指定的资

浏览 0提问于2016-12-01得票数 1

5回答

在yarn集群中运行时，我们在哪里可以看到spark输出控制台

、、

我是Spark，Hadoop和Yarn的初学者。我用：安装Spark和Hadoop/Yarn。我的目标是在纱线集群上运行spark应用程序，但我有问题。我们怎么知道我们的设置什么时候工作呢？我将向您展示我的示例。在完成设置之后，我尝试运行测试jar : examples/jars/spark-examples*.jar。当我在本地使用./bin/ spark -submit --cla

浏览 2提问于2019-02-11得票数 3

1回答

spark-submit:工人不会被分配到主进程

、

我尝试在单个虚拟机上以独立模式运行spark-submit的spark streaming应用程序，但worker没有分配到驱动程序。我一直收到这样的警告：“初始作业没有接受任何资源；检查您的集群UI以确保工作进程已注册并具有足够的资源”。但问题是，没有其他应用程序在运行，而且有足够的内存，所以资源不是问题。当我查看Spark UI时，我看到应用程序正在运行，但它处于“等待”状态

浏览 0提问于2016-03-11得票数 0

2回答

将该值重置为配置"spark.executor.instances“

我想在提交spark应用程序时使用spark的动态资源分配，但在spark-defaults.conf文件中，属性spark.executor.instances的值被设置为16。据我所知，如果我们想使用动态资源分配，我不应该设置spark.executor.instances。否则，即使启用了动态资源分配，它也会被属性spark.executor.instances覆盖。我不能编

浏览 319提问于2020-07-22得票数 1

回答已采纳

1回答

管理资源以在同一集群上运行多个spark应用程序

、、

我正在尝试在同一个集群上运行两个spark应用程序。YARN是正在使用的资源管理器。我的两个spark应用程序都使用动态分配。同时运行这两个应用程序的方法有哪些？我知道在启动应用程序之前，我可以手动为每

浏览 2提问于2018-12-01得票数 0

2回答

集群中MapReduce和Spark作业的资源分配

、、、

我无法理解为Map Reduce和Spark作业分配资源的内部机制。在同一个集群中，我们可以运行Map Reduce和Spark作业，但是对于运行map reduce作业，内部资源管理器将为作业分配可用的资源，如数据节点和任务跟踪器。当涉及到Spark上下文时，它需要工作节点和执行器(内部为JVM)来计算程序。这是否意味着Map Reduce和Spark作业将有不同的节点？如果不

浏览 1提问于2017-06-10得票数 1

2回答

火花2.3 - Minikube - Kubernetes - Windows SparkPi未找到

、、

特别是，当我跑步时： spark-submit.cmd --master k8s://https://192.168.1.40:8443 --deploy-mode cluster --name spark-pi=spark:spark --conf spark.kubernetes.driver.pod.name=spark-pi-driver local:///opt/

浏览 0提问于2018-03-17得票数 0

2回答

我们能给Spark应用程序分配比集群更多的内存吗？

假设spark集群是一个独立的集群。具有1 1GB内存的主设备和具有1 1GB内存的从设备。我的意思是，如果你提交的程序比它本身的集群需要更多的内存，会发生什么？

浏览 0提问于2016-04-19得票数 0

1回答

在纱中运行火花时从资源中读取

、

在我的星火作业中，我从资源文件中读取了一些额外的数据。几个例子Resources.getResource("/more-data") 它在本地工作得很好，当我从星星之交master=local*运行时，我只需要添加-conf=scapk.driver.exClassPath我尝试了spark.yarn.dist.files，没有帮助，也许我需要添加一些东西？

浏览 2提问于2019-02-12得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

spark pi示例运行，但未分配任何工作资源

相关·内容

spark pi示例运行，但未分配任何工作资源

在k8的问题上点燃装罐

火花动态分配不起作用

动态资源分配和排队应用程序

纱线上的火花2自动利用更多的簇资源

星火如何独立实施资源分配

Helm -火花操作员示例/火花-pi.yaml不存在

“SparkSession”对象没有属性“sparkContext”

YARN申请的资源处于非活动状态，其他作业会使用吗？

解释星火配置的区别

使用Apache Spark* Hidden REST API提交python脚本*

覆盖Spark应用程序资源需求

在yarn集群中运行时，我们在哪里可以看到spark输出控制台

spark-submit:工人不会被分配到主进程

将该值重置为配置"spark.executor.instances“

管理资源以在同一集群上运行多个spark应用程序

集群中MapReduce和Spark作业的资源分配

火花2.3 - Minikube - Kubernetes - Windows SparkPi未找到

我们能给Spark应用程序分配比集群更多的内存吗？

在纱中运行火花时从资源中读取

扫码

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐