Spark作业未显示在独立群集GUI上_在独立群集上运行spark shell时出现太大的帧错误_菜单栏未显示在Tkinter GUI上 - 腾讯云开发者社区

apache-spark

我正在实验室中运行spark作业，并且有一个三节点的独立集群。当我通过CLI在主节点上执行新作业时，虽然作业按预期完成，但它根本不会显示在集群spark-submit sparktest.py --master spark://myip:7077上。在作业执行期间和完成后，当我导航到http://mymas

浏览 9提问于2021-08-09得票数 1

回答已采纳

1回答

Spark独立集群行为查询

apache-spark

我们有两台安装了20核linux的unix机器，each.We需要设置一个独立的集群和spark调度器。目前我们暂时不能使用cloudera/Hortonwork。我的问题是关于Spark Scheduler。如果我创建一台unix机器同时作为Master和Slave，另一台机器作为slave节点，那么有多少内核可供我运行spark代码。是40还是更少？我可以在群集模式下在此群集上运行多个作业吗？

浏览 0提问于2016-07-27得票数 0

1回答

在收集连接两个DataFrame的结果时，毫无例外地触发作业挂起

eclipse、scala、apache-spark、cassandra

我可以得到正确的结果，火花工作可以正常完成在我的电脑月蚀。但是当我提交到server (本地模式)时，作业就会挂起，没有任何异常或错误消息，直到我按Ctrl+C停止它，一个小时后才能完成。我不知道为什么工作不能工作在火花服务器，有什么区别的eclipse和火花服务器。如果原因是OutofMemory问题，那么是否有可能火花没有抛出任何异常而只是挂起？提交命令 /usr/bin/spark-submit --class com.test.c2c --jars file:&

浏览 3提问于2016-12-12得票数 1

回答已采纳

1回答

从ResourceManager图形用户界面访问终止的Spark作业日志

hadoop、apache-spark

我在YARN上运行Spark应用程序，当我使用以下命令终止作业时：我无法从Hadoop GUI(ResourceManager)转到killed应用程序的Spark Job GUI。当我直接打开Spark历史服务器，并尝试显示不完整的应用程序日志时，它可以工作。当作业完成(未终止)时，日志可以

浏览 0提问于2015-10-02得票数 2

2回答

火花在独立集群模式下运行所需的最小硬件缺陷是什么？

apache-spark

英特尔核心i5内存:4GB。我正试图在星火独立集群.This上运行eclipse上的spark程序，这是我的代码的一部分。String logFile = "/Users/BigDinosaur/Downloads/spark-2.0.1-bin-hadoop2.7 2/README.

浏览 2提问于2016-11-10得票数 1

1回答

Spark驱动程序未分配任何工作进程

apache-spark、sparkcore

我正在使用 spark version 2.4.7-bin-hadoop.2.7java 8 具有1个主节点和2个工作节点的spark群集正在作为独立群集spark配置运行 spark.masterspark.driver.memory 500M 主启动脚本为${SPARK_HOME}/sbin/start-master.sh 从启动脚本为${SPARK<

浏览 31提问于2021-04-17得票数 0

2回答

在独立模式下运行spark集群与Yarn/Mesos

hadoop、apache-spark、hadoop-yarn、mesos

目前，我以独立模式运行我的spark集群。我正在从平面文件或Cassandra(取决于作业)读取数据，并将处理后的数据写回Cassandra本身。

浏览 2提问于2016-04-01得票数 4

1回答

库伯奈斯独立的火花:火花壳工作的奴隶，而不是主人:最初的工作没有接受任何资源；

apache-spark、kubernetes

我正在一个裸金属Kubernetes集群上测试Spark2.3.1(独立的)。我有一个带有两个虚拟机的集群，它们都有8GB的内存和2个核心。我已经部署了一个包含一个主节点和两个从节点的集群。cat /opt/spark/logs/spark-logs 37421 sp

浏览 2提问于2018-08-29得票数 0

回答已采纳

1回答

是什么控制了一个应用程序拥有多少星团？

resources、apache-spark

在另一个类似的注意事项上，是否有办法改变每个作业或任务级别上所要求的内存？

浏览 3提问于2015-01-14得票数 10

回答已采纳

3回答

仅允许在spark集群上执行一个驱动程序

apache-spark、cluster-computing

我们有一个包含8个节点的spark集群。每小时向群集提交一个spark作业。如果spark作业已经在集群上运行，我如何配置集群或编写一些不允许在集群上提交spark作业的代码？

浏览 2提问于2017-06-13得票数 0

1回答

如何从IntelliJ IDEA向远程星火库集群提交代码

intellij-idea、apache-spark

我有两个集群，一个在本地虚拟机中，另一个在远程云中。这两个集群都处于独立模式。:火花://现场1:7077 在本地(我的笔记本上)在IntelliJ IDEA中编写代码(只是简单的字数)，并将Spark设置为spark://local1:7077和spark://remote1

浏览 2提问于2015-11-09得票数 7

1回答

查看通过Azure ADF执行的作业的Spark* UI*

permissions、azure-data-factory、azure-databricks、spark-ui

我无法查看通过Azure数据工厂中的notebook活动执行的databricks作业的spark-ui。 

浏览 5提问于2021-11-10得票数 0

1回答

在群集模式SPARK中写入本地文件系统

apache-spark、permissions、hadoop-yarn、cluster-mode

对于spark作业，我们尝试添加一个在本地文件系统上创建自定义日志文件的日志记录框架。在客户端模式下，一切都很好，文件由启动spark-submit的用户在本地文件系统上创建。但是，在群集模式下，本地文件是使用没有写入本地目录权限的用户yarn创建的…… 有没有什么解决方案可以让提交作业的用户在集群模式下写入本地文件，而无需将权限更改为777 everywhere？在这种情况下(我

浏览 12提问于2020-07-02得票数 0

1回答

群集上的Spark作业比独立群集上的慢

scala、amazon-web-services、apache-spark、rdd

我有这段代码，它在独立环境下运行良好，但在AWS的4个从机(8核30 to内存)集群上工作时运行缓慢。tabHash2 = sc.broadcast(tabHash(nbseg,dim))我知道这不是bary函数，因为我尝试了不带hashmin3的代码的另一个版本，它在4个从机上运行得很好，在8

浏览 1提问于2015-07-22得票数 0

1回答

pyspark客户端没有从码头中的星火服务器得到任何结果，但正在连接。

docker、apache-spark、pyspark

我在一个码头容器中运行了一个火花群集。我有一个吡火花简单的例子程序来测试我的配置，它运行在我的桌面上，在码头容器外。火花控制台获取并执行作业并完成作业。然而，pyspark客户端永远不会得到结果。吡火花程序的控制台显示：使用spark的默认log4j配置文件:org/apache/log4j/log4j-defaults.properties将默认日志级别设置为“警告”。:初始作业没有接受任何资源；检查群集</

浏览 3提问于2022-03-05得票数 0

1回答

从代码中按需启动火花作业。

scala、apache-spark

从企业应用程序( Java或Scala)中按需启动星火作业的推荐方法是什么？有一个处理步骤，目前需要几分钟才能完成。我想使用星火集群将处理减少到15秒以下：问题2：将处理结果传输回调用方代码的推荐方法是什么？问题3：如何将<em

浏览 4提问于2016-08-06得票数 2

回答已采纳

2回答

火花独立模式不将作业分配给其他员工节点

apache-spark

我正在运行一个独立模式的火花作业。我已将我的工作节点配置为连接到主节点。他们正在成功地连接起来，但是当我在火花公子上运行作业时，任务并没有被分发。我一直在收到以下信息- 我尝试在worker节点上以本地方式运行作业，并且运行良好此外，spark ui

浏览 2提问于2016-03-21得票数 0

1回答

在Apache 1.2.1独立集群中，“执行器的数量等于spark* _WORKER_INSTANCES的数量”吗？*

hadoop、apache-spark

在Apache 1.2.1独立集群中，“执行器的数量等于SPARK_WORKER_INSTANCES的数量”吗？I have done below setting in conf/spark-env.sh SPARK_NUM_EXECUTORS=3如果没有人能告诉我如何在独立集群中增加执行者的数量？

浏览 0提问于2015-04-24得票数 0

回答已采纳

1回答

Spark -自动化部署和性能测试

testing、sbt、bigdata、apache-spark

我们正在开发一个使用Spark & Hive进行静态和即席报告的应用程序。对于这些静态报告，它们采用许多参数，然后在数据集上运行。我们希望能够更轻松地在群集上测试这些报告的性能。为了加快开发速度，通过IDE将Spark应用程序部署到Spark集群(独立)的最佳方式是什么？我想我们可以创建一个SBT任务来运行spark提交脚本。有没有更好的方法？最终，这将提供给一些自动化的性能测试，我们计划每天运行两次Jenkins作

浏览 0提问于2014-07-31得票数 4

1回答

有可能知道特定Spark作业使用的资源吗？

apache-spark、multi-tenant

我借鉴了使用多租户Spark集群的想法。群集按需为特定租户执行作业。是否有可能“知道”特定作业使用的特定资源(出于支付原因)？例如，如果作业需要自动分配kubernetes中的几个节点，那么是否可以跟踪启动这些资源分配的是哪个Spark作业(以及最后的租户)？或者，作业总是均匀地分布在已分配的资源上？尝试在Apache Spark站点和互联网上的其他位置查找信息，但没有成功。

浏览 12提问于2019-09-26得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云