腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(8409)
视频
沙龙
1
回答
启动并提交作业spark
、
我尝试在我的java应用程序中“运行”spark作业,搜索,我发现了以下两种方法:ClientsArguments和
SparkLauncher
。 有人能给我解释一下这两者之间的区别吗?
浏览 0
提问于2016-08-29
得票数 0
1
回答
spark-submit
适用于
纱线
集群
模式
,
但
SparkLauncher
不
适用
,
参数
相同
、
、
我可以通过
spark-submit
提交一个spark作业,但是当我尝试使用
SparkLauncher
以编程方式提交同样的作业时,我什么也没有得到(我甚至在UI上都看不到Spark作业) 以下是场景:下面的
spark-submit
就像预期的那样工作,并且spark作业是以
纱线
集群
模式
提交的
spark-submit
\ --class com.digital.StartSparkJob没有得到正确的环境变量来处理,所以我向<
浏览 36
提问于2019-03-22
得票数 1
回答已采纳
2
回答
必须在配置中设置主URL,这会造成许多混乱
、
、
我已经尝试了以下所有选项
spark-submit
--master yarn --class financialLineItem.FinancialLineItems3://trfsmallfffile/AJAR/SparkJob-0.1
浏览 5
提问于2018-01-15
得票数 0
1
回答
如何将配置文件添加到以
纱线
-群集
模式
运行的星火作业中?
、
我想上传一个文件使用
spark-submit
\ --files /home/user/test.csv\我阅读了星火文档,它建议我使用SparkFiles.get("test.csv"),
但
这并不
适用于
纱线
集群
模式
。如果将部署
浏览 3
提问于2018-06-19
得票数 1
1
回答
submit在
纱线
集群
模式
下截断
参数
、
、
我正在使用以下命令在
集群
部署
模式
下在
纱线
集群
上运行spark应用程序此命令没有将整个
参数</e
浏览 2
提问于2021-11-10
得票数 0
回答已采纳
2
回答
火花提交
纱线
集群
与--罐子
不
工作吗?
、
、
、
、
我正试图通过以下命令向CDH
纱线
集群
提交一个spark作业java.lang.NoClassDefF
浏览 2
提问于2015-07-24
得票数 3
1
回答
如何在气流火花报送操作员中设置SPARK_MAJOR_VERSION和HADOOP_USER_NAME?
、
我试图在
纱线
模式
下运行,我已经通过了env_vars。不过,SPARK_MAJOR_VERSION还没有设置。07:03,526] {logging_mixin.py:95} INFO - [2019-03-11 21:07:03,526] {spark_submit_hook.py:283} INFO -
Spark-Submit
cmd: [u'/usr/bin/
spark-submit
', '--master', 'yarn:/X
浏览 0
提问于2019-03-05
得票数 1
1
回答
为什么ExceptionInInitializerError在提交Spark申请时在
纱线
集群
模式
下?
、
本地
模式
下的作业执行成功,但是当我在
纱线
集群
模式
下启动
相同
的作业时,它会抛出ExceptionInInitializerError。本地
模式
命令:ts-0.0.1-SNAPSHOT.jar \-ip /user/
浏览 1
提问于2016-08-29
得票数 1
回答已采纳
1
回答
Spark独立和虚拟环境
、
通过将spark
集群
配置为spark-standalone,我们正在尝试配置
spark-submit
作业以利用由pipenv管理的虚拟环境。
spark-submit
命令当前为: PYSPARK_DRIVER_PYTHON=./.venv/bin/python \
spark-submit
--py-files site.zip src/app.py其思路是,--py-files
参数
应该将site.zip解压到执行器上的工作目录中,并且应该使用python路径上可用的
浏览 12
提问于2018-02-14
得票数 4
4
回答
使用
纱线
群集
模式
初始化SparkContext时出错
、
、
、
我能够在本地
模式
以及
纱线
-客户端
模式
下运行此代码。但是,当我使用
纱线
-
集群
模式
运行
相同
的代码时,我得到的代码与Error initializing SparkContext
相同
。val os = file.create(new Path(uri))os.close()} 当我使用本地
模式
和
纱线<
浏览 2
提问于2017-01-27
得票数 3
4
回答
火花对
纱线
概念的认识
、
、
、
我正试图了解星火如何在
纱线
集群
/客户端上运行。我脑子里有一个问题。 是否有必要在
纱线
簇的所有节点上安装火花?我认为应该是因为
集群
中的工作节点执行一个任务,并且应该能够解码由驱动程序发送到
集群
中的代码(火花API)?它在文档中写道,“确保HADOOP_CONF_DIR或YARN_CONF_DIR指向包含Hadoop
集群
(客户端)配置文件的目录”。为什么客户端节点在将作业发送到
集群
时必须安装Hadoop?
浏览 3
提问于2014-07-23
得票数 42
回答已采纳
3
回答
spark提交java.lang.ClassNotFoundException
、
、
、
、
我正在尝试运行我自己的spark应用程序,但是当我使用
spark-submit
命令时,我得到了这个错误:我使用以下命令: /Users/_name_here/dev/spark/bin/
spark-submit
从spark根
浏览 8
提问于2015-08-13
得票数 9
回答已采纳
1
回答
纱线
火花作业调度较慢
、
、
、
、
on bare-metal servers, 8 nodes with 128g of memory/32 cores eachdf=hc.sql("select在群集1上,整个操作在30分钟内完成,而对于较大的
集群
2,则需要90分钟才能完成
相同
的操作。经过检查,我发现虽然每个作业花费的时间几乎
相同
(
集群
2中的时间稍微快一点),
但
每个作业之间的时间在2中比1中要高得多。 驱动程序和执行
浏览 2
提问于2017-01-26
得票数 3
3
回答
火花火花与火花-提交
、
有关火花提交的文件如下: 您还可以使用bin/pyspark启动交互式Python。这个问题听起来很愚蠢,但是当我通过pyspark运行命令时,它们也运行在“
集群
”上,对吗?它们不只是在主节点上运行,对吗?
浏览 0
提问于2016-04-28
得票数 4
回答已采纳
1
回答
在不同的
模式
和不同的
集群
管理器中,Smart-submit.sh是如何工作的?
、
在Apache中,Smart-submit.sh如何在不同的
模式
和不同的
集群
管理器中工作?具体地说: 在程序员看来
浏览 1
提问于2020-03-14
得票数 3
4
回答
纱线
簇上的PySpark分布式处理
、
、
、
我在ClouderaCDH5.3
集群
上运行了Spark,使用Spark作为资源管理器。我正在用Python (PySpark)开发火花应用程序。我可以提交作业,它们可以成功地运行,但是它们似乎从来
不
运行在多台机器上(我提交的本地机器)。我尝试过多种选择,比如将部署
模式
设置为
集群
,--主从于
纱线
客户端和
纱线
集群
,但它似乎从未在多台服务器上运行过。我可以通过传递类似--主local8之类的东西,让它在多个核心上运行,
但
这显然不会在多个节点上分发处理。joe
浏览 3
提问于2015-01-30
得票数 12
回答已采纳
3
回答
部署
模式
客户端和主yarn客户端之间有什么关系
我使用
spark-submit
来运行我的spark程序,我使用--deploy-mode client和--master yarn-client来设置parameter.My问题: Q1:是不是说--deploy-modeQ2:--deploy-mode客户端是否意味着我的程序只在一台机器上运行,而不是在
集群
上运行,因为我在日志中找到了以下信息:所有任务在本地主机上完成。
浏览 0
提问于2015-12-29
得票数 3
1
回答
如何使用JDBC从Oracle读取数据集?
、
、
、
、
当我以
相同
的方式启动主程序和辅助程序时,但是在eclipse中创建scala项目并连接到主程序时,如下所示: val sparkSession = SparkSession.builder..appName
浏览 1
提问于2017-07-14
得票数 1
回答已采纳
2
回答
按给定
集群
配置Spark
、
、
、
、
我必须用python将一些应用程序发送到Apache Spark
集群
。这里给出了一个
集群
管理器和一些工作者节点,这些节点具有要将应用程序发送到的地址。我的问题是,如何在我的本地计算机上设置和配置Spark,以便将这些请求与要计算的数据一起发送到
集群
? 我正在使用Ubuntu 16.xx,并且已经安装了java和scala。我已经搜索了inet,
但
最多的发现是如何构建
集群
或一些旧的建议如何做,这是过时的。
浏览 16
提问于2016-09-16
得票数 0
回答已采纳
1
回答
spark-submit
集群
模式
不
适用于
python spark,
但
适用于
scala spark
、
、
、
、
我有一个
集群
,其中我们有集成了spark的hadoop设置。spark版本是spark v2.0.0,当您在
集群
模式
下部署scala spark时,它可以正常工作。以下是命令:
spark-submit
--class org.apache.spark.examples.SparkPi --deploy-mode cluster --master yarn /usr/local/spark-bkp-24apr/examples/jars/spark-examples
浏览 25
提问于2019-02-14
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券