腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Spark
中
的
两个
作业
可以
并行
运
行吗
?
我对
Spark
的
工作,阶段,任务感到困惑。 我知道
两个
阶段和任务
可以
并行
运行。但由于我所有的开发都是在独立
的
集群上进行
的
,所以我怀疑
Spark
是否
可以
并行
运行
两个
作业
。因为当我在
作业
页面上打开事件时间线时,我从未看到
两个
作业
并行
/重叠运行。谢谢!
浏览 30
提问于2018-02-21
得票数 0
回答已采纳
1
回答
即使是在
并行
线程中提交,
Spark
也会按顺序执行联接。
、
、
我在
Spark
中
的
驱动程序节点上运行了4个
并行
线程,它们做同样
的
事情,但是使用不同
的
数据。
Spark
确实
并行
执行所有提交
的
作业
,直到有一个联接。此时连接操作是按顺序执行
的
。这就是SparkUI所展示
的
: 我能做些什么使连接
并行
运
行吗
?更新:
spark
-submit -
浏览 0
提问于2018-12-05
得票数 0
回答已采纳
1
回答
如何在独立模式下
并行
运行
两个
火花
作业
、
、
我有火花
作业
,在其中我处理一个文件,然后执行以下步骤。2.Run some aggregations on dataframe and save to cassandrawriteToES(df)现在这
两个
操作一个接一个地运行。然而,这两者
可以
并行
运行。我
可以
做
两
浏览 0
提问于2018-04-04
得票数 9
1
回答
动态资源分配和排队应用程序
、
、
、
、
根据这个 启用星火动态资源分配时,所有资源都分配给第一个可用
的
提交
作业
,从而导致随后
的
应用程序排队。若要允许应用程序
并行
获取资源,请将资源分配到池中并运行这些池中
的
应用程序,并允许抢占在池中运行
的
应用程序。我自己也观察到了这种行为,但是我目前正在处理一个小集群,只有
两个
节点(m3.xlarge在EMR上)和一个主节点(r3.xlarge)。现在,这可能是因为我阅读
的
文件大约是2GB,而且我
的
资源已经用完了。我还尝试使用
Spa
浏览 10
提问于2017-10-31
得票数 0
1
回答
Jenkins多任务插件不会在不同节点上
并行
执行相同
的
任务
我在MultiJob插件
中
配置为一个阶段,在
两个
不同
的
节点上运行相同
的
任务。例如:Download Files for Node WINDOWSVM 是否
可以
调用相同
的
作业
,但由于它们
浏览 1
提问于2014-12-03
得票数 0
回答已采纳
1
回答
在
spark
作业
中使用Future
、
我想同时在一个RDD上执行
两个
操作。我曾经写过这样
的
代码val sc = new SparkContext(conf) formSubmissionDataFrame.save("/foo/", "com.databricks.
spark
.avroval df
浏览 2
提问于2016-03-13
得票数 3
1
回答
如何将YARN配置为分配最小数量
的
容器?
、
我在一个纱线集群上
并行
运行多个
Spark
作业
。我发现YARN
并行
启动了许多这样
的
作业
,但只为驱动程序分配了一个容器,而没有分配执行器。这意味着这些
Spark
作业
实际上处于闲置状态,等待executor加入,此时
可以
通过将executor分配给其他
作业
来更好地利用这种处理能力。我希望将YARN配置为至少为一个
作业
分配
两个
容器(一个驱动程序+一个执行器),如果不可用,则将其保留在队列<
浏览 0
提问于2020-05-22
得票数 1
1
回答
Spark
MLLIB
并行
多节点
、
由"
spark
mllib“提供
的
机器学习算法
可以
像naive byes,随机森林一样在
spark
集群上以
并行
模式运
行吗
?或者我们需要修改代码?请提供一个
并行
运行
的
示例?不确定MLLIB
中
的
并行
性是如何工作
的
(map) -因为每个处理都需要整个训练数据集。计算是否与训练数据
的
子集
并行
运行?谢谢
浏览 0
提问于2016-03-06
得票数 3
1
回答
星火集群环境下
并行
作业
运行时星火数据集错误值
、
、
、
.set("
spark
.executor.instances","8") .set("
spark
.driver.memoryOverh
浏览 2
提问于2018-06-14
得票数 0
1
回答
在
spark
-submit命令
中
设置default.parallelism
、
、
在执行
spark
-submit
作业
时,更改默认
并行
度
的
语法是什么?在提交
spark
作业
时,我
可以
通过以下命令指定executor、executor内核和executor内存
的
数量:
spark
-submit --num-executors 9 --executor-cores5 --executor-memory 48g 在conf文件中指定
并行
度为:
spark
.conf.set("<e
浏览 41
提问于2020-09-27
得票数 0
回答已采纳
1
回答
如何在不使用Oozie、Airflow等工作流管理器
的
情况下,在Apache
Spark
中
执行工作流
的
顺序/
并行
任务?
、
我
的
工作流程由几个任务(顺序和
并行
)组成,包括从Hbase收集数据和对这些数据执行各种机器学习算法等。 有没有可能不使用工作流管理器就在Apache
Spark
中
执行它们?我问
的
原因是我有一个算法来对任务进行批量排序(
可以
一起运行
的
任务)。我
可以
直接提交给
Spark
吗?
浏览 20
提问于2019-10-23
得票数 0
回答已采纳
1
回答
是否有可能运行多个
并行
写入S3
的
Spark
结构化流
作业
?
、
、
、
我正在尝试运行多个星火结构化流
作业
(在EMR上),这些
作业
从卡夫卡主题中读取并写入S3
中
的
不同路径(每个路径在各自
的
任务
中
执行)。我已经将我
的
集群配置为使用。下面是我试图运行
的
代码片段: .readStream \ .option("kafka.bootstrap.serversCHECKPOINT_LOCATION&
浏览 2
提问于2020-06-15
得票数 1
1
回答
spark
.executor.cores Vs
spark
.executor.instance我应该增加哪一个?
为了
并行
化
spark
作业
,
可以
同时增加内核数量和执行器实例数量。这里
的
权衡是什么?应该如何选择这
两个
配置
的
实际值?
浏览 1
提问于2020-06-01
得票数 0
1
回答
如何通过AWS数据管道在AWS EMR集群
中
运行多个
并行
spark
作业
、
、
我正在尝试使用AWS Data PipeLine在电子病历集群
中
设置一个运行
spark
作业
的
流程。我们
的
流程按“随需应变”计划运行。作为本活动
的
一部分,我们首先在管道
中
创建一个EMR集群,然后希望在一个emr集群上
并行
运行多个
spark
作业
。 有没有一个我们
可以
用“随需应变”
的
时间表在数据管道上运行
并行
作业
。
浏览 0
提问于2017-09-22
得票数 1
1
回答
火花纱簇仍未得到充分利用
、
、
然后我创建了一个RDD,它有72个分区,rdd = sc.parallelize(arg_list, len(arg_list)) 运行一个名为gensim
的
Python包,使用读取
的
两个
文件
的
内容执行NLP任务。因为我每个节点
可以</
浏览 0
提问于2018-05-25
得票数 0
1
回答
在oracle
中
可以
同时执行插入和删除操作吗?
让know.If感到好奇
的
是,正在运行
两个
作业
,一个是插入表,另一个是从表
中
删除一些行。这
可以
并行
执
行吗
?该表包含300列,数据为50 The。如果我们这样做,它会以死锁告终吗?
浏览 3
提问于2014-12-02
得票数 0
1
回答
理解火花异步操作
、
、
我有一个用于
Spark
的
Java代码: } voidJavaFutureAction1.get(); 有
两个
我在等待火花在同一时间做
两个
不同
的</em
浏览 4
提问于2017-09-21
得票数 2
回答已采纳
3
回答
如何
并行
运行多个火花
作业
?
因此,我必须
并行
运行多个
作业
,以便所有查询同时启动。 如何
并行
运行多个
作业
?
浏览 0
提问于2018-03-30
得票数 21
0
回答
增加独立模式下
的
并行
任务数
我有一个集群独立模式
的
远程
spark
集群,它只包含一台带有2个处理器内核
的
机器。"cluster“包含master和一个worker。应用程序发送长时间运行
的
作业
,
作业
对CPU工作
的
要求不高,但会对远程服务进行多次调用。换句话说,我使用
的
是类似
spark
的
任务调度器。在测试期间,我看到应用程序在同一时间发送例如5个任务,但只有2个
可以
并行
工作,另外3个在队列
中</
浏览 1
提问于2016-07-12
得票数 0
2
回答
对于YARN
中
的
单个队列,如何将state=RUNNING
中
spark
应用
的
数量限制为1?
、
、
我有很多火种
的
工作。通常,我将我
的
spark
作业
提交给yarn,我有一个选项是--yarn_queue,它告诉它进入哪个yarn队列。 但是,这些
作业
似乎在同一队列
中
并行
运行。有时,一个
spark
作业
的
结果是下一个
spark
作业
的
输入。如何在同一队列
中
按顺序而不是
并行
运行我
的
spark
浏览 1
提问于2017-03-03
得票数 3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Spark 运行架构以及常用组件
Spark实战(5)_Spark Core核心编程
Spark之数据倾斜
Spark 核心编程RDD的使用(1)
大数据之spark基础知识
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
腾讯会议
活动推荐
运营活动
广告
关闭
领券