腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(3825)
视频
沙龙
2
回答
如果
总
核
数
保持一致
,
如何
选择
executor
个数
和
每个
executor
核
个数
?
apache-spark
、
parallel-processing
、
executor
假设我正在使用一个具有2个i3.metal实例的集群,
每个
实例都有512GiB内存
和
72个vCPU核心()。
如果
我想使用所有的核心,我需要对执行器
和
每个
执行器的核心进行一些配置,这样就可以得到144个核心。这似乎有很多
选择
;例如,我可以有72个执行器,
每个
执行器有2个核心,或者我可以有36个执行器,
每个
执行器有4个核心。无论哪种方式,我最终都会得到相同数量的内核
和
每个
内核相同的内存量。我
如何
在这两种
浏览 37
提问于2019-11-15
得票数 1
1
回答
配置火花应用程序参数的最佳启动方式是哪一个?
apache-spark
、
pyspark
可用执行者
数
=(
总
核
/num-
核
-
每个
执行者)= 150/5 = 30
每个
节点的执行者
数
考虑另一个示例,其中集群确认为:6个节点、25个核心节点
和
每个
节点125 GB内存(例如来自)。推荐的配置是:--num-
executor
30 --
executor
-<e
浏览 2
提问于2019-01-24
得票数 1
1
回答
执行者能在火花中共享核心吗?
memory
、
parallel-processing
、
apache-spark
、
pyspark
、
mesos
在配置火花作业时,我有时会看到有人建议
每个
执行器的
核
数
大于
核
总数除以执行器的数量。值得注意的是,在这个中,@0x0FFF建议如下:
如果
我们计算执行器核心的总数,就会得到4 cores per
executor
* 4 executors total = 16 cores total。然而,在问题的开头,它说:“我有一个NameNode
浏览 3
提问于2015-12-12
得票数 1
回答已采纳
1
回答
用缓存扩展堆内存
apache-spark
、
pyspark
容器对运行执行器的最大内存大小由spark.
executor
.memoryOverhead、spark.
executor
.memory、spark.memory.offHeap.size
和
spark.
executor
.pyspark.memory编辑 使用更大的执行程序(两次内存
和
两次内核)也可以弥补这一点。
浏览 5
提问于2021-03-08
得票数 3
回答已采纳
4
回答
更改Shell的执行器内存(
和
其他信任)
apache-spark
如何
更改的执行器内存(
和
其他信任)? 特别是,我想给平底鞋火花壳,类似-火花-核心-max=12,当我启动它,以便我的工作在火花外壳将使用这些配置设置。
浏览 4
提问于2014-04-09
得票数 37
回答已采纳
1
回答
是什么控制了一个应用程序拥有多少星团?
resources
、
apache-spark
在用于静态分区的docs 的这一页中,它说“使用这种方法,
每个
应用程序都会获得它可以使用的最大资源数量”。在另一个类似的注意事项上,是否有办法改变
每个
作业或任务级别上所要求的内存?
浏览 3
提问于2015-01-14
得票数 10
回答已采纳
2
回答
从csv文件的大型集合中将记录插入到表中
apache-spark
、
hive
、
hiveql
每个
文件的大小从几个KBs到250 KBs不等。我需要将这些csv文件的值插入一个名为RECORD的表中。在插入时,我还需要参考其他一些表(参数
和
FRAME_RATE)。所以,我把
executor
.memory提高到了4g。失败。我把
executor
.memory增加到6g。失败。最后,我把spark.
executor
.memory提高到了12g。成功。将spark.
executor
.memory增加到12g,
每个
节点只产生一个执行器,因此只有6个执行器。$apache
浏览 3
提问于2017-06-12
得票数 0
8
回答
Apache Spark:内核数量与执行器数量
hadoop
、
apache-spark
、
hadoop-yarn
我正在尝试理解在YARN上运行Spark作业时核心数
和
执行器
数
之间的关系。测试环境如下: 网络:1 1GbSpark19G --
executor
-cores 7 --num-executors 3 (
每个数
据节点的执行器,使用与cores)--master yarn-client --
execut
浏览 262
提问于2014-07-08
得票数 220
2
回答
优化Spark
和
纱线配置
apache-spark
我们有一个由4个节点组成的集群,具有上述特征:Spark作业在处理过程中花费了很多时间,知道我们的作业是从RStudio运行的,而我们仍然有很多内存未被利用,我们
如何
优化这段时间。
浏览 0
提问于2017-09-12
得票数 0
1
回答
如何
计算火花作业中核心、执行器、内存的编号
scala
、
apache-spark
--
executor
-memory =? --num-executors =?
浏览 1
提问于2019-02-07
得票数 0
1
回答
使用Direct Kafka API运行spark流媒体应用所需的最佳资源是什么?
python
、
pyspark
、
apache-kafka
、
spark-streaming
我使用直接的Kafka API以1分钟的批处理间隔运行我的spark流媒体应用程序,并在我的应用程序代码中使用Pandas
和
Pyspark。下面是我的集群配置:3
个数
据节点,
每个数
据节点具有8
核
、12 my的容量。我已经提供了如下参数的spark-submit作业,--deploy-mode cluster--total-
executor
-cores
如果
我在申请处理的任何阶段错了,请纠正我?
浏览 14
提问于2017-08-28
得票数 1
1
回答
spark.
executor
.cores Vs spark.
executor
.instance我应该增加哪一个?
pyspark
为了并行化spark作业,可以同时增加内核数量
和
执行器实例数量。这里的权衡是什么?应该
如何
选择
这两个配置的实际值?
浏览 1
提问于2020-06-01
得票数 0
1
回答
在纱线模式下,是否应该将Apache的执行器核心数设置为1?
apache-spark
、
hadoop-yarn
、
apache-spark-2.0
我正在运行一个处理集群上数百万数据的应用程序,其中
每个
200 data nodes都有14 cores。当我在纱线上使用2
executor
-cores
和
150 executors时,它运行得很好,但是集群管理员之一要求我使用一个执行器核心。他指给我看Apache上的这个页面,其中说
executor
-core的默认值是1表示纱线。
如果
执行器使用1核心,不是单线程吗? 致以亲切的问候,
浏览 1
提问于2019-08-10
得票数 1
回答已采纳
2
回答
Kubernetes上的火花:执行者吊舱默默地被杀死
apache-spark
、
kubernetes
豆荚会突然停止计算,然后被直接移除,因此它们甚至不会停留在Error状态,从而无法挖掘
和
排除故障。他们就这么消失了。我只使用一个执行器启动作业,并在
executor
上执行了一个kubectl logs -f,并观察了驱动程序的输出(在客户端模式下运行)。对于4GB内存
和
默认内存拆分设置,40%是1400 40。 我能以某种方式限
浏览 1
提问于2020-08-18
得票数 5
回答已采纳
1
回答
Apache火花的最优内存分配
apache-spark
我是个新手,spark.driver.memory、spark.
executor
.memory
和
spark.driver.maxResultSize的含义对我来说还不太清楚。
浏览 2
提问于2017-07-16
得票数 1
2
回答
火花执行器、驱动程序、执行器核心、执行器内存的值
apache-spark
如果
集群上没有运行应用程序,
如果
要提交作业,那么Spark、
executor
核心、
executor
内存的默认值是多少?
如果
我们想要计算要提交的作业所需的火花执行器、执行器核心、执行器内存的值,您将
如何
做到这一点?
浏览 4
提问于2017-10-07
得票数 1
3
回答
SimpleAsyncTaskExecutor只触发8个线程
java
、
multithreading
、
spring-boot
、
asynchronous
我试图通过使用默认的SimpleAsyncTaskExecutor来理解Spring中@异步的行为(在这里,我没有明确地定义任何
Executor
)。但是,上面的代码会导致提交的前8个任务开始,其余的任务正在等待正在运行的任务完成,以便被捕获
和
执行。
浏览 0
提问于2019-09-19
得票数 2
回答已采纳
1
回答
spark-提交标准以设置参数值
apache-spark
spark-submit --deploy-mode cluster --name 'CoreLogic Transactions Curated ${var_date}' \/etl/scripts/corelogic/transactions/corelogic_transactions_curated.py\ --from_d
浏览 23
提问于2021-01-20
得票数 0
2
回答
Java Fork/Join与多线程在多核世界中的应用
java
、
multithreading
、
multicore
、
executorservice
、
fork-join
假设
每个
端点返回一
个数
字。把这个简单的故事记在心里。我有两个
选择
:
如果
他们被安排在同一个核心上,那么我们就有了使用不足的核心问题。
如果
他们被安排
浏览 2
提问于2015-08-24
得票数 1
3
回答
执行器ScheduledThreadPool“更多”线程池的影响是什么?
java
、
multithreading
、
threadpool
、
executorservice
、
threadpoolexecutor
我正在实例化我的
Executor
类,如下所示;
executor
.scheduleAtFixedRate(assignedToMeRunnable, 2, refreshTime, TimeUn
浏览 7
提问于2018-01-07
得票数 1
回答已采纳
点击加载更多
相关
资讯
Mybatis-Executor原理分析
Spark 运行架构以及常用组件
入门|三行Python代码,让数据预处理速度提高2到6倍
根本:详解receiver based Dstream
Spark 开启动态资源分配
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券