首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >使用部署模式集群的Apache Spark任务中的大调度器延迟

使用部署模式集群的Apache Spark任务中的大调度器延迟
EN

Stack Overflow用户
提问于 2016-11-28 23:34:02
回答 1查看 1.5K关注 0票数 6

--master yarn --deploy-mode cluster中使用spark-submit命令会导致更大的调度程序延迟,而不是使用--master yarn --deploy-mode client

任务性能结果屏幕截图:

这主要涉及在RDDs上调用collect操作的作业。

client模式下启动spark应用程序大约需要3-4分钟,而在cluster模式下需要6-7分钟。阶段内每个任务的大小小于100KB。集群有8个数据节点,运行Cloudera Manager 5.9.0

EN

回答 1

Stack Overflow用户

发布于 2019-05-01 16:13:04

这种特殊情况的解决方案。该问题是由群集基础设施中的以太网电缆损坏引起的。更换后,时间大大缩短。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/40848045

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档