腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Spark
UI
中
的
调度
器
延迟
较长
、
、
我在yarn上
的
2.3.0集群上运行pyspark作业。我发现所有的阶段都有很长
的
调度
延迟
。但是-这只是最大
的
时间,第75个百分位数是28ms ...所有其他时间指标都非常低(GC时间、任务期望等)几乎没有随机写入大小。局部性在大部分节点本地、进程本地和机架本地之间变化。
调度
器
延迟
时间如此之长
的
原因是什么?它是纱线,还是仅仅是缺少资源来运行任务?增加/减少分区对这个问题有帮助吗?
浏览 20
提问于2019-07-01
得票数 1
1
回答
在
Spark
中
通过公平
调度
实现并发
、
、
、
我
的
环境:我正在尝试通过
Spark
Thrift服务
器
连接Cassandra。然后,我在Hive Metastore
中
创建一个Meta-Table,其中包含Cassandra表数据。在web应用程序
中
,我通过JDBC驱动程序连接到元表。我已经为
Spark
Thrift服务
器
启用了公平
调度
。当我检查
Spark
UI
时,所有作业
的
执行时间都不到100毫秒。我还注意到,当收到请求时,作业和任务处于挂起阶段
浏览 10
提问于2018-08-16
得票数 0
2
回答
星火
调度
延迟
的
求取
我希望能够为每个任务生成一个度量表,比如当您访问特定阶段时,收集
器
Spark
上
的
表。
调度
程序
的
延迟
是如何计算
的<
浏览 5
提问于2016-06-23
得票数 2
回答已采纳
1
回答
Apache访问RDDs
的
内部数据?
、
、
pagecounts.checkpoint场景#2pagecounts.count 在这两种情况下,
Spark
应用程序
UI
中
显示
的
总时间是不同
的
。在场景1
中
,检查点命令什么也不做,它既不是转换,也不是操作。据说,一旦RDD在操作后变为现实,就继续保存到磁盘
中
。我是不是漏掉了什么?
Spark
应
浏览 3
提问于2015-09-30
得票数 3
回答已采纳
1
回答
在cpu.cfs_period_us中使用更长/更短
的
周期有什么好处?
、
、
这里有一些关于参数
的
信息: cpu.cfs_period_us:用于带宽决定
的
每个
调度
程序周期
的
持续时间(以微秒为单位)。这默认为1000000 to或100 to。更长
的
周期将以牺牲
延迟
为代价来提高吞吐量,因为
调度
程序将能够在更长
的
时间内支持cpu绑定
的
工作负载。对于较小
的
周期则相反。请注意,这只会影响由CFS
调度
程序
调度
的
非RT任务。cpu.cfs_quot
浏览 0
提问于2018-12-17
得票数 4
回答已采纳
1
回答
如何在
Spark
Streaming上下文中创建作业日志?
、
、
我目前正在对我
的
Spark
流媒体应用程序进行性能测试。总而言之,我通过套接字连接接收JSON消息,每秒一条消息。然后,我使用
Spark
Streaming方法将消息作为RDDs处理,最后将生成
的
RDDs打印到数据库。这是我
的
问题:每当我想要检查块处理时间或
调度
延迟
等时,我需要转到端口4040上
的
Spark
UI
。 我想做
的
是在程序运行时使用这些值创建一个Log,并将其作为txt文件存储在某个目录<e
浏览 0
提问于2016-05-06
得票数 1
1
回答
为什么web用户界面在作业和阶段页面
中
显示不同
的
持续时间?
、
我正在运行一个虚拟
的
spark
作业,它在每次迭代
中
执行完全相同
的
一组操作。下图显示了30次迭代,其中每个作业对应于一个迭代。可以看到,除了作业0、4、16和28之外,持续时间始终在70ms左右。第一次加载数据时,作业0
的
行为是预期
的
。 我想知道
Spark
把(2000 - 64)毫秒花在工作16上了吗?
浏览 2
提问于2017-06-26
得票数 1
2
回答
如何在没有30秒启动惩罚
的
情况下启动
spark
应用程序?
、
当做
spark
-submit需要30秒才能做任何事情时,我相信它绑定到sparkmaster上
的
一个端口,创建sparkcontext,分配执行
器
,jvm startup.etc我尝试使用local:/读取jar,这似乎可以节省几秒钟
的
时间
浏览 0
提问于2019-08-22
得票数 4
2
回答
如何在web
UI
中
更改作业/阶段描述?
当我在Apache
Spark
上运行作业时,web
UI
给出了一个类似于以下内容
的
视图:虽然这对我作为开发人员来说非常有用,但我认为阶段描述
中
的
行号对我
的
支持团队并不是很有用。为了让他们
的
工作更轻松,我希望能够为我工作
的
每个阶段以及工作本身提供一个定制
的
名称,如下所示:这是可以在
Spark
中
完成
的
事情吗?如果是这样,我该怎么做呢?
浏览 0
提问于2017-01-28
得票数 25
回答已采纳
1
回答
为什么
spark
streaming executors会在不同
的
时间启动?
、
、
我使用
的
是
Spark
streaming 1.6,它使用kafka作为源num-executors 5batch Interval10 secblockInterval 350 ms
浏览 1
提问于2016-07-15
得票数 2
回答已采纳
1
回答
使用RabbitMQ时,在正确处理消费者后传递了两次消息
、
、
我在我
的
消费者上配置了MassTransit (RabbitMQ)。重试策略是在有最多5个间隔
的
超时时重新发送消息。y.RoutingKey = massTransitSettings.RoutingKey; }); 一切正常工作,除了有时,当两个连续
的
超时发生在同一条消息
浏览 8
提问于2022-02-19
得票数 0
回答已采纳
1
回答
定时
器
过期
、
、
我使用
的
是周期性计时
器
,并在接收到两个SIGALRM信号之间进行计时。我观察到
的
是,itimer可能会在我设置
的
时间之前或之后一点过期。计时
器
过期时间不应该总是大于设定值吗?更少
的
时间是我不明白
的
。下面是我
的
代码:#include <stdio.h>#include <sys/time.h> #include <
浏览 0
提问于2012-10-03
得票数 0
回答已采纳
1
回答
火花流-获得批处理级别的性能状态。
、
、
、
我正在设置一个Apache
Spark
集群来执行实时流计算,并希望通过跟踪各种指标(如批大小、批处理时间等)来监视部署
的
性能。我
的
Spark
Streaming程序是用Scala编写
的
退出状
浏览 4
提问于2017-04-11
得票数 2
回答已采纳
2
回答
什么是
调度
器
延迟
在火花
UI
的
事件时间线
当我打开一个火花应用程序
的
应用程序主程序时,我在一个阶段中看到了很多Scheduler Delay。其中有些甚至超过10分钟。我想知道他们是什么,为什么要花这么长时间?更新:通常像aggregateByKey这样
的
操作在执行程序真正开始执行任务之前需要花费更多
的
时间(即
调度
程序
延迟
)。为什么会这样呢?
浏览 3
提问于2015-07-23
得票数 17
3
回答
如何防止
Spark
Executor在使用YARN客户端模式时丢失?
、
我有一个
Spark
作业,它在本地运行良好,但数据较少,但当我在YARN上
调度
它执行时,我不断收到以下错误,慢慢地所有执行
器
都从
UI
中
删除,我
的
作业失败我使用以下命令在yarn客户端模式下
调度</em
浏览 0
提问于2015-07-30
得票数 52
回答已采纳
1
回答
在它们之间播放一系列
的
视频片段。
、
我想在给定
的
间隔后播放每个声音,例如200毫秒。尽管下面的方法适用于
较长
的
延迟
(700到1000毫秒),但并不是太精确。对于短暂
的
延迟
,有时声音“堆在一起”,并迅速地连续播放。我尝试过
的
(某种伪代码): clip.start(); } 我猜这与JVM/OS
的
线程
调度
有关.编
浏览 3
提问于2012-03-22
得票数 1
2
回答
链接
延迟
函数
、
我想运行
延迟
函数作为下划线链
的
一部分。似乎
延迟
函数只能使用传递
的
显式参数--而不是包装
器
对象。此代码不工作(未定义
的
不是函数异常): var txt = text; _.delay(function (m) { m.Show(); }, 1
浏览 2
提问于2014-12-29
得票数 0
回答已采纳
1
回答
Spark
流
调度
延迟
恢复技术
、
、
、
我们有一个
Spark
流媒体应用程序,它基本上没有几个小时
的
调度
延迟
,但是突然它跳到了几分钟并失控地螺旋上升: 我们真的不愿意进一步增加批处理间隔,因为对于如此长
的
时间段,
延迟
为零。有没有什么技术可以从
调度
延迟
浏览 2
提问于2016-06-18
得票数 4
1
回答
火花流卡夫卡直接流处理时间性能尖峰
、
、
我有一个星火流作业,它使用直接
的
方法从Kafka集群读取数据。在处理时间上有一个周期性
的
高峰,我无法理解,并且没有反映在
Spark
度量
中
。下面的图像显示了这个模式(批处理时间= 10s):这个问题在每次工作运行时都是可重复
的
。卡夫卡日志
中
没有要读取
的
数据,因此没有真正
的
处理,值得注意
的
是,要执行。我希望行是平
的
,接近最小值来序列化任务并将任务发送到执行程序。 模式是一个作业需要9秒(这有5秒
的</
浏览 1
提问于2015-11-30
得票数 2
1
回答
Nios 2
的
C和程序集轮询
、
、
、
、
我认为如果我在
延迟
子例程
中
添加了一个call pollkey,那么它为什么不能工作呢?但我想每毫秒都进行一次轮询,我认为我能做到
的
唯一方法就是调用dely子例程
中
的
pollkey,但是如果这样做,就好像什么都没发生一样。我以前问过怎么做,只有在C
中
才能得到答案,而我认为答案应该是更改程序集。 我使用br而不是call获得了更好
的
结果,所以我必须检查差异。这就是我用
的
更好
的
方法: .equ delaycou
浏览 5
提问于2013-09-06
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
腾讯会议
活动推荐
运营活动
广告
关闭
领券