spark ui中的持续时间、处理时间和批处理持续时间有什么不同？_Spark UI输出操作持续时间与作业持续时间:有什么区别？_spark广播变量中的getvalue()方法和value()方法有什么不同 - 腾讯云开发者社区

apache-spark、spark-streaming

我的应用程序在Spark UI中的作业持续时间如下：请注意，批处理时间通常比作业持续时间长。那么，它们之间的区别是什么呢？

浏览 0提问于2016-01-15得票数 1

2回答

spark ui中的持续时间、处理时间和批处理持续时间有什么不同？

apache-spark、spark-ui

如下图所示，spark UI中的时长、批量时长和处理时间有什么区别？谢谢 Spark UI Picture

浏览 50提问于2020-04-28得票数 0

回答已采纳

1回答

理解流应用程序的Spark

apache-spark、spark-streaming、spark-ui

我试图理解我的星火UI中的条目意味着什么。调用一个操作会导致创建一个作业。我发现很难理解新StreamingContext(spar

浏览 0提问于2018-03-21得票数 1

1回答

Spark UI输出操作持续时间与作业持续时间:有什么区别？

spark-streaming

在Spark UI页面上，"Output Op Duration“和"Job Duration”这一列有什么区别？

浏览 10提问于2016-08-03得票数 5

回答已采纳

1回答

与Spark资源使用相关的疑虑

apache-spark、spark-streaming、rdd

我正在执行Spark Streaming应用程序，并且正在缓存rdds用于历史回顾，我的批处理持续时间为1分钟，平均处理时间为14秒，因此执行器不会计算整个批处理持续时间。当我在内存中缓存rdd时，执行器也是如此。如果执行者被拖延，我们是否应该认为这种拖延执行者是浪费资源。

浏览 14提问于2017-06-29得票数 0

1回答

火花结构化流媒体应用程序中的死执行者

apache-spark、spark-streaming、spark-structured-streaming

我有一个简单的流媒体工作，它从卡夫卡主题中提取数据并将其推送到S3。\ .trigger(processingTime='150 seconds')\触发时间是我的星火配置在此工作的下面。但是当我检查我的星星之火时，我看到了很多死去的执行者。这些死去的刽子手还在不断增加。每一批150秒，我正在

浏览 8提问于2020-10-27得票数 2

回答已采纳

1回答

kafka max.poll.records不适用于火花流。

apache-spark、apache-kafka、spark-streaming、kafka-consumer-api

我的火花流版本是2.0，kafka版本是0.10.0.1，火花流-kafka-0-10_2.11。我使用直接的方式获得卡夫卡的记录，我现在想限制我在一批中获得的信息的最大数量。星星之火中的消费者数量是卡夫卡中的分区数?那么火花流中记录的最大数量是max.poll.records*consumers？

浏览 1提问于2018-09-27得票数 2

1回答

OSRM: /路由/v1/驱动中相同(子)路由的-different距离/持续时间

osrm

我使用OSRM检索数百万短途的持续时间/距离。这应该是正常的，直到我发现调用一个单独的骑行并不会导致与批处理请求相同的持续时间/距离。持续时间: 268.3 奇怪的是，网上的结果是一样的，但与我的离线结果不同。后者可能是由于设置(我根本没有更改)，但我不明白为什么批处理和单个调用是不

浏览 0提问于2018-08-03得票数 0

回答已采纳

1回答

Spark Streaming与Kafka实时集成

apache-spark、spark-streaming

我集成了Spark Streaming Process和Kafka来阅读特定的主题。创建了Spark上下文，轮询时间为5秒，运行正常。或者有没有其他更好的选择来处理这种情况。

浏览 0提问于2018-05-05得票数 0

1回答

在纱线上使用火花流的动态分配，而不是缩小执行器

apache-spark、spark-streaming、apache-spark-2.2

我在yarn集群上使用spark-streaming (spark version 2.2)，并尝试为我的应用程序启用动态内核分配。executor的数量可以根据需要增加，但是一旦分配了executor，即使流量减少了，它们也不会缩小，也就是说，一旦分配了executor就不会被释放。我在spark-submit命令中设置的配置如下： --conf spark.dynamicAllocation.enabled=false \

浏览 19提问于2018-12-25得票数 1

回答已采纳

1回答

为什么Spark* UI中的总正常运行时间不等于所有作业持续时间的总和*

apache-spark、spark-ui

我运行Spark Job，并尝试更快地调优它。奇怪的是，总的正常运行时间是1.1小时，但我把所有的工作时间加起来。只需要25分钟。我很好奇为什么Spark UI中的总正常运行时间不等于所有作业持续时间的总和？但所有作业持续时间

浏览 4提问于2020-09-08得票数 0

1回答

火花结构流-输入速率中的尖峰减少批持续时间

apache-spark、spark-streaming、spark-structured-streaming

我遇到了一些东西，乍一看，星火流新手似乎是违反直觉的：这可能不是最精确的图片，但我看到了更清晰的图案。接下来，我需要澄清是如何触发小型<em

浏览 1提问于2019-09-23得票数 0

3回答

Spark Streaming中的窗口？

apache-spark、spark-streaming

在spark streaming中，我们接收的DStreams是一批RDDs。那么窗口如何进一步提供帮助呢？据我所知，它还批处理RDDs。如果我错了，请纠正我( Spark Streaming的新手)。

浏览 4提问于2015-10-08得票数 7

回答已采纳

2回答

Spark Structured StreamingQueryListener.onQueryProgress不是针对每个微批调用的吗？

apache-spark、spark-structured-streaming、spark-kafka-integration

我正在使用Spark 3.0.2，我有一个流作业，它消耗Kafka中的数据，触发持续时间为"1分钟“。我在Spark UI中看到，按照定义，每1分钟就会有一个新作业，但我看到onQueryProgress方法每5到6分钟被调用一次。我认为这个方法应该在每个微批之后直接调用。有没有办法控制这个持续时间，使其等于触发持续时间？

浏览 8提问于2021-04-19得票数 1

2回答

火花流执行流

apache-spark、spark-streaming

我是“星火流”的新手，我对同样的事情有一些怀疑我们总是需要一个以上的执行人，还是我们可以做好我们的工作？我正在使用createDirectStream从卡夫卡提取数据，这是一种减少接收量的方法，批处理持续时间为一分钟，因此，我的数据被接收一批，然后在其他批处理期间处理，或者同时处理。如果是同时处理，那么如何确保我的处理在批处理</e

浏览 2提问于2017-06-20得票数 1

2回答

星火流mapWithState似乎周期性地重建完全状态

scala、apache-spark、spark-streaming

整个状态由3GB处理，集群中的每个节点都可以处理该状态。在每个批处理中，一些数据被添加到一个状态中，但直到进程结束时(即15分钟)才会被删除。在遵循应用程序UI时，与其他批处理相比，每10批批处理的处理时间非常高。见图片：黄色字段代表较高的处理时间。一个更详细的作业视图显

浏览 0提问于2016-03-16得票数 16

回答已采纳

5回答

批处理文件中HH:MM:SS次数的算术运算

batch-file、cmd

在我的一个批处理脚本中，我需要计算视频文件中间隔的持续时间。首先，要求用户输入开始和结束时间：set /p EndPosition=End position (HH:MM:SS): 然后，我希望批处理脚本在中间计算持续时间。我如何从这样的%StartPosition%中减去%EndP

浏览 5提问于2017-03-05得票数 1

回答已采纳

2回答

Spark流到配置单元，每个分区有太多小文件

apache-spark、hadoop、hive、apache-kafka、spark-streaming

我有一个spark流作业，批处理间隔为2分钟(可配置)。dataset.coalesce(1).write().mode(SaveMode.Append).insertInto(targetEntityName)；现在传入的数据并不是那么大，如果我将批处理持续

浏览 0提问于2018-03-20得票数 2

1回答

Azure服务总线/服务结构消息未从队列中删除

c#、azure、azureservicebus、azure-service-fabric、azure-servicebus-queues

它的工作方式是侦听服务总线上的消息，然后根据消息内容进行处理。目前，计算工作正常，但如果计算时间超过一分钟左右，则消息在完成后不会从队列中删除。在工作者角色中，我们通过增加"AutoRenewTimeout“来解决这个问题。我使用作为引用来设置实际运行计算的无状态服务。下面是对无状态服务进行初始化的CalculateService.cs的摘录。

浏览 3提问于2016-09-08得票数 7

回答已采纳

1回答

使用计时器进行批处理操作

micrometer、spring-micrometer

我是使用测微计的新手，我正在尝试看看是否有一种方法可以使用计时器，该计时器还可以在批处理场景中包含项目数量的计数。因为我是使用Java streams处理批处理的，所以我没有看到一种明显的方法来记录处理的每个项目的计时器，所以我在寻找一种方法来设置批处理大小属性。我认为一种可行的方法是使用的FunctionTimer，但我认为这需要应用程序维护一

浏览 0提问于2019-04-19得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Spark Streaming中的"Job Duration“和"Batch Processing Time”有什么区别？

spark ui中的持续时间、处理时间和批处理持续时间有什么不同？

理解流应用程序的Spark

Spark UI输出操作持续时间与作业持续时间:有什么区别？

与Spark资源使用相关的疑虑

火花结构化流媒体应用程序中的死执行者

kafka max.poll.records不适用于火花流。

OSRM: /路由/v1/驱动中相同(子)路由的-different距离/持续时间

Spark Streaming与Kafka实时集成

在纱线上使用火花流的动态分配，而不是缩小执行器

为什么Spark* UI中的总正常运行时间不等于所有作业持续时间的总和*

火花结构流-输入速率中的尖峰减少批持续时间

Spark Streaming中的窗口？

Spark Structured StreamingQueryListener.onQueryProgress不是针对每个微批调用的吗？

火花流执行流

星火流mapWithState似乎周期性地重建完全状态

批处理文件中HH:MM:SS次数的算术运算

Spark流到配置单元，每个分区有太多小文件

Azure服务总线/服务结构消息未从队列中删除

使用计时器进行批处理操作

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐