腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
是否
保证
在
波束
中
的
窗口
触发器
之后
处理
延迟
数据
?
、
如果我按照下面的方式使用允许
的
延迟
进行
窗口
操作: Window.AfterPane.elementCountAtLeast(1))) .withAllowedLateness(Duration.standardMinutes(5)) 这将提供给一个组合函数,然后使用SpannerIO将结果写入
数据
库如果新项目在
窗口
结束后立即到达,将导致
延迟
激发。我
的
理解是combine函数和DB write将作为这两个
触发器
的
浏览 8
提问于2021-10-07
得票数 0
回答已采纳
2
回答
默认
窗口
和默认
触发器
如何在apache
波束
中
工作?
、
、
、
我试图用默认
触发器
实现默认
窗口
,以评估行为,但它不会产生任何结果。据阿帕奇·梁说: -- PCollection
的
默认
触发器
是基于事件时间
的
,当
波束
的
水印通过
窗口
的
末端时,会发出
窗口
的
结果,然后每次
延迟
数据
到达时都会触发。--如果您同时使用默认
窗口
配置和默认
触发器
,则默认
触发器
只发出一次,而
延迟</e
浏览 1
提问于2019-10-09
得票数 1
回答已采纳
3
回答
数据
流滑动
窗口
与带有
触发器
的
全球
窗口
?
、
、
我正在为一家电子商务公司设计一个废弃
的
篮子系统。系统将根据以下规则向用户发送消息:
浏览 2
提问于2019-02-01
得票数 2
2
回答
固定
窗口
触发
延迟
几分钟
在
Apache光束中使用已修复
的
窗口
。水印由事件时间设置。
在
Java
中
,
触发器
如何定义为在看到最后一个
数据
后2分钟发生?
浏览 1
提问于2019-07-05
得票数 0
1
回答
晚期
数据
我一直
在
阅读Dataflow SDK文档,试图找出当
数据
在
流作业
中
超过水印时会发生什么。本页: 注意:
数据
流
的
默认
窗口
和触发策略会丢弃后期
数据
。如果要确保管道
处理
延迟
数据
的
实例,则需要在设置PCollection
的
窗
浏览 3
提问于2016-05-16
得票数 5
回答已采纳
1
回答
Apache Beam
中
的
后水印
触发器
和默认
触发器
有什么区别?
、
、
、
根据Apache Beam文档 -- AfterWatermark
触发器
在
事件时操作。AfterWatermark
触发器
根据附加到
数据
元素
的
时间戳,
在
水印通过
窗口
结束后发出
窗口
的
内容。水印是一个全局进度度量,是Beam在任意给定点
的
管道内输入完整性
的
概念。只有当水印通过
窗口
结束时,AfterWatermark才会触发。PCollection
的
默认
触发器<
浏览 2
提问于2019-09-20
得票数 1
回答已采纳
1
回答
Apache梁:固定
窗口
的
触发器
、
根据文档,如果没有显式指定
触发器
,则会得到如下描述
的
行为: 如果未指定,默认行为是
在
水印通过
窗口
结束时首先触发,然后每次有
延迟
到达
数据
时再次触发。对于FixedWindow来说,这种行为也是正确
的
吗?例如,您将假设固定
窗口
应该在水印通过
窗口
结束后具有重复触发
的
默认
触发器
,并且除非显式
处理
延迟
数据
,否则丢弃所有
延迟
数据<
浏览 1
提问于2019-01-11
得票数 1
回答已采纳
1
回答
如何创建固定间隔内触发一次且仅触发一次
的
流束管道
、
、
但是,当我
在
Google上运行它时,有时它会在60秒
窗口
内触发不止一次。我猜这与
延迟
和无序信息有关。
浏览 2
提问于2019-07-30
得票数 0
1
回答
使用默认
触发器
在
windows中使用无界
数据
、
我有一个主题+订阅,并希望
在
中使用和聚合来自订阅
的
无界
数据
。我使用一个固定
窗口
并将聚合写入BigQuery。public static class Add
浏览 9
提问于2017-01-03
得票数 1
1
回答
如何在apache beam中生成序列号?
在
处理
我
的
输入时,我想在output JSON
中
添加一个新字段,该字段
的
值应该自动递增。Input列表{"name": "Akbar", "age": 20}添加序列号后期望
的
输出
浏览 1
提问于2020-04-20
得票数 0
2
回答
指定10分钟
窗口
的
正确触发+5分钟
延迟
缓冲区,只产生一个结果
、
我正在创建一个管道,它包含无界
数据
源并进行聚合计算。计算是
在
基于事件时间
的
10分钟
窗口
中完成
的
,对于迟到
的
事件则在5分钟缓冲区内完成。我希望
在
经过10分钟
窗口
和5分钟缓冲区后,只发出一次聚合结果。我不知道如何使
窗口
只发出一次结果。我相信正确
的
方法是使用AfterWatermark
触发器
,但是如果我使用
的
是withLateFirings(),结果将在
窗口
通过后和<e
浏览 0
提问于2019-07-25
得票数 0
回答已采纳
2
回答
流式
数据
流如何决定如何/何时将元素传播到下游转换?
、
、
我有一个从pubsub订阅读取
的
流式
数据
流,没有应用
窗口
。管道
的
第一步是读取pubsub订阅。
在
将消息发送到下一步之前,
数据
流如何决定它应该在第一步
中
累积多少消息,并在pubsub上继续读取更多传入消息?
浏览 0
提问于2020-09-28
得票数 0
1
回答
Apache :多
窗口
集合和后期
数据
、
、
、
、
当每个客户发送这些
数据
时,我们无法控制,很可能是实时
的
,但我们无法
保证
。我们将所有事件存储
在
RabbitMQ/Kafka
中
。更新:我们可以假设每个传感器
的
事件都是有序
的
。
在
开始实现可能
的
流管道之前,我们对以下挑战
的
解决方案感兴趣: 我们把所有原始传感器
数据
存储到卡桑德拉。此外,我们希望通过sensor_id
在
多个时间
窗口<
浏览 4
提问于2016-11-07
得票数 4
1
回答
Apache Beam内存
中
存储
我
的
用例是
在
固定
的
每小时
窗口
中
处理
数据
的
无界流式管道。但是,我需要知道前一个
窗口
的
数据
。有没有办法将
数据
存储在内存
中
某处
的
ArrayList
中
,或者我必须将其写入某个db
中
?我试图避免滑动
窗口
,因为只有一部分
处理
需要来自前一个
窗口
的
数据
,并
浏览 3
提问于2017-11-24
得票数 0
1
回答
Apache光束:从具有固定
窗口
的
UnboundedSource读取
、
我有一个生成N个项目的UnboundedSource (它不是批
处理
模式,它是一个流--它只生成一定数量
的
项目,然后停止发出新
的
项目,但仍然是一个流)。SomeTransform())我假设这意味着将在5秒内生成新事件,然后对5秒
窗口
中
的
数据
应用相反,首先生成所有N个事件,然后才将SomeTransform应用于
数据
(但
窗口</e
浏览 0
提问于2021-01-14
得票数 0
3
回答
Flink:带有
延迟
元素
的
水印
、
我
在
Flink
中
做实时流,其中Kafka是消息队列。我正在申请120秒
的
EventTimeSlidingWindow。滑动1秒。我还在事件时间
的
每一秒插入水印。我担心
的
是,如果元素会在水印
之后
延迟
出现,会发生什么?现在在我
的
情况下,Flink简单地丢弃了它各自
的
水印
之后
的
消息。filnk
是否
提供了任何机制来
处理
这种
延迟
消息,比如维护单独
的
浏览 19
提问于2017-01-19
得票数 3
回答已采纳
1
回答
如何在Flink流
处理
窗口
中收集后期
数据
、
、
假设我有一个
数据
流,其中包含事件时
数据
。我希望
在
8毫秒
的
窗口
时间内收集输入
数据
流,并减少每个
窗口
数据
。timeWindow(Time.milliseconds(8))Point
数据
流
的
关键是
处理
时间
的
时间戳映射到
处理</
浏览 2
提问于2018-07-14
得票数 1
回答已采纳
2
回答
我怎么能让扳机等着呢?
、
、
、
、
我有一个问题,我无法解决,我有一个销售点,
在
销售后插入3个表,标题表,细节和客户(按这个顺序)。我有一个存储过程,它在bak表
中
插入最后一条记录,
在
"text“列
中
插入三个表
的
级联(这是基本
的
),同时我有一个put方法,该方法收集单个行
中
的
所有细节和相应
的
标题(每个标题只有一行),
在
插入过程后执行它时正常工作,但是
在
使用
触发器
执行该过程时,会出现一个错误,即不能在&quo
浏览 2
提问于2018-06-06
得票数 1
2
回答
Apache Flink:如何
处理
延迟
事件?
、
如果元素到达时违反了水印条件,如何
处理
该事件?它被扔掉了吗?或者,该事件
是否
仍然向下游传播,并使用后期事件重新计算过去
的
窗口
函数? 文档承认会发生
延迟
事件,但没有解释如何
处理
它们。
浏览 4
提问于2016-06-16
得票数 3
2
回答
KafkaIO withLogAppendTime vs withProcessingTime
、
、
在
Beam文档
中
,建议
在
withProcessingTime上使用withLogAppendTime。为什么会是这样呢?
浏览 4
提问于2018-12-11
得票数 2
点击加载更多
相关
资讯
OPPO 自研云原生分布式任务调度平台
Flink 从0到1实战实时风控系统(MK完结)
我们总是梦想着对象化
Structured Streaming实现超低延迟
小白学习大数据测试之ETL
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券