问题是一些记录可能会延迟到达或在系统中重复,这种情况需要管理;为了避免重复,我尝试了以下解决方案: .assignTimestampsAndWatermarks(new((value) -> value.toString()); 其中,第一个窗口操作根据保存在集合中的时间戳过滤记录,如下所示: public class WindowedFilter extends ProcessWindowFunction
我正在使用window API将数据划分为1小时的窗口。在每个窗口中,我使用一个值状态来存储每个窗口的布尔值。aggregate(new WindowAggregator(), new WindowProcessor())
public class WindowProcessor extends ProcessWindowFunctionBooleanUtils.isTrue(windowAlertedState.value())) { }
我是否必须调用"clear()
我不确定我必须使用哪个流Flink转换来计算一些流的平均值,并在5秒的窗口内更新一个状态(假设它是一个整数数组我的状态)。Flink error on using RichAggregateFunction有没有其他方法可以计算平均值并跟踪Flink中的另一个状态? 我该如何在Flink中解决这个问题?下面是我正在尝试的方法,但实际上不起作用> https://github.com/felipegutierrez/explore-flink/blob