Watermark本质是什么
Watermarks是基于已经收集的消息来估算是否还有消息未到达,本质上是一个时间戳。时间戳反映的是事件发生的时间,而不是事件处理的时间。...乱序到达的序列是:2,3,4,5,1,6,3,8,9,10,7
0x03 Flink中的窗口概念
窗口
对于Flink,如果来一条消息计算一条,这样是可以的,但是这样计算是非常频繁而且消耗资源,如果想做一些统计这是不可能的...如果未调用keyBy(...),则表示流不是keyed stream。
对于Keyed流,可以将传入事件的任何属性用作key。...相反,当会话窗口在一段时间内没有接收到元素时会关闭。
例如,不活动的间隙时。...watermark的作用是防止数据出现乱序(经常),事件时间内获取不到指定的全部数据,而做的一种保险方法。
allowLateNess是将窗口关闭时间再延迟一段时间。