这种时间主要是Kafka内部使用的,和流式应用无太大关系。
处理时间(Processing Time):应用程序收到事件并开始处理的时间。这种时间不可靠,可能会产生不同的值,所以流式应用很少使用它。...本地状态或内部状态:只能被单个应用程序实例访问,使用内嵌数据库维护,速度快但受限于内存大小。许多设计将数据拆分到子流使用本地状态处理。...Streams 在内嵌的 RocksDB 里维护了两个主题的连接时间窗口,所以能够执行连接操作
乱序的事件
处理乱序和迟到事件的要点:
识别乱序事件:检查事件时间,与当前时间比较,超出时间窗口视为乱序或迟到...Streams API聚合结果写入主题,常为压缩日志主题,每个键只保留最新值。如果聚合窗口结果需更新,直接为窗口写入新结果,覆盖前结果。...,如Dataflow或Streams
将更新后的聚合结果直接 overwrite,使用压缩日志主题避免结果主题无限增长
事件的乱序和迟到是流处理的常见场景,但又不太适合批处理的重新计算方式。