随着Kafka的流行和流式处理技术的发展,流式处理系统已经成为数据处理的一个重要领域,并且在越来越多的应用场景中得到广泛应用。...在流式系统中,如果生产者出现网络问题导致离线几个小时,然后大量数据涌入,这会给系统带来很大困难。因为大部分数据的事件时间已经超出我们设定的窗口范围,无法进行正常的聚合计算。...应用流中所有变更事件来改变状态并建立表,表转流需要捕获表上的变更事件并发送到流进行后续流式处理。...,重置本地状态,避免混淆两版本结果
可能需清理前输出流
尽管Streams提供重置应用状态工具,有条件运行两个应用生成两个结果流更安全,可以比较不同版本结果,无数据丢失或清理引入错误风险
重处理事件模式需要...,小心切换客户端到新结果流
可选清理现有结果和状态,使用重置工具小心操作,或采用并行模式避免清理
事件流的长期保留为重新处理事件和 AB 测试不同版本应用程序提供了可能。