Flink 的算子函数和spark的大致一样,但是由于其是流处理的模式,所有还要有需要加强理解的地方
Flink 中 和spark算子一致的算子
Map, FlaMap 做一对一,一对多映射
Reuce...会话窗口是根据相邻时间间隔确定窗口边界
全局窗口必须定义触发器
在窗口内也可以进行其他的操作
窗口连接
两个数据源相同窗口内的连接
text.join(windowCounts)
.where....apply((e1,e2) => e1 + "," + e2)
0 1 2
0 1 2 3
0,1 0,1 1,0 1,0 2,2 3,2 一个窗口一个窗口内连接...检查点默认是关闭的,启用检查点需要配置 一致性级别, exactly-once
检测超时时间,
Kafka进行流计算实例
创建连接器
添加kafka source
// 设置配置文件.../flink-avro
compile group: 'org.apache.flink', name: 'flink-avro', version: '1.7.1'
设置消息起始位置的偏移
设置 据上一次的偏移位置