今天给大家推荐一个非常牛逼的大数据框架Flink,它是Apache顶级项目,目前github上的托管地址为https://github.com/apache/flink。
温馨提示:目前Flink Star数量为22.4k,Fork数量为13k,目前最新的版本为release-1.18.1-rc1。
Flink目前是Java领域使用非常频繁的大数据框架,Apache Flink 是一个框架和分布式处理引擎,用于在无边界和有边界数据流上进行有状态的计算。Flink 能在所有常见集群环境中运行,并能以内存速度和任意规模进行计算。
Flink是采用Java语言编写的,这里其实也间接的去说明了一点,那就是Java语言并不是不能写高并发项目,而是我们没用好而已。
我始终秉承最好的学习方式是实战+源码的理念,因此我看到Flink,就第一时间将它的源码下载下来。
Flink整个项目的源码结构是非常复杂的,绝对是一个超级巨无霸项目,当然阿里巴巴也依据开源版本的Flink,定制了一个阿里版本的大数据框架。
当然我也不是说要强推Flink,只是想告诉大家它的生态做的确实不错,组件能力非常的丰富。
建议小伙伴们可以先从Flink的架构模型开始去理解它的运行环境,也就是先要学会搭建Flink的环境,然后再找一个应用服务去接入Flink,最后再从问题中去查阅Flink的源码,最终做到孰能生巧的地步。
后面时间允许的话,我也会在公众号上去分析Flink的核心原理和架构模型的。