我正在考虑为不同的流处理应用程序使用Flink或Apache (与flink运行器一起)。我试图比较这两种选择,并做出更好的选择。下面是我正在研究的标准,并且我很难为flink跑步者找到信息(我已经找到了flink独立的所有信息):
使用Kubernetes (轻松) use
以下是我认为我也知道答案的其他准则:
执行有状态操作的能力:是的,both
如果您对flink跑步者的这些标准有任何见解,请告诉我!如果我找到答案,我会更新这篇文章!
更新:我发现关于使用Beam的优点的好文章(不要看气流部分):https://www.astronomer.io/blog/airflow-vs-apache-beam/
发布于 2022-07-14 20:55:00
类似于OneCricketeer的评论,比较这2是相当主观的。
如果你完全确定你要使用FlinkRunner,你可以直接使用Flink。如果Beam与您希望在将来使用的特定FlinkRunner版本不兼容(或者如果有bug),它可以节省您的麻烦。如果您确信您将要使用的所有I/O都得到Flink的良好支持,并且您知道在哪里/如何设置您的FlinkRunner (在不同的模式下),那么只使用Flink是有意义的。
如果您考虑在将来迁移到其他语言/运行程序,Beam提供了语言和运行程序的可移植性,您可以编写一次管道并在任何地方运行。
Beam支持的不仅仅是Java、Python和Go:
https://github.com/robertwb/beam-javascript
:
跑步者:
详细信息可以在https://beam.apache.org/roadmap/上找到。
https://stackoverflow.com/questions/72985800
复制相似问题