如何将PyFlink性能与Flink + Scala进行比较?
大照片。我们的目标是建立冷和热层的Lambda架构。冷(批)层将用Apache (PySpark)实现。但是对于热(流)层有不同的选择:火花流或Flink。
因此,Apache是纯流的,而不是Spark的微批,我倾向于选择Apache。但我唯一关心的是PyFlink的性能。PySpark流的延迟会更少吗?它比Scala编写的Flink代码慢吗?在什么情况下更慢?
提前谢谢你!
发布于 2021-11-05 15:23:25
我实现了一些非常相似的东西,根据我的经验,下面是几点
作业的
。
如果将服务固定在PyFlink中提供的本机函数上,您将不会观察到性能上的任何明显差异。
https://stackoverflow.com/questions/69854764
复制相似问题