我最近在学习pyflink,但我有点困惑。我们知道pyflink table API将流/批处理转换为表,并在其上做一些工作,最后到达您想要的位置。但是,有几种方法可以创建表环境:
对于批处理示例:
t_config = TableConfig()
env = ExecutionEnvironment.get_execution_environment()
t_env = BatchTableEnvironment.create(env, t_config)和
env_settings = EnvironmentSettings.new_instance().in_batch_mode().use_blink_planner().build()
t_env = BatchTableEnvironment.create(evnironment_settings = env_settings)但是我发现其中一个样式只适用于flink run -py batch.py,其他一些样式可以作为python batch.py运行在本地。
我的问题是executionEnvironment和BatchTableEnvironment/StreamTableEnvironment有什么区别,什么时候可以使用flink运行-py,什么时候可以通过安装了pyflink的python解释器运行?
Thx
发布于 2020-12-21 16:45:59
对于flink run,需要在.sh中设置一些配置,您可以认为flink run是一些bash脚本加上python xx本身。
有关更多信息,请访问$FLINK_HOME/bin/flink或flink-dist/src/flink-bin/flink
发布于 2020-12-31 15:38:49
flink run方式用于提交要在集群上运行的作业。而python xxx.py的方式是直接在本地内存中运行作业
https://stackoverflow.com/questions/65351058
复制相似问题