前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >搭建高可用的flink JobManager HA

搭建高可用的flink JobManager HA

作者头像
yiduwangkai
发布2021-06-29 11:32:03
1.4K0
发布2021-06-29 11:32:03
举报
文章被收录于专栏:大数据进阶大数据进阶

JobManager协调每个flink应用的部署,它负责执行定时任务和资源管理。每一个Flink集群都有一个jobManager, 如果jobManager出现问题之后,将不能提交新的任务和运行新任务失败,这样会造成单点失败,所以需要构建高可用的JobMangager。

类似zookeeper一样,构建好了高可用的jobManager之后,如果其中一个出现问题之后,其他可用的jobManager将会接管任务,变为leader。不会造成flink的任务执行失败。可以在单机版和集群版构建jobManager

flink ha主要分为两种,flink独立部署时的ha, flink on yarn模式部署时的ha

一.flink独立部署(Standalone模式)

我们先借助网上的一副时间线变化图来说明一下

从图上看道需要启动至少两个独立的jobmanager进程

下面我们来看一下配置

代码语言:javascript
复制
localhost:8081
localhost:8082

ha配置放到下文去说

二.on yarn模式(yarn session/yarn per job/application mode)

无论是yarn session模式还是yarn per job模式,或者是application mod模式,在同一时刻只会有一个进程

三.统一配置​​​​​​​

代码语言:javascript
复制
# The high-availability mode. Possible options are 'NONE' or 'zookeeper'.
#
high-availability: zookeeper
 
# The path where metadata for master recovery is persisted. While ZooKeeper stores
# the small ground truth for checkpoint and leader election, this location stores
# the larger objects, like persisted dataflow graphs.
#
# Must be a durable file system that is accessible from all nodes
# (like HDFS, S3, Ceph, nfs, ...)
#
high-availability.storageDir: hdfs:///flink/ha/
 
high-availability.zookeeper.path.root: /flink
 
# The list of ZooKeeper quorum peers that coordinate the high-availability
# setup. This must be a list of the form:
# "host1:clientPort,host2:clientPort,..." (default clientPort: 2181)
#
high-availability.zookeeper.quorum: localhost:3181
#high-availability.cluster-id: /cluster_one
yarn.application-attempts: 10
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档