文章/答案/技术大牛

发布

首页视频118_第十章_容错机制（一）_检查点（二）_从检查点恢复状态

118_第十章_容错机制（一）_检查点（二）_从检查点恢复状态

2022-12-022022-12-02 16:02:17播放32

点赞0 收藏 0

2.尚硅谷大数据学科--核心框架/尚硅谷大数据技术之2022版Flink1.13（Java版）/视频/118_第十章_容错机制（一）_检查点（二）_从检查点恢复状态 .mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
我们已经了解了flink怎么样去保存检查点，当然我们也知道在整个流处理运行的过程当中，Flink默认就会自动的给我们周期性的去保存检查点。相当于一个自动存档的过程，那假如说发生故障之后怎么办呢？发生故障之后也不用我们手动去启动。Flink会自动的找到最近一次成功保存的检查点，然后自动给我们重启啊，那所以我们可以接着上节提到的。com示例，我们已经处理完了三个数据，然后保存了这样的一个检查点，前面S偏移量是三，然后后边的萨任务的状态，但是hello 2word1，接下来我们继续处理，假如说又来了一个flink，第四个数据是flink，正常处理完了，现在的话，Sum这里边又多了一个K是flink，然后它的值是一，把它统计出来了。接下来呢，又来了一个数据哈，假如处理到它的时候发生了故障。所以现在整个我们的系统是这个样子，当前第一个任务S任务它的偏移量已经到了五，已经有五个数据读入了，Map任务呢，正常转换这个都没有问题，但是sum任务这里前边四个数据都已经正常处理完，已经输出了，而。
01:19
接下来的这个哈伊还没有处理完的时候就挂了，发生了故障，这个时候接下来该怎么办呢？发生故障之后，当然首先flink要重启啊，我们首先需要重启应用所有任务，所有。应用重启之后，所有任务的状态呢，它其实是恢复到初始状态了，默认情况其实是清空的，什么都没有，所以现在变成了这样的一个情情形，那如果直接我们就读取下一个数据的话，显然我们后边的这个萨这里边就不对了啊，状态就跟之前就不一致了，所以接下来我们需要读取上一次成功保存的检查点，把它的数据恢复出来。
02:05
填到每一个对应的任务它的状态里面去重置状态，所以我们先找到上一个保存的检查点，那第一个就是SS任务，它的偏移量是三，把它填到SS任务的状态。后面的第二个任务map没有状态，所以不管它，接下来呢，萨任务之前是有两个k hello 2word1把它填回来，所以我们现在就恢复到了。之前没有发生故障的那个状态，就跟之前没有发生故障的时候，或者说是刚刚保存了检查点的那一时刻，刚刚处理完第三个数据时候，那一时刻是完全一样的。如果我们直接去看的话，会发现flink内部的状态完全一样了，但是整个系统其实并不完全一样。如果对比的话，就会发现之前我们保存的时候。
03:04
这里第四个数据，第五个数据还没有读取，而现在呢，后边的状态一样，但是这两个数据已经读取了，这就是我们所说的在两次检查点保存之间那些数据，假如在这个过程当中发生了故障的话啊，那没有把他的状态改变，写入到检查点的那些数据，相当于他就丢掉了。所以我们需要把这些数据做一个重放才对啊。那接下来我们就需要把第四个数据和第五个数据进行重放，那重放呢，就需要由S任务向我们的数据源那边去重新提交偏移量，偏移量重置，哎，这样的话我们就重新从第三个数据开始读取，开始消费。那前提当然就是要求外部数据源能够支持偏移量的重置，卡夫卡的话当然是支持的。
04:02
所以接下来我们就继续从外边开始读取第四个数据flink。这样的话，我们状态就已经完全。回到了刚刚保存完检查点的那一时刻。接下来当然就是正常的继续处理第四个第五个数据了啊，那所以如果不发生故障的话，我们就会发现处理完第四个数据，这里又多了一个K是flink flink1，然后处理第五个数据哈，啊，那现在哈就变成了三，所以就追上了发生故障的那一时刻，而且可以继续往下进行了。如果后面我们再做一个。检查点的保存的话，保存到的就是完全正确的状态，就像没有发生故障一样。当然了，如果说我们后边还要求。对于对于输出的数据还要写入到外部系统还要求这个写入的数据不能重复的话，这就涉及到了所谓的精确一次状态一致性的保证。关于这部分内容，我们会在后边的章节继续做详细的介绍。
05:14
而且从这个过程当中我们也可以发现啊，如果想要从检查点里边能够正确的读取出状态，并且解析出来的话，那一定在这里边我们是得知道到底这是哪个任务。对应的状态啊，那那所以在保存检查点的时候，其实是需要保存当前算子的ID。以及它对应的那些状态，那所有的这些信息是由谁来保存，谁来控制的呢？哎，我们知道在整个任务里边，我们直接可以把所有任务都解析出来，画出对应的job graph啊，最后的执行execution graph都可以从执行我们写出的代码里边直接解析出来，那所有的解析的工作是由job manager来做的。所以最后。
06:09
在做这个检查点保存的时候。ID和对应状态的一一对应关系也是由job manager来进行保证的，而检查点的一开始的触发也是由manager控制的，所以在这个故障恢复的过程当中。完全离不开他的参与。不管是检查点的触发和状态的拓扑结构的解析，都是由manager来完成的。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之2022版Flink1.13（Java版）

（118/171）

6分39秒

001_Flink课程简介

510

12分54秒

002_第一章_Flink简介（一）_Flink起源和设计理念

350

12分25秒

003_第一章_Flink简介（二）_Flink在企业的应用

400

8分41秒

004_第一章_Flink简介（三）_Flink的优势

440

18分2秒

005_第一章_Flink简介（四）_数据处理框架的演变

460

4分55秒

006_第一章_Flink简介（五）_流处理的应用场景

290

6分57秒

007_第一章_Flink简介（六）_Flink的分层API

350

10分5秒

008_第一章_Flink简介（七）_Flink和Spark的区别

350

11分58秒

009_第二章_Flink快速上手（一）_环境准备和创建项目

410

15分19秒

010_第二章_Flink快速上手（二）_批处理_Word Count（一）

420

8分31秒

011_第二章_Flink快速上手（二）_批处理_Word Count（二）

430

13分47秒

012_第二章_Flink快速上手（三）_流处理（一）_有界流处理Word Count（一）

400

6分42秒

013_第二章_Flink快速上手（三）_流处理（一）_有界流处理Word Count（二）

360

11分47秒

014_第二章_Flink快速上手（三）_流处理（二）无界流处理Word Count

410

18分16秒

015_第三章_Flink部署（一）_快速启动一个集群（一）_环境配置和基本介绍

360

8分41秒

016_第三章_Flink部署（一）_快速启动一个集群（二）_集群启动

440

12分31秒

017_第三章_Flink部署（一）_快速启动一个集群（三）_提交作业（一）_Web UI提交

360

11分3秒

018_第三章_Flink部署（一）_快速启动一个集群（三）_提交作业（二）_命令行提交

330

10分59秒

019_第三章_Flink部署（二）_部署模式

320

3分49秒

020_第三章_Flink部署（三）_独立模式的部署

380

18分50秒

021_第三章_Flink部署（四）_Yarn模式的部署

400

13分39秒

022_第四章_Flink运行时架构（一）_Flink系统架构

390

12分12秒

023_第四章_Flink运行时架构（二）_作业提交流程

370

10分46秒

024_第四章_Flink运行时架构（三）_一些重要概念（一）_数据流图

450

12分15秒

025_第四章_Flink运行时架构（三）_一些重要概念（二）_并行度

400

14分53秒

026_第四章_Flink运行时架构（三）_一些重要概念（三）_算子链

390

6分13秒

027_第四章_Flink运行时架构（三）_一些重要概念（四）_执行图

390

17分36秒

028_第四章_Flink运行时架构（三）_一些重要概念（五）_Task Slots

450

6分23秒

029_第四章_Flink运行时架构（四）_Flink的任务调度

380

5分40秒

030_第五章_DataStream API（基础篇）（一）_整体介绍

370

16分12秒

031_第五章_DataStream API（基础篇）（二）_执行环境

400

5分18秒

032_第五章_DataStream API（基础篇）（三）_源算子（一）_整体介绍

400

5分17秒

033_第五章_DataStream API（基础篇）（三）_源算子（二）_准备工作

460

17分14秒

034_第五章_DataStream API（基础篇）（三）_源算子（三）_读取有界流

370

4分4秒

035_第五章_DataStream API（基础篇）（三）_源算子（四）_读取Socket文本流

350

11分50秒

036_第五章_DataStream API（基础篇）（三）_源算子（五）_读取Kafka

400

14分50秒

037_第五章_DataStream API（基础篇）（三）_源算子（六）_自定义Source

470

6分32秒

038_第五章_DataStream API（基础篇）（三）_源算子（七）_自定义并行Source

380

10分21秒

039_第五章_DataStream API（基础篇）（三）_源算子（八）_Flink支持的数据类型（一）

400

12分59秒

040_第五章_DataStream API（基础篇）（三）_源算子（八）_Flink支持的数据类型（二）

360

13分14秒

041_第五章_DataStream API（基础篇）（四）_Transform（一）_Map

460

10分46秒

042_第五章_DataStream API（基础篇）（四）_Transform（二）_Filter

410

13分37秒

043_第五章_DataStream API（基础篇）（四）_Transform（三）_FlatMap

350

12分14秒

044_第五章_DataStream API（基础篇）（四）_Transform（五）_KeyBy

430

13分17秒

045_第五章_DataStream API（基础篇）（四）_Transform（六）_简单聚合

390

20分24秒

046_第五章_DataStream API（基础篇）（四）_Transform（七）_归约聚合

370

9分24秒

047_第五章_DataStream API（基础篇）（四）_Transform（八）_UDF（一）_函数类和匿名函数

420

14分40秒

048_第五章_DataStream API（基础篇）（四）_Transform（八）_UDF（二）_富函数类

470

18分2秒

049_第五章_DataStream API（基础篇）（四）_Transform（九）_物理分区（一）_随机和轮询分区

400

14分19秒

050_第五章_DataStream API（基础篇）（四）_Transform（十）_物理分区（二）_Rescale

320

8分37秒

051_第五章_DataStream API（基础篇）（四）_Transform（十）_物理分区（三）_广播、全局及自定义分区

350

11分48秒

052_第五章_DataStream API（基础篇）（五）_Sink（一）_连接到外部系统

430

15分23秒

053_第五章_DataStream API（基础篇）（五）_Sink（二）_输出到文件

320

13分0秒

054_第五章_DataStream API（基础篇）（五）_Sink（三）_输出到Kafka

440

13分56秒

055_第五章_DataStream API（基础篇）（五）_Sink（四）_输出到Redis

240

13分13秒

056_第五章_DataStream API（基础篇）（五）_Sink（五）_输出到Elasticsearch

390

14分28秒

057_第五章_DataStream API（基础篇）（五）_Sink（六）_输出到MySQL

400

5分4秒

058_第五章_DataStream API（基础篇）（五）_Sink（七）_自定义Sink输出

350

13分30秒

059_第六章_Flink中的时间和窗口（一）_时间语义

410

10分20秒

060_第六章_Flink中的时间和窗口（二）_水位线（一）_水位线的概念

410

17分17秒

061_第六章_Flink中的时间和窗口（二）_水位线（二）_水位线的原理和特性

370

14分25秒

062_第六章_Flink中的时间和窗口（二）_水位线（三）_水位线在代码中的生成（一）

370

8分48秒

063_第六章_Flink中的时间和窗口（二）_水位线（三）_水位线在代码中的生成（二）

390

11分3秒

064_第六章_Flink中的时间和窗口（二）_水位线（四）_自定义水位线的生成

470

6分58秒

065_第六章_Flink中的时间和窗口（二）_水位线（五）_水位线的传递

440

9分52秒

066_第六章_Flink中的时间和窗口（三）_窗口（一）_窗口的基本概念

350

20分50秒

067_第六章_Flink中的时间和窗口（三）_窗口（二）_窗口的分类

370

4分10秒

068_第六章_Flink中的时间和窗口（三）_窗口（三）_窗口API概览

340

12分27秒

069_第六章_Flink中的时间和窗口（三）_窗口（四）_窗口分配器

370

5分30秒

070_第六章_Flink中的时间和窗口（三）_窗口（五）_窗口函数整体介绍

440

5分33秒

071_第六章_Flink中的时间和窗口（三）_窗口（六）_窗口函数分类

430

9分7秒

072_第六章_Flink中的时间和窗口（三）_窗口（七）_增量聚合函数（一）_ReduceFunction

420

13分20秒

073_第六章_Flink中的时间和窗口（三）_窗口（七）_增量聚合函数（二）_AggregateFunction

420

19分42秒

074_第六章_Flink中的时间和窗口（三）_窗口（七）_增量聚合函数（三）_应用实例

410

18分31秒

075_第六章_Flink中的时间和窗口（三）_窗口（八）_全窗口函数

450

10分55秒

076_第六章_Flink中的时间和窗口（三）_窗口（九）_两种窗口函数结合

410

11分43秒

077_第六章_Flink中的时间和窗口（三）_窗口（十）_窗口函数综合应用实例

400

19分44秒

078_第六章_Flink中的时间和窗口（三）_窗口（十一）_窗口其它API

380

11分32秒

079_第六章_Flink中的时间和窗口（四）_处理迟到数据（一）_代码实现

430

12分42秒

080_第六章_Flink中的时间和窗口（四）_处理迟到数据（二）_测试

370

17分1秒

081_第七章_处理函数（一）_处理函数的概念和分类

460

14分16秒

082_第七章_处理函数（二）_ProcessFunction

420

12分2秒

083_第七章_处理函数（三）_KeyedProcessFunction（一）_处理时间定时器

460

11分32秒

084_第七章_处理函数（三）_KeyedProcessFunction（二）_事件时间定时器

340

5分23秒

085_第七章_处理函数（四）_ProcessWindowFunction

330

15分49秒

086_第七章_处理函数（五）_Top N（一）_使用ProcessAllWindowFunction（一）_基本思路

350

14分44秒

087_第七章_处理函数（五）_Top N（一）_使用ProcessAllWindowFunction（二）_代码实现和测试

370

22分11秒

088_第七章_处理函数（五）_Top N（二）_使用KeyedProcessFunction

290

16分2秒

089_第八章_多流转换（一）_分流

450

13分50秒

090_第八章_多流转换（二）_合流（一）_ 联合（Union）

380

12分56秒

091_第八章_多流转换（二）_合流（二）_ 连接（Connect）

330

23分18秒

092_第八章_多流转换（二）_合流（三）_ 应用实例（一）_程序架构和实现思路

380

15分1秒

093_第八章_多流转换（二）_合流（三）_ 应用实例（二）_具体代码实现

320

6分14秒

094_第八章_多流转换（二）_合流（四）_ 广播连接流

440

21分14秒

095_第八章_多流转换（三）_双流Join（一）_ 窗口联结

380

20分8秒

096_第八章_多流转换（三）_双流Join（二）_ 间隔联结

470

15分17秒

097_第八章_多流转换（三）_双流Join（三）_ 窗口同组联结

400

13分50秒

098_第九章_状态编程（一）_Flink中的状态（一）_ 状态的定义

420

12分59秒

099_第九章_状态编程（一）_Flink中的状态（二）_ 状态的管理

430

100

16分6秒

100_第九章_状态编程（一）_Flink中的状态（三）_ 状态的分类

410

101

19分38秒

101_第九章_状态编程（二）_按键分区状态（一）_ 基本概念和类型

410

102

13分56秒

102_第九章_状态编程（二）_按键分区状态（二）_ 代码中的使用（一）_基本方式和值状态

280

103

17分16秒

103_第九章_状态编程（二）_按键分区状态（二）_ 代码中的使用（二）_其它状态

440

104

24分34秒

104_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（一）_值状态

390

105

19分29秒

105_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（二）_列表状态

370

106

22分14秒

106_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（三）_映射状态

420

107

20分8秒

107_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（四）_聚合状态

340

108

17分18秒

108_第九章_状态编程（二）_按键分区状态（四）_ 状态生存时间

340

109

14分27秒

109_第九章_状态编程（三）_算子状态（一）_ 基本概念和类型

400

110

12分5秒

110_第九章_状态编程（三）_算子状态（二）_应用实例（一）_基本思路和框架

370

111

16分31秒

111_第九章_状态编程（三）_算子状态（二）_应用实例（二）_具体实现和测试

340

112

8分54秒

112_第九章_状态编程（四）_广播状态（一）_基本概念和用法

410

113

22分48秒

113_第九章_状态编程（四）_广播状态（二）_应用实例

380

114

9分52秒

114_第九章_状态编程（五）_状态持久化（一）_检查点

450

115

21分15秒

115_第九章_状态编程（五）_状态持久化（二）_状态后端

420

116

11分54秒

116_第十章_容错机制（一）_检查点（一）_检查点的保存原理（一）_周期性的保存

340

117

15分2秒

117_第十章_容错机制（一）_检查点（一）_检查点的保存原理（二）_保存的时间点

340

118

6分40秒

118_第十章_容错机制（一）_检查点（二）_从检查点恢复状态

320

119

15分0秒

119_第十章_容错机制（一）_检查点（三）_检查点算法（一）_分界线

390

120

22分22秒

120_第十章_容错机制（一）_检查点（三）_检查点算法（二）_分布式快照算法

360

121

19分19秒

121_第十章_容错机制（一）_检查点（四）_检查点配置

310

122

13分12秒

122_第十章_容错机制（一）_检查点（五）_保存点

300

123

10分50秒

123_第十章_容错机制（二）_状态一致性（一）_一致性的概念和级别

430

124

15分16秒

124_第十章_容错机制（二）_状态一致性（二）_端到端状态一致性（一）

290

125

15分54秒

125_第十章_容错机制（二）_状态一致性（二）_端到端状态一致性（二）

380

126

18分22秒

126_第十章_容错机制（二）_状态一致性（三）_端到端精确一次

310

127

13分26秒

127_第十一章_Table API和SQL（一）_整体介绍

350

128

19分18秒

128_第十一章_Table API和SQL（二）_快速上手

360

129

12分48秒

129_第十一章_Table API和SQL（三）_基本API（一）_程序架构

370

130

13分40秒

130_第十一章_Table API和SQL（三）_基本API（二）_表环境

410

131

16分31秒

131_第十一章_Table API和SQL（三）_基本API（三）_创建表

340

132

20分33秒

132_第十一章_Table API和SQL（三）_基本API（四）_表的查询和输出（一）

410

133

15分0秒

133_第十一章_Table API和SQL（三）_基本API（四）_表的查询和输出（二）

400

134

12分24秒

134_第十一章_Table API和SQL（三）_基本API（五）_表和流的转换（一）_表转换成流

350

135

13分25秒

135_第十一章_Table API和SQL（三）_基本API（五）_表和流的转换（二）_流转换成表

390

136

16分21秒

136_第十一章_Table API和SQL（四）_流处理中的表（一）_动态表和持续查询

440

137

25分10秒

137_第十一章_Table API和SQL（四）_流处理中的表（二）_流转换成动态表做动态查询

420

138

15分2秒

138_第十一章_Table API和SQL（四）_流处理中的表（三）_动态表编码成数据流

380

139

16分23秒

139_第十一章_Table API和SQL（五）_时间属性和窗口（一）_时间属性（一）_在DDL中定义

390

140

11分55秒

140_第十一章_Table API和SQL（五）_时间属性和窗口（一）_时间属性（二）_流转换成表时定义

360

141

22分46秒

141_第十一章_Table API和SQL（五）_时间属性和窗口（二）_窗口

320

142

21分5秒

142_第十一章_Table API和SQL（六）_聚合查询（一）_分组聚合

420

143

16分1秒

143_第十一章_Table API和SQL（六）_聚合查询（二）_窗口聚合

400

144

15分22秒

144_第十一章_Table API和SQL（六）_聚合查询（三）_开窗聚合

410

145

28分4秒

145_第十一章_Table API和SQL（六）_聚合查询（四）_TopN（一）_普通TopN

370

146

15分27秒

146_第十一章_Table API和SQL（六）_聚合查询（四）_TopN（二）_窗口TopN

450

147

14分58秒

147_第十一章_Table API和SQL（七）_联结查询

420

148

22分9秒

148_第十一章_Table API和SQL（八）_函数（一）_系统函数

390

149

9分46秒

149_第十一章_Table API和SQL（八）_函数（二）_UDF（一）_整体介绍和分类

410

150

9分6秒

150_第十一章_Table API和SQL（八）_函数（二）_UDF（二）_标量函数

410

151

16分40秒

151_第十一章_Table API和SQL（八）_函数（二）_UDF（三）_表函数

370

152

18分24秒

152_第十一章_Table API和SQL（八）_函数（二）_UDF（四）_聚合函数

350

153

25分19秒

153_第十一章_Table API和SQL（八）_函数（二）_UDF（五）_表聚合函数

300

154

9分2秒

154_第十一章_Table API和SQL（九）_SQL客户端

360

155

14分49秒

155_第十一章_Table API和SQL（十）_连接到外部系统（一）_常见的外部存储

370

156

14分11秒

156_第十一章_Table API和SQL（十）_连接到外部系统（二）_Hive

380

157

17分24秒

157_第十二章_Flink CEP（一）_基本概念和应用

380

158

17分40秒

158_第十二章_Flink CEP（二）_快速上手（一）_需求分析和定义模式

350

159

14分1秒

159_第十二章_Flink CEP（二）_快速上手（二）_检测处理代码实现和测试

370

160

13分58秒

160_第十二章_Flink CEP（三）_模式API（一）_个体模式（一）_量词

380

161

15分45秒

161_第十二章_Flink CEP（三）_模式API（一）_个体模式（二）_条件

420

162

16分31秒

162_第十二章_Flink CEP（三）_模式API（二）_组合模式

300

163

5分31秒

163_第十二章_Flink CEP（三）_模式API（三）_模式组

400

164

12分38秒

164_第十二章_Flink CEP（三）_模式API（四）_匹配后跳过策略

390

165

14分14秒

165_第十二章_Flink CEP（四）_模式的检测处理（一）_处理匹配事件

350

166

18分42秒

166_第十二章_Flink CEP（四）_模式的检测处理（二）_处理超时事件（一）_需求分析和准备工作

370

167

16分39秒

167_第十二章_Flink CEP（四）_模式的检测处理（二）_处理超时事件（二）_代码实现和测试

350

168

7分26秒

168_第十二章_Flink CEP（四）_模式的检测处理（三）_处理迟到数据

440

169

9分20秒

169_第十二章_Flink CEP（五）_CEP状态机实现（一）_思路分析和程序框架

390

170

16分32秒

170_第十二章_Flink CEP（五）_CEP状态机实现（二）_定义状态机

330

171

7分53秒

171_第十二章_Flink CEP（五）_CEP状态机实现（三）_实现处理逻辑及测试

380

118_第十章_容错机制（一）_检查点（二）_从检查点恢复状态

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐