文章/答案/技术大牛

发布

首页视频120_第十章_保存点

120_第十章_保存点

2022-12-022022-12-02 16:02:30播放41

点赞0 收藏 0

尚硅谷大数学科--选学技术丰富/尚硅谷大数据技术之Flink1.13（Scala版）/视频/120_第十章_保存点.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
介绍完了检查点，那接下来呢，我们再来扩展去讲解一下另外一个跟检查点非常类似的进行状态快照保存的功能，那就是所谓的保存点c point啊那关于保存点其实我们并不陌生，在一开始我们去进行作业提交的时候，在web UI上啊，就看到有一个选项可以指定当前对应的保存点路径啊，那这又是一个什么样的功能呢？啊，其实我们看到从名称上就能看出来啊，保存点就是要做一个快照保存吧啊，所以它的功能其实整体来讲啊，跟检查点可以说是基本上一样，也是一个存盘备份。只不过呢，可能会多一些额外的原数据，那它跟检查点的区别到底在哪里呢？主要就是之前我们说检查点那是做了一个自动存盘周期性的，每隔一段时间就直接做一个存盘保存，发生故障之后自动的就去获取之前最近一次保存好的检查点去进行状态恢复，而保存点呢，保存点它的触发时机不是自动周期性触发的，而是。
01:13
手动进行保存，诶，所以往往就是我们涉及到一些重要的节点的时候啊，就像我们这个打游戏的时候，在打boss之前，诶，这个时候比较重要我们手动的把它保存一下啊，那往往就是我们在作业或者说应用啊，运行到某个特定时间点的时候，可能我们要做这样的一个保存。就是因为这样一个自动存盘和手动存盘的区别，哎，那么保存点它的用途跟检查点就完全不一样了，前面我们说检查点主要就是用来做自动故障恢复的，这是我们整个flink容错机制的核心，而保存点呢，因为它是手动存盘，所以它其实更加灵活。可以作为一个非常强大的运维工具来使用啊，这个就比较有趣啊，啊，当然首先这个保存点也可以做故障恢复啊，就是我们可以在设置这个容错机制的时候啊，去指定啊，我们可以假如说发生故障之后有一个临近的保存点的话，我们也可以去从保存点去做一个自动的恢复，这个也是完全可以把它当成一种特殊的检查点。
02:18
那另外呢，它还可以有非常多的应用场景，比如说我们可以做版本的管理和归档。这就是前面我们所说的啊啊，在打boss之前专门去做一个存档啊，对于针对一些比较重要的时间节点，单独的做一个手动备份，设置成某一个归档的版本。哎，那另外呢，我们还可以去基于它更新flink的版本，因为目前我们整个flink的底层架构已经非常稳定了，如果flink版本升级了，诶，我们现在用01:13，如果想要升级到01:14的话，其实我们没有必要去把之前的flink应用啊，我们写的代码重新写一遍，然后重新提交。
03:02
因为只要我们的代码核心逻辑没有变的话，哎，我们对于这个每一个算子，它的拓扑结构啊，先发生什么，后发生什么，以及里边每一个算子里边我们定义的那些状态，如果这些结构都是一致的话。这就完全可以迁移，哎，所以出现这种情况的时候，如果我们要升级flink版本怎么变啊，那当前的代码都不用改，只是需要我们先把当前的作业啊，先创建一个保存点，做一个手动存盘。然后接下来呢，就可以直接把这个作业停掉了。停掉之后，诶，那我们更新link的版本，换一个link集群，直接把它起提起来，然后从对应的保存点里去重启应用，把之前的状态都读出来恢复就可以了，所以这个过程我们会发现啊，就可以接着之前处理的那个所有的数据继续进行处理了，可能就只是一次暂停和重启的时间间隔，整个耽误的时间啊，这个实时性的影响其实是非常小的。
04:08
好，那除了更新flink版本之外，我们还可以对应的更新flink应用程序啊，之前我们说的是flink本身代码啊，这个程序不变，那假如说我们想要去修改代码，想要去修复一些bug，这个怎么办呢？诶，当然。我们能想到这个就肯定要停止整个作业啊，把这个代码要重构之后，重新打包，重新提交，这个肯定是没有问题的，但这里面有一个问题，就是说如果在重新开始去执行从头的那个操作的话，那相当于我们之前所有的数据还得重新处理一遍啊，那有时候往往我们更新这个应用程序的时候呢，核心的代码逻辑可能是不发生改变的，可能就是修复了一点小小的bug，那这种情况下。我们整个的处理逻辑以及状态的定义。状态。它的数据结构是什么样的，可能都没有更改，那这种情况下呢，完全就可以把之前的状态。
05:06
保存成一个保存点存盘。然后停掉应用。更新代码重新提交，然后从之前保存的这个保存点去恢复状态，就可以继续使用，所以这个过程其实跟更新link的过程也是完全一样的。啊，那除了这些更新的一些操作之外呢，另外还可以就是哎调整资源，调整并行度，如果说我们跑着跑着发现诶当前资源资源不够用了，我们可能需要把这个并行度调大，诶那这个时候怎么办呢？创建一个保存点，停掉应用，然后从保存点重启啊这样的话就实现了一个资源的扩展。另外还有一种应用场景，诶，那就是有时候呢，诶，可能我们也不是做各种各样的这种更新，或者说调整并行度，单纯的就是就是想把某一个应用先停掉啊，因为有可能现在这个应用啊，完全就没有数据到来，我们一直在等着它，还耗费系统资源，我们就想先释放一些资源去做更加重要的事情，那这个时候完全就可以把它先暂停，等到。
06:16
其他的这个重要的事情都做完了，然后再恢复当前的应用，再追上之前的进度就可以了，这些功能全部可以用保存点来进行实现。这里需要强调的一点就是在这个过程当中啊，啊，无论是更新应用程序，还是说调整并行度，还是说暂停重启，还是说更新flink的版本，这个关键能这么做的关键都在于我们去保存所有算子状态的时候，它的拓扑结构是不发生变化，这样的话，我们前后更新前后程序才是兼容的，哎，那所以如果说。我们当前的处理流程里边，别的都没有变。之前所有的步骤都没有变，但是呢，某两步之间现在追加了一个map操作，多做了一步转换，诶，那这样的话，我们整个这个程序处理的拓扑结构就变了，即使是其他的算子都没有发生改变啊，处理逻辑和状态的定义都是完全一样的，那这个时候我们也不能正确的恢复了。
07:18
诶，那我们就发现这种情况其实不太合适啊，就别的都没变，我只是新增了一个中间转换的处理啊，多加了一个map而已，那它其实本身也没有状态，那这种情况能不能直接从保存点恢复出来呢？啊其实也是可以的。这就需要我们手动的去指定之前有状态算子所有的ID到底是什么，单独的指定一个编号，那这样的话就相当于是一个K一个value，一个K一个value对应起来了，如果说我们之前不指定的话，Flink底层会默认给每一个算子设置一个ID啊，那它是自动生成的，那这个就不靠谱嘛，所以增加一个之后就有可能发生改变，所以为了实现这种灵活的应用升级，哎，那我们最好在代码当中去对每一个算子设置一个。
08:08
ID啊，那它的设置方式其实也非常简单啊，直接调用一个UID方法就可以了啊，那里边呢，给定的就是一个ID，其实就是一个字符串了，给个名称就可以指定当前这个算子是什么了，我们对应保存的那些状态，哎，这就一一对应上，不会搞错了。那设置了这些UID之后呢？呃，使用保存点的过程其实也非常的简单，主要就是用flink给我们提供的命令行工具去创建一个保存点，然后再从保存点去启动就可以了啊，那创建的时候这个命令就叫做flink，然后后边跟上save point啊，当然了，我们可以加上一个当前的作业ID，指定到底是。哪一个作业要去做镜像保存啊，那后面还有一个可选项，就是指定保存的目标路径。
09:02
如果这里不指定的话，默认使用的也是集群配置文件啊，Link com.ya里边的state c points.d啊，之前我们说那个默认的检查点的保存路径不是state.checkpoints.DR吗？这里只是变了一个单词而已。同样的啊，我们也可以针对单独的作业，在代码当中利用烟为当前的执行环境去调一个方法，Set default c point DR，调用这个方法去指定当前作业特定的一个。保存点存储路径啊，这这样的话就设置了我们当前这个保存点到底应该放到哪儿，然后创建了这样一个保存点之后，如果之后又要重启这个应用恢复状态的话，诶，那怎么样做呢。当然就是在web UI提交的时候，加上对应的那个c point参数啊，指定对应的路径就可以了啊，那我们也可以在命令行里边flink wrong后面加一个杠S参数，把对应的保存点的路径填在后边，从保存点读取状态去恢复就可以重新启动了。那另外还有一种创建保存点的方法呢，是在停掉作业的时候。
10:17
同时直接创建一个保存点啊，这样的话就省得我们单独先做一个保存点的保存，然后再去停当前作业了啊，那就是直接flink stop，后边跟上一个杠杠c point pass，然后指定。保存的路径，就可以在停掉作业的同时创建一个当前状态的保存点，然后接下来同样可以从这个保存点去重启应用link，提交作业，恢复之前的状态，继续进行处理啊，这就是关于保存点的用法。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之Flink1.13（Scala版）

（120/176）

6分52秒

001_Flink课程（Scala版）简介

460

9分29秒

002_第一章_Flink的起源和发展

470

6分5秒

003_第一章_Flink框架处理流程

310

6分20秒

004_第一章_Flink应用场景

380

8分41秒

005_第一章_为什么要用Flink

320

18分2秒

006_第一章_数据处理框架的演变

390

6分57秒

007_第一章_Flink的分层API

370

10分5秒

008_第一章_Flink和Spark的区别

510

12分57秒

009_第二章_Flink环境准备和创建项目

380

18分41秒

010_第二章_批处理WordCount

440

13分48秒

011_第二章_有界流处理WordCount

370

13分35秒

012_第二章_无界流处理WordCount

370

7分53秒

013_第三章_Flink基本运行架构

430

21分6秒

014_第三章_本地启动Flink集群

510

6分50秒

015_第三章_远程集群启动

370

11分56秒

016_第三章_Web UI 提交作业

440

8分49秒

017_第三章_命令行提交作业

400

10分42秒

018_第三章_Flink部署模式

310

3分45秒

019_第三章_独立模式的部署

370

18分23秒

020_第三章_YARN模式的部署

280

13分39秒

021_第四章_Flink系统架构

440

10分59秒

022_第四章_Flink运行时架构（二）_作业提交流程

450

7分37秒

023_第四章_数据流图

430

11分54秒

024_第四章_并行度

410

14分50秒

025_第四章_算子链

430

6分13秒

026_第四章_执行图

420

17分27秒

027_第四章_Task Slots

380

5分40秒

028_第四章_Flink的任务调度

370

6分20秒

029_第五章_DataStream API整体介绍

330

9分34秒

030_第五章_执行环境

400

17分18秒

031_第五章_Source（一）_读取有界数据

410

14分28秒

032_第五章_Source（二）_读取Kafka

420

15分47秒

033_第五章_Source（三）_读取自定义数据源

330

10分15秒

034_第五章_Flink支持的类型系统

440

9分35秒

035_第五章_Transform（一）_Map

370

5分49秒

036_第五章_Transform（二）_Filter

390

11分24秒

037_第五章_Transform（三）_FlatMap

380

11分6秒

038_第五章_Transform（四）_KeyBy

430

14分3秒

039_第五章_Transform（五）_简单聚合

380

18分52秒

040_第五章_Transform（六）_归约聚合

420

12分25秒

041_第五章_函数类

330

14分7秒

042_第五章_富函数类

430

8分37秒

043_第五章_物理分区（一）_整体介绍

410

3分48秒

044_第五章_物理分区（二）_Shuffle

370

4分43秒

045_第五章_物理分区（三）_Rebalance

400

13分17秒

046_第五章_物理分区（四）_Rescale

410

3分44秒

047_第五章_物理分区（五）_广播和全局分区

360

6分26秒

048_第五章_物理分区（六）_自定义分区

390

10分30秒

049_第五章_Sink（一）_Flink连接到外部系统

480

13分58秒

050_第五章_Sink（二）_写入文件

440

13分38秒

051_第五章_Sink（三）_写入Kafka

420

14分19秒

052_第五章_Sink（四）_写入Redis

410

15分25秒

053_第五章_Sink（五）_写入Es

300

15分2秒

054_第五章_Sink（六）_写入MySQL

360

4分38秒

055_第五章_Sink（七）_自定义Sink

340

16分54秒

056_第六章_时间语义

390

6分49秒

057_第六章_事件时间和窗口

420

6分55秒

058_第六章_水位线的概念

380

18分39秒

059_第六章_水位线的原理和特性

450

9分57秒

060_第六章_水位线生成策略

360

20分41秒

061_第六章_Flink内置水位线生成策略

460

7分2秒

062_第六章_自定义水位线生成

310

4分25秒

063_第六章_在自定义数据源中生成水位线

400

10分3秒

064_第六章_水位线的传递

430

11分58秒

065_第六章_窗口的概念

380

16分23秒

066_第六章_窗口的分类

260

7分55秒

067_第六章_窗口API概览

360

17分12秒

068_第六章_窗口分配器

370

4分49秒

069_第六章_窗口函数整体介绍

360

7分26秒

070_第六章_增量聚合函数（一）_ReduceFunction

370

21分6秒

071_第六章_增量聚合函数（二）_AggregateFunction

440

21分14秒

072_第六章_全窗口函数

460

17分44秒

073_第六章_增量聚合和全窗口函数结合使用

380

16分23秒

074_第六章_测试水位线和窗口

330

15分36秒

075_第六章_其它可选窗口API

370

7分27秒

076_第六章_处理迟到数据（一）_整体介绍

390

6分13秒

077_第六章_处理迟到数据（二）_代码实现

390

10分5秒

078_第六章_处理迟到数据（三）_运行测试

380

17分55秒

079_第七章_基本处理函数（ProcessFunction）

380

7分32秒

080_第七章_处理函数的分类

320

13分18秒

081_第七章_KeyedProcessFunction（一）_处理时间定时器

360

15分45秒

082_第七章_KeyedProcessFunction（二）_事件时间定时器

430

6分17秒

083_第七章_窗口处理函数

390

19分3秒

084_第七章_TopN（一）_使用ProcessAllWindowFunction

480

12分20秒

085_第七章_TopN（二）_使用KeyedProcessFunction（一）

370

14分43秒

086_第七章_TopN（三）_使用KeyedProcessFunction（二）

340

5分26秒

087_第八章_使用Filter实现分流

340

9分54秒

088_第八章_使用侧输出流实现分流

380

14分40秒

089_第八章_联合（Union）

380

10分27秒

090_第八章_连接（Connect）

380

19分41秒

091_第八章_实时对账（一）_基本框架

340

11分55秒

092_第八章_实时对账（二）_具体实现

370

5分40秒

093_第八章_广播连接流

350

15分56秒

094_第八章_窗口联结

380

17分12秒

095_第八章_间隔联结

370

9分6秒

096_第八章_窗口同组联结

310

7分34秒

097_第九章_状态的概念

400

5分51秒

098_第九章_状态的管理

420

9分37秒

099_第九章_状态的分类

360

100

8分40秒

100_第九章_Keyed State概念和特点

340

101

13分19秒

101_第九章_KeyedState类型（一）_值状态

390

102

11分20秒

102_第九章_KeyedState类型（二）_列表状态和映射状态

430

103

13分2秒

103_第九章_KeyedState类型（三）_归约状态和聚合状态

270

104

19分46秒

104_第九章_KeyedState应用（一）_值状态

330

105

12分49秒

105_第九章_KeyedState应用（二）_列表状态

340

106

16分33秒

106_第九章_KeyedState应用（三）_映射状态

330

107

16分47秒

107_第九章_KeyedState应用（四）_聚合状态

320

108

10分10秒

108_第九章_状态生存时间（TTL）

320

109

11分10秒

109_第九章_算子状态的概念和类型

370

110

20分40秒

110_第九章_算子状态应用实例

350

111

8分36秒

111_第九章_广播状态的概念和用法

420

112

23分24秒

112_第九章_广播状态应用实例

410

113

3分54秒

113_第九章_状态持久化（一）_检查点

400

114

12分31秒

114_第九章_状态持久化（二）_状态后端

310

115

16分7秒

115_第十章_检查点的保存

390

116

6分20秒

116_第十章_从检查点恢复状态

340

117

8分34秒

117_第十章_检查点分界线

360

118

16分48秒

118_第十章_检查点算法

360

119

15分5秒

119_第十章_检查点的配置

350

120

10分49秒

120_第十章_保存点

410

121

10分2秒

121_第十章_状态一致性

310

122

11分30秒

122_第十章_端到端状态一致性（一）

360

123

15分17秒

123_第十章_端到端状态一致性（二）

440

124

14分12秒

124_第十章_Flink和Kafka连接的精确一次

390

125

13分22秒

125_第十一章_Table API和SQL整体介绍

360

126

18分16秒

126_第十一章_快速上手

320

127

8分55秒

127_第十一章_整体程序架构

400

128

10分18秒

128_第十一章_表环境

340

129

12分41秒

129_第十一章_创建表

410

130

12分17秒

130_第十一章_表的查询

380

131

6分58秒

131_第十一章_输出表

390

132

13分20秒

132_第十一章_表转换成流

400

133

7分56秒

133_第十一章_流转换成表

340

134

9分10秒

134_第十一章_支持的数据类型

330

135

11分1秒

135_第十一章_动态表和持续查询

390

136

17分1秒

136_第十一章_持续查询的过程

420

137

12分45秒

137_第十一章_动态表编码为流

380

138

19分23秒

138_第十一章_时间属性（一）_在DDL中定义

450

139

10分22秒

139_第十一章_时间属性（二）_流转换为表时定义

430

140

3分30秒

140_第十一章_时间属性（三）_处理时间的定义

370

141

14分43秒

141_第十一章_窗口

320

142

8分14秒

142_第十一章_分组聚合

410

143

14分17秒

143_第十一章_窗口聚合

360

144

16分10秒

144_第十一章_开窗（Over）聚合

310

145

21分27秒

145_第十一章_普通TopN

410

146

11分57秒

146_第十一章_窗口TopN

450

147

7分51秒

147_第十一章_常规Join

330

148

7分46秒

148_第十一章_间隔Join

410

149

14分50秒

149_第十一章_系统函数

350

150

8分1秒

150_第十一章_UDF（一）_整体介绍

340

151

8分19秒

151_第十一章_UDF（二）_标量函数

400

152

17分54秒

152_第十一章_UDF（三）_表函数

440

153

20分45秒

153_第十一章_UDF（四）_聚合函数

340

154

5分32秒

154_第十一章_UDF（五）_表聚合函数（一）_整体介绍

430

155

18分6秒

155_第十一章_UDF（五）_表聚合函数（二）_代码实现

440

156

11分46秒

156_第十一章_UDF（五）_表聚合函数（三）_调用和测试

390

157

10分15秒

157_第十一章_SQL客户端

320

158

15分4秒

158_第十一章_连接到常见的外部系统

340

159

10分27秒

159_第十一章_连接到Hive

410

160

17分17秒

160_第十二章_CEP的基本概念和应用场景

380

161

13分52秒

161_第十二章_快速上手（一）_程序架构和定义模式

390

162

10分55秒

162_第十二章_快速上手（二）_检测处理和测试

400

163

7分11秒

163_第十二章_个体模式（一）_整体介绍

420

164

10分39秒

164_第十二章_个体模式（二）_量词(1)

440

165

10分39秒

164_第十二章_个体模式（二）_量词

360

166

11分10秒

165_第十二章_个体模式（三）_条件

320

167

11分21秒

166_第十二章_组合模式

430

168

4分32秒

167_第十二章_模式组

350

169

9分0秒

168_第十二章_匹配后跳过策略

370

170

13分49秒

169_第十二章_处理匹配事件

480

171

9分36秒

170_第十二章_处理超时事件（一）_基本流程

410

172

19分7秒

171_第十二章_处理超时事件（二）_应用实例

320

173

7分0秒

172_第十二章_处理迟到数据

370

174

8分11秒

173_第十二章_状态机实现（一）_基本原理

400

175

13分45秒

174_第十二章_状态机实现（二）_代码实现

480

176

10分9秒

175_课程总结

350

120_第十章_保存点

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐