文章/答案/技术大牛

发布

首页视频114_第九章_状态持久化（二）_状态后端

114_第九章_状态持久化（二）_状态后端

2022-12-022022-12-02 16:02:30播放31

点赞0 收藏 0

尚硅谷大数学科--选学技术丰富/尚硅谷大数据技术之Flink1.13（Scala版）/视频/114_第九章_状态持久化（二）_状态后端.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
现在我们已经了解了，在状态管理机制当中，如果说我们想要发生故障的时候，能够把之前的状态恢复出来，最重要的当然就是要做一个持久化的保存，那这样一个持久化存盘保存的功能，在flink里边就是用检查点checkpoint来进行实现的，所以前面我们已经了解了checkpoint检查点到底是什么。那接下来呢，我们就需要进一步去考虑，在flink这样一个分布式的流处理系统当中，我们有很多个不同的组件，比如说之前我们说过有job manager。有task manager。哎，那在进行检查点这快照保存的过程当中，他们分别又是怎么去做的呢？诶，所以接下来我们可以梳理一下整个检查点保存的过程啊，那这个过程呢，当然job manager会起到一个比较重要的作用啊，它本身扮演的就是一个中央协调调度的角色啊，那这里就是由job manager向所有的task manager发出一个触发检查点保存的命令。
01:05
啊，那他me就是本身它都是在执行并行任务的嘛，那这个时候接收到命令，就会把自己当前的任务状态做一个快照保存，写入到远程的持久化存储介制当中，完成之后他也不管，就是我们当前都是各自为政，并行执行，他也不管其他并行子任务到底完成了没有，只要自己的状态已经保存完毕，那就向装manager返回一个确认信息。所以我们看到整个这个过程当中，只有job manager才能够全局的知道当前检查点到底保存到什么程度了，只有所有的task manager它的状态都保存完毕了，向job manager返回确认信息了，这个时候job manager才会真正意义上的去确认当前检查点保存成功，哎，这就是整个检查点保存的一个过程，因为它是分布式的，所以我们发现啊，这是需要job manager去做一个中央协调的啊，那整个这个过程呢，除了做协调调度之外，那另外我们还会考虑到所有状态的存储、访问、维护这个过程，那所有跟状态管理相关的这些操作呢，在flink当中都是用一个可插拔的组件来决定的啊，那这个组件在弗林格当中就被叫做状态后端state back。
02:28
的，那这样一个状态后端，它主要负责两件事情，一个就是本地的状态管理啊，因为我们说关于这个检查点的中央协调调度，那要应该是跟job manager这边有关系啊，那另外呢，我们还要管理它的状态具体的访问和维护，那显然这又跟task manager这边也有关联，所以本地状态的管理涉及到这一部分内容，另外还涉及到把检查点checkpoint写入远程的持久化存储空间当中，所以这两部分功能合在一起，就由状态后端这个组件单独来进行处理。
03:06
啊，这样去介绍的话，状太后端看起来有点抽象，这到底是个什么东西呢？呃，对于弗林克而言，我们说它是一个开箱即用的可插拔的组件，本身link支持的状态后端有这样的两种类型，一种叫做哈希表状态后端啊，那具体在这个源码里边啊，这个类就叫做哈希map state。另外一个呢，叫做内嵌式的rock DB状态后端embedded rock DB state back啊，那如果说没有特别配置的话，我们默认的状态后端就是第一种哈希表状态后端哈希map。这是什么意思呢？我们分别来介绍一下这两种状态后端，分别他们处理前面我们所说的这两件事儿的时候到底是怎么做的？首先这个哈希表状态后端啊，顾名思义，它是把状态放在类似于哈希表这样的一个数据结构里面进行保存的，那我们说这个数据到底是存到哪了呢？当然就是放在。
04:05
Task manager本地的内存里面去了啊，之前我们说的啊，弗link进行有状态的流处理的时候，就是直接把状态保存在本地内存，其实说的就是这种默认状态啊，那具体实现呢，那就是我们直接在内部把状态看成一个对象保存在task manager的GVM堆上啊，那这样的话，Flink对它进行管理的时候，它的组织结构呢，就变成了一个k value这样的形式啊，也就是一个K对应着一个值，一个K对应着一个值，这就是我们当前保存状态的一个具体的数据形式，所以它的底层就是一个哈希map，所以我们就把这种状态后端叫做哈希map状态后端啊，前面我们所介绍过的像这个聚合操作啊，还有这个窗口操作，收集数据，把所有的数据收集起来，另外还有触发器啊，涉及到的一些状态，以及我们自定义编程的时候啊，做状态编程时候定义的那些状态，默认都是以这种形式。
05:06
直接在本地内存做一个保存的，它是直接保存在task manager的GM堆上啊，这是关于本地的状态管理，那另外还有一个就是检查点checkpoint的到底要写到哪里去呢？啊，那对于检查点而言，一般都是直接放在持久化的分布式文件系统当中的啊，这最常见的当然就是HDFS了啊，那一般情况呢，我们可以通过在配置文件当中专门去指定所谓的检查点存储check on storage来单独的进行一个指定。所以我们这里可以看到啊，对于这种状态后端，它的特点其实就是默认情况下本地状态全部放在内存里边，那所以它的读写速度是非常快的，计算性能非常的好啊，那代价呢，就是我们当前所有的状态是占用了内存，那如果说当前这个状态会随着时间的进展，数据的到来会不停的增大的话，那最终就会把内存完全耗尽，所以有些时候出于这一个系统资源分配的考量，我们可能还需要有其他的一些替代方案。
06:18
那怎么办呢？那就可以把它配成内嵌式的rock DB状态后端，这就是我们说的第二种状态后端，这种呢，主要就是使用了rocks DB来作为本地状态的存储介质，哎，那我们知道rocks DB它本身是什么呢？其实rock DB它是由Facebook开发的啊，类似于Google的level DB一样，是一种内嵌式的K存储介质啊，也就是说它也是直接把所有的数据按照key value这样的形式去进行保存的，诶，那跟我们之前这个哈希map不同的一点是，现在不是存在内存里了，而是直接可以把数据持久化到本地硬盘上，所以本质上来讲，有时候rock DB可以作为我们整个系统内置的一个数据库来进行数据保存啊。
07:07
那跟前面哈希map哈希表这种形式内存式的存储不一样的，它既然是可以持久化到本地硬盘，那当然数据本身的安全性就会更好，而且当状态不停的增大的时候，诶，我们对于系统性能的耗费也是比较小的，因为只是硬盘的扩充嘛，硬盘相对于内存而言肯定是非常非常大了，我们几乎可以认为它是接近于无限扩展的，哎，那所以对于状态非常多非常大的场景rock DB就非常的有用啊，那当然了，他也会有对应的代价，因为。现在状态放在了rocks DB当中，所以数据去进行存储的时候，那就需要做序列化操作，最终存储的是序列化之后的字节数组啊，那如果说做状态的读取和写入都需要进行序列化反序列化操作，那这样的话访问性能就会差一些。
08:07
对于计算的效率会降低。所以整体来看的话，我们其实就是对于之前哈希表状态后端的一种调整，或者说一种权衡，就是我们一方面是希望当前的计算速度快，另外一方面呢，是希望当前的可扩展性更强，能够容纳更加海量的状态，哎，那这种时候我们就需要掌握一个平衡了，所以内嵌式rock DB状态后端呢，其实就是以牺牲读写性能为代价，实现了状态的海量扩展啊，能够容纳更多的状态。呃，另外呢，对于这种状态后端的处理方式，它始终执行的是异步的快照，也就是说不会因为保存检查点而阻塞数据的处理，就是数据该处理继续处理，我们这边保存检查点的时候，单独的去做一个异步执行，另外呢，它还提供了增量式的保存检查点的机制啊，这在很多情况下其实是可以大大的提升保存效率。
09:07
啊，当然了，呃，对于弗link而言，在未来的版本当中啊，呃，比如说马上要推出的弗link15.0版本啊，那预计就会完全引入增量式保存检查点这样一个机制，就不再局限在rock DB这种状态后端了啊，那有了这种方式之后，我们做检查点的效率肯定就会更高，所以在实际选择的时候，这两种状态后端我们到底选什么呢？哎，那其实主要就是看我们的业务需求，到底是要性能更好，处理更快，还是说要考虑容纳更多的状态，保证我们应用进行扩展之后能够处理海量的数据，海量的状态啊。那最后呢，我们再来说一下状态后端的配置，其实这个配置非常简单，最经典的方式那就应该是直接在flink-com点压某文件当中去配置整个集群的状态后端，哎，那对应的那个K呢，是state.back哦，这里默认的这个项默认的值就叫做哈希map，如果说我们想配成rock DB状态后端的话，那可以改成rocks DB，注意都是小写啊，直接改成rock DB就可以了。
10:20
啊，那另外还有一个可选的配置项，就是存放检查点的文件路径，就是state checkpoints.DR啊，那我们知道默认情放下啊，这个存放检查点都是会放在一个分布式的文件系统当中，前面我们说哈希表状态后端它是这么去放的，那rock DB呢？Rock DB默认情况下也是会写入远程的持久化文件系统，一般都是HDFS啊，所以这里我们可以单独的去配一下对应的存放路径。这就是我们在实际应用当中最常见的一个配置状态后端以及检查点写入位置的一个方式啊，那另外还有一种比较特殊的情况，就是我们还可以直接在代码当中去进行配置啊，那这个之前我们在介绍并行度设置的时候其实也提到过啊，如果说我们在配置文件里边去配置默认并行度的话，那就相当于是对整个集群全局生效，所有提交的作业都是默认以这个并行度为准的，那假如说我们想想要为每一个单独提交的作业去设置并行度的话，那可以在提交作业的时候去指定，也可以在代码当中啊env直接去全局的set拍。
11:34
那同样现在呢，也可以在代码当中调用，因为点set state back end，这就是设置状态后端只针对当前的作业生效，那这里边比方说里边要传的是什么呢？哎，那就是对应的一个状态后端的类型的具体实例了，比方说我们用一个has map state back，那如果说要改成rock DB，怎么改呢？那就你有一个embeded rock DB state back，只要改一个这个就可以。
12:04
啊，那当然了，如果说我们是在idea里面去做测试的话啊，本身是没有rocks DB相关的依赖支持的，那这个时候呢，还需要引入flink state back rock DB对应的这个依赖支持，那在实际的集群环境里边，其实这个就不需要去引入了，因为集群环境里边所有的依赖都是包含进去。这就是关于状态的持久化和状态后端的配置。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之Flink1.13（Scala版）

（114/176）

6分52秒

001_Flink课程（Scala版）简介

460

9分29秒

002_第一章_Flink的起源和发展

470

6分5秒

003_第一章_Flink框架处理流程

310

6分20秒

004_第一章_Flink应用场景

380

8分41秒

005_第一章_为什么要用Flink

320

18分2秒

006_第一章_数据处理框架的演变

390

6分57秒

007_第一章_Flink的分层API

370

10分5秒

008_第一章_Flink和Spark的区别

510

12分57秒

009_第二章_Flink环境准备和创建项目

380

18分41秒

010_第二章_批处理WordCount

440

13分48秒

011_第二章_有界流处理WordCount

370

13分35秒

012_第二章_无界流处理WordCount

370

7分53秒

013_第三章_Flink基本运行架构

430

21分6秒

014_第三章_本地启动Flink集群

510

6分50秒

015_第三章_远程集群启动

370

11分56秒

016_第三章_Web UI 提交作业

440

8分49秒

017_第三章_命令行提交作业

400

10分42秒

018_第三章_Flink部署模式

310

3分45秒

019_第三章_独立模式的部署

370

18分23秒

020_第三章_YARN模式的部署

280

13分39秒

021_第四章_Flink系统架构

440

10分59秒

022_第四章_Flink运行时架构（二）_作业提交流程

450

7分37秒

023_第四章_数据流图

430

11分54秒

024_第四章_并行度

410

14分50秒

025_第四章_算子链

430

6分13秒

026_第四章_执行图

420

17分27秒

027_第四章_Task Slots

380

5分40秒

028_第四章_Flink的任务调度

370

6分20秒

029_第五章_DataStream API整体介绍

330

9分34秒

030_第五章_执行环境

400

17分18秒

031_第五章_Source（一）_读取有界数据

410

14分28秒

032_第五章_Source（二）_读取Kafka

420

15分47秒

033_第五章_Source（三）_读取自定义数据源

330

10分15秒

034_第五章_Flink支持的类型系统

440

9分35秒

035_第五章_Transform（一）_Map

370

5分49秒

036_第五章_Transform（二）_Filter

390

11分24秒

037_第五章_Transform（三）_FlatMap

380

11分6秒

038_第五章_Transform（四）_KeyBy

430

14分3秒

039_第五章_Transform（五）_简单聚合

380

18分52秒

040_第五章_Transform（六）_归约聚合

420

12分25秒

041_第五章_函数类

330

14分7秒

042_第五章_富函数类

430

8分37秒

043_第五章_物理分区（一）_整体介绍

410

3分48秒

044_第五章_物理分区（二）_Shuffle

370

4分43秒

045_第五章_物理分区（三）_Rebalance

400

13分17秒

046_第五章_物理分区（四）_Rescale

410

3分44秒

047_第五章_物理分区（五）_广播和全局分区

360

6分26秒

048_第五章_物理分区（六）_自定义分区

390

10分30秒

049_第五章_Sink（一）_Flink连接到外部系统

480

13分58秒

050_第五章_Sink（二）_写入文件

440

13分38秒

051_第五章_Sink（三）_写入Kafka

420

14分19秒

052_第五章_Sink（四）_写入Redis

410

15分25秒

053_第五章_Sink（五）_写入Es

300

15分2秒

054_第五章_Sink（六）_写入MySQL

360

4分38秒

055_第五章_Sink（七）_自定义Sink

340

16分54秒

056_第六章_时间语义

390

6分49秒

057_第六章_事件时间和窗口

420

6分55秒

058_第六章_水位线的概念

380

18分39秒

059_第六章_水位线的原理和特性

450

9分57秒

060_第六章_水位线生成策略

360

20分41秒

061_第六章_Flink内置水位线生成策略

460

7分2秒

062_第六章_自定义水位线生成

310

4分25秒

063_第六章_在自定义数据源中生成水位线

400

10分3秒

064_第六章_水位线的传递

430

11分58秒

065_第六章_窗口的概念

380

16分23秒

066_第六章_窗口的分类

260

7分55秒

067_第六章_窗口API概览

360

17分12秒

068_第六章_窗口分配器

370

4分49秒

069_第六章_窗口函数整体介绍

360

7分26秒

070_第六章_增量聚合函数（一）_ReduceFunction

370

21分6秒

071_第六章_增量聚合函数（二）_AggregateFunction

440

21分14秒

072_第六章_全窗口函数

460

17分44秒

073_第六章_增量聚合和全窗口函数结合使用

380

16分23秒

074_第六章_测试水位线和窗口

330

15分36秒

075_第六章_其它可选窗口API

370

7分27秒

076_第六章_处理迟到数据（一）_整体介绍

390

6分13秒

077_第六章_处理迟到数据（二）_代码实现

390

10分5秒

078_第六章_处理迟到数据（三）_运行测试

380

17分55秒

079_第七章_基本处理函数（ProcessFunction）

380

7分32秒

080_第七章_处理函数的分类

320

13分18秒

081_第七章_KeyedProcessFunction（一）_处理时间定时器

360

15分45秒

082_第七章_KeyedProcessFunction（二）_事件时间定时器

430

6分17秒

083_第七章_窗口处理函数

390

19分3秒

084_第七章_TopN（一）_使用ProcessAllWindowFunction

480

12分20秒

085_第七章_TopN（二）_使用KeyedProcessFunction（一）

370

14分43秒

086_第七章_TopN（三）_使用KeyedProcessFunction（二）

340

5分26秒

087_第八章_使用Filter实现分流

340

9分54秒

088_第八章_使用侧输出流实现分流

380

14分40秒

089_第八章_联合（Union）

380

10分27秒

090_第八章_连接（Connect）

380

19分41秒

091_第八章_实时对账（一）_基本框架

340

11分55秒

092_第八章_实时对账（二）_具体实现

370

5分40秒

093_第八章_广播连接流

350

15分56秒

094_第八章_窗口联结

380

17分12秒

095_第八章_间隔联结

370

9分6秒

096_第八章_窗口同组联结

310

7分34秒

097_第九章_状态的概念

400

5分51秒

098_第九章_状态的管理

420

9分37秒

099_第九章_状态的分类

360

100

8分40秒

100_第九章_Keyed State概念和特点

340

101

13分19秒

101_第九章_KeyedState类型（一）_值状态

390

102

11分20秒

102_第九章_KeyedState类型（二）_列表状态和映射状态

430

103

13分2秒

103_第九章_KeyedState类型（三）_归约状态和聚合状态

270

104

19分46秒

104_第九章_KeyedState应用（一）_值状态

330

105

12分49秒

105_第九章_KeyedState应用（二）_列表状态

340

106

16分33秒

106_第九章_KeyedState应用（三）_映射状态

330

107

16分47秒

107_第九章_KeyedState应用（四）_聚合状态

320

108

10分10秒

108_第九章_状态生存时间（TTL）

320

109

11分10秒

109_第九章_算子状态的概念和类型

370

110

20分40秒

110_第九章_算子状态应用实例

350

111

8分36秒

111_第九章_广播状态的概念和用法

420

112

23分24秒

112_第九章_广播状态应用实例

410

113

3分54秒

113_第九章_状态持久化（一）_检查点

400

114

12分31秒

114_第九章_状态持久化（二）_状态后端

310

115

16分7秒

115_第十章_检查点的保存

390

116

6分20秒

116_第十章_从检查点恢复状态

340

117

8分34秒

117_第十章_检查点分界线

360

118

16分48秒

118_第十章_检查点算法

360

119

15分5秒

119_第十章_检查点的配置

350

120

10分49秒

120_第十章_保存点

410

121

10分2秒

121_第十章_状态一致性

310

122

11分30秒

122_第十章_端到端状态一致性（一）

360

123

15分17秒

123_第十章_端到端状态一致性（二）

440

124

14分12秒

124_第十章_Flink和Kafka连接的精确一次

390

125

13分22秒

125_第十一章_Table API和SQL整体介绍

360

126

18分16秒

126_第十一章_快速上手

320

127

8分55秒

127_第十一章_整体程序架构

400

128

10分18秒

128_第十一章_表环境

340

129

12分41秒

129_第十一章_创建表

410

130

12分17秒

130_第十一章_表的查询

380

131

6分58秒

131_第十一章_输出表

390

132

13分20秒

132_第十一章_表转换成流

400

133

7分56秒

133_第十一章_流转换成表

340

134

9分10秒

134_第十一章_支持的数据类型

330

135

11分1秒

135_第十一章_动态表和持续查询

390

136

17分1秒

136_第十一章_持续查询的过程

420

137

12分45秒

137_第十一章_动态表编码为流

380

138

19分23秒

138_第十一章_时间属性（一）_在DDL中定义

450

139

10分22秒

139_第十一章_时间属性（二）_流转换为表时定义

430

140

3分30秒

140_第十一章_时间属性（三）_处理时间的定义

370

141

14分43秒

141_第十一章_窗口

320

142

8分14秒

142_第十一章_分组聚合

410

143

14分17秒

143_第十一章_窗口聚合

360

144

16分10秒

144_第十一章_开窗（Over）聚合

310

145

21分27秒

145_第十一章_普通TopN

410

146

11分57秒

146_第十一章_窗口TopN

450

147

7分51秒

147_第十一章_常规Join

330

148

7分46秒

148_第十一章_间隔Join

410

149

14分50秒

149_第十一章_系统函数

350

150

8分1秒

150_第十一章_UDF（一）_整体介绍

340

151

8分19秒

151_第十一章_UDF（二）_标量函数

400

152

17分54秒

152_第十一章_UDF（三）_表函数

440

153

20分45秒

153_第十一章_UDF（四）_聚合函数

340

154

5分32秒

154_第十一章_UDF（五）_表聚合函数（一）_整体介绍

430

155

18分6秒

155_第十一章_UDF（五）_表聚合函数（二）_代码实现

440

156

11分46秒

156_第十一章_UDF（五）_表聚合函数（三）_调用和测试

390

157

10分15秒

157_第十一章_SQL客户端

320

158

15分4秒

158_第十一章_连接到常见的外部系统

340

159

10分27秒

159_第十一章_连接到Hive

410

160

17分17秒

160_第十二章_CEP的基本概念和应用场景

380

161

13分52秒

161_第十二章_快速上手（一）_程序架构和定义模式

390

162

10分55秒

162_第十二章_快速上手（二）_检测处理和测试

400

163

7分11秒

163_第十二章_个体模式（一）_整体介绍

420

164

10分39秒

164_第十二章_个体模式（二）_量词(1)

440

165

10分39秒

164_第十二章_个体模式（二）_量词

360

166

11分10秒

165_第十二章_个体模式（三）_条件

320

167

11分21秒

166_第十二章_组合模式

430

168

4分32秒

167_第十二章_模式组

350

169

9分0秒

168_第十二章_匹配后跳过策略

370

170

13分49秒

169_第十二章_处理匹配事件

480

171

9分36秒

170_第十二章_处理超时事件（一）_基本流程

410

172

19分7秒

171_第十二章_处理超时事件（二）_应用实例

320

173

7分0秒

172_第十二章_处理迟到数据

370

174

8分11秒

173_第十二章_状态机实现（一）_基本原理

400

175

13分45秒

174_第十二章_状态机实现（二）_代码实现

480

176

10分9秒

175_课程总结

350

114_第九章_状态持久化（二）_状态后端

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐