文章/答案/技术大牛

发布

首页视频122_第十章_端到端状态一致性（一）

122_第十章_端到端状态一致性（一）

2022-12-022022-12-02 16:02:30播放36

点赞0 收藏 0

尚硅谷大数学科--选学技术丰富/尚硅谷大数据技术之Flink1.13（Scala版）/视频/122_第十章_端到端状态一致性（一）.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
我们已经了解了状态一致性的概念和级别啊，那我们知道在实际应用的过程当中，当然是最希望去做到精确一次once这样的状态一致性保证啊，那最后的处理结果肯定是正确的嘛。前面我们也说了，这里有两个关键点，一个就是当前我们读取的数据源应该能够重放数据，保证数据不丢啊，那另外还有一个呢，就是内部要开启检查点啊，我们利用这样一个checkpoint的机制，就可以保证发生故障进行回滚之后，所有的数据只被处理一次。那这个过程大家可能还稍微有一点疑惑啊，就是说诶这个感觉稍微有点不对啊，那就像之前我们这个从检查点恢复状态的时候，之前保存检查点之后啊，有一些数据，有可能我们这里边已经做过计算了，他已经读取进来，然后后面已经进行了统计了，然后你恢复状态之后再去重新进行处理，重新进行重放啊读取处理，这不相当于又处理了一遍吗？你怎么能说它是只处理了一次呢？
01:06
注意我们这里说的并不是处理的这个过程只做一次，那这样的话你就重放数据，那一定会重新计算嘛，啊这个是没有办法避免的，我们要的是结果里边。对应的这个数据处理了一次，而且只处理了一次啊，就是比方说如果说啊，之前我们在处理到。Hello，这个数据的时候，哎，这个时候第一个节点分区这里直接挂掉了，那这个时候如果恢复之前的状态的话，那相当于在我们sum这个算子的状态里边对应的哈，这个数据就没有统计进来，如果没有统计进来的话，后边重放对应在它这个状态里边的统计体现也就只出现一次，这样的话就保证。计算一次，而且只计算一次，这是完全没有问题的。但是呢，我们就会想到啊，要这么说的话，这精确一次的状态一致性那就非常容易保证啊，哎，我只要开启检查点不就完事了吗？
02:03
啊，其实实际应用的时候没那么简单，因为我们只看到了flink内部状态的结果是正确的。那我们知道啊，Link本身它应该还应该要有一个输出啊。最终他得到的计算结果是要写入到外部系统的，给其他的一些外部应用去提供数据的，那假如说我们之前处理到中间的时候啊，没有做检查点保存的那些中间状态，然后对应的输出就已经写入到了外部的一些其他的存储空间呢。如果已经写进去的话，你后边如果再做回滚，再做重新处理，再写一遍，那不就相当于做了重复写入了吗？诶，所以我们会发现啊，在真实考虑这个应用场景的时候，不光要考虑到flink内部状态的正确，还要考虑到诶连接外部系统到底是否做了重复的写入。那完整的一个流处理程序，我们所需要考虑它的状态一致性啊，考虑它结果正确的范围应该就包括了起始的数据源，中间的flink处理系统，最后还有S任务，也就是写入到外部系统这样一步操作，诶，那整个完整的这个流程，如果说都能保证处理一次，而且只处理一次的话，诶，那这才是我们真正想要的exactly once精确一次的状态一致性保证，这就是我们所说的端到端的状态一致性。
03:35
啊，那端到端到底能够达到什么样的状态一致性级别呢？啊，那前面我们说过啊，这就相当于是整个串联在一起的三步操作。整个的流程到底达到什么级别，当然要看短板了。木桶原理嘛，诶，那。在这中间，假如最弱的一环，哎，比如说我们知道啊，如果读取数据源的时候，这个外部数据源它就根本不能重放数据，那很显然这个数据有可能丢嘛，那一旦这个数据有可能丢，那后面就不用考虑了，它的端到端状态一致性最多就只能达到at most once。
04:13
所以我们说端到端的状态一致性是取决于整个流程当中最弱的那个环节啊，那当然了，整体来看的话，假如输入源这一端啊，假如它可以重置偏移量的话，诶，那我们就可以直接让这个SS算子这里保存一个当前读取数据的偏移量，然后一旦发生故障之后，重置偏移量，重新读取重放数据就可以了，这样的话，那其实就至少能保证这个数据不会丢啊，所以。相当于如果想要达到at least once至少一次状态一致性级别的话。主要看。数据源是否能够重放数据就可以了啊，但是如果说想要达到端到端的精确一次状态一致性的话，那这个就比较复杂了啊，那首先我们最前面这里也需要能重放数据，其次呢，诶中间弗Li格的处理流程得开启拆框，另外还有这个think端输出到外部系统的时候也得有对应的保证，所以接下来呢，我们就来详细的说一说端到端的精确一次状态一致性到底怎么样去保证？
05:21
这是在我们实际应用当中，其实是最难做到，也是最想要做到的一个状态，一致性的语义啊。啊，那我们知道想要做到端到端的精确一次，那我们说有三个环节嘛，每一环节都得有保证，那我们就单独拆开来看吧，首先输入端这个就不用说了，必须要能够重置偏移量，能够重放数据，假如说不能重放数据的话，那数据就有可能丢，啥都不要说了，那就是at one。所以这是前提，必须能够重放数据，当然了，只要输入端能够重放数据，可以说我们整个这个系统啊，端到端就能够做到数据不丢了，就能够达到at least once，也就是至少一次的状态一致性语义了。
06:07
然后接下来我们就要看了，内部当然是开启link的检查点机制，最后最关键的就是要看输出端的保证。而对于输出端在写入到外部系统的过程当中呢，诶，最大的问题其实就是因为我们数据可以重放，所以假如之前没有保存在checkpoint检查点里边的那些数据已经它对应的输出结果啊，已经写入到外部系统的话，那之后重放的时候就相当于要重新计算，然后再写一遍啊，这个时候就相当于做了重复写入嘛，怎么样保证这些重放数据只被写入一次，哎，那这就是我们所要去考察的关键。这里就有很多理论性上的一些介绍了啊哎，那这里我们主要给大家介绍两种能够保证精确一次一致性写入的方式，那一种叫做幂等写入，另外一种叫做事物写入，那对应的这两种方式呢，都需要外部的存储系统。
07:11
有相应的支持啊，那link呢，也为这两种写入方式提供了一些think function的接口啊，那接下来呢，我们就分别来进行一个讲解，首先是幂等写入，幂等写入其实比较简单啊，前面我们说过这个幂等操作，像我们说这个UV啊，那UV那就相当于重复的数据来了之后，对我们后边写入的结果没有影响，哎，那统计的这个UV值那就没关系嘛，它在概念上的定义呢，其实就是说一个操作可以重复执行很多次，但是呢，只导致一次结果更改，也就是说相同的数据到来，或者说相同的操作去执行，后面就不再生效了啊，只有第一次起作用。那我们知道这个最经典的例子啊，就是比方说这样一个函数FX等于E的X次方，如果对它进行求导的话，我们知道它求导就是自己嘛，所以无论他做几阶求导，得到的都是自身，所以对它进行求导操作，这就是一个幂等的操作。
08:15
啊，那我们知道在数据处理领域啊，在这个数据结构里边，最经典的当然就是哈希map的插入操作了，我们知道哈希map里边存储的是key value，如果是同样的一个数据的话，哎，我们来了之后都是A是K，然后它的抗值一都要插入这样一条数据的话，那你插入了一次A1，把它这个value更新成一了，下一次如果再要更新成一的话。那我们知道啊，K就决定了当前它这个数据存放的位置，一是它存放的值，那你位置和值都一样，那就相当于没做更改吧。所以在这种场景下，我们是可以做到重复的写入是不会影响最终的结果正确性啊，啊，那当然了，这就需要我们写入的外部系统，它是类似于哈希map这样的k value，对啊，针对他的K啊，重复的写入其实是没有影响的，比如说我们在里边做了一个键值论的存储，哎，之前我们在介绍s function的时候啊，直接写入到的时候，一个K一个value，它如果是相同数据的话啊，那肯定不会有任何的更改啊呃，相当于最后存的还是同一个值。
09:28
那或者关系数据库，像MYSQL，我们也可以指定当前的primary key啊，那对应的key所存放的数据重复写入也是不会改变。这里需要注意的一点是，它所保证的这个一致性呢，其实是最终结果的一致性，为什么呢？因为对于这样一个幂等写入，在发生故障进行回滚的时候，中间可能会出现状态短暂的不一致。这是什么意思呢？就是比方说啊，我们一直在统计这个work count，然后不停的插入对应的值，那可能呢，一开始A1，然后A2。
10:07
统计了两个，又来了，这个时候做了一个检查点快照的保存，所以我们存放的内容是A2啊，检查点里面恢复状态的话，恢复的也是A2，然后接下来继续处理，又来了一个A3。然后挂掉了。挂掉之后我们会想到啊，如果这些数据都已经直接写入到外部的某某一个这个兼值存储啊，比方说就是red，所以我们看到red里边存储呢，它已经是123已经变化到三了。这个时候如果发生故障。重新读取检查点去做恢复的话，那我们会发现啊，它又跳回到了二。所以是123又跳回到二，然后再变成三，诶之后追上了发生故障之前的那个状态，然后接下来456就可以继续增长了，最终统计的结果是对的，但是中间会出现一个短暂的回滚不一致的情况。
11:04
啊，这就是幂等写入的一个状态一致性的保证啊，啊，那我们会看到它并不完美啊，首先就是说，呃，中间我们会遇到这样的一个短暂的不一致，另外呢，即使是考虑最终结果的一致性，那你还得要求外部数据库啊，写入的这个存储设备得支持这样的一个k value键值存储才行。所以幂等写入它的限制其实还是比较多的。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之Flink1.13（Scala版）

（122/176）

6分52秒

001_Flink课程（Scala版）简介

460

9分29秒

002_第一章_Flink的起源和发展

470

6分5秒

003_第一章_Flink框架处理流程

310

6分20秒

004_第一章_Flink应用场景

380

8分41秒

005_第一章_为什么要用Flink

320

18分2秒

006_第一章_数据处理框架的演变

390

6分57秒

007_第一章_Flink的分层API

370

10分5秒

008_第一章_Flink和Spark的区别

510

12分57秒

009_第二章_Flink环境准备和创建项目

380

18分41秒

010_第二章_批处理WordCount

440

13分48秒

011_第二章_有界流处理WordCount

370

13分35秒

012_第二章_无界流处理WordCount

370

7分53秒

013_第三章_Flink基本运行架构

430

21分6秒

014_第三章_本地启动Flink集群

510

6分50秒

015_第三章_远程集群启动

370

11分56秒

016_第三章_Web UI 提交作业

440

8分49秒

017_第三章_命令行提交作业

400

10分42秒

018_第三章_Flink部署模式

310

3分45秒

019_第三章_独立模式的部署

370

18分23秒

020_第三章_YARN模式的部署

280

13分39秒

021_第四章_Flink系统架构

440

10分59秒

022_第四章_Flink运行时架构（二）_作业提交流程

450

7分37秒

023_第四章_数据流图

430

11分54秒

024_第四章_并行度

410

14分50秒

025_第四章_算子链

430

6分13秒

026_第四章_执行图

420

17分27秒

027_第四章_Task Slots

380

5分40秒

028_第四章_Flink的任务调度

370

6分20秒

029_第五章_DataStream API整体介绍

330

9分34秒

030_第五章_执行环境

400

17分18秒

031_第五章_Source（一）_读取有界数据

410

14分28秒

032_第五章_Source（二）_读取Kafka

420

15分47秒

033_第五章_Source（三）_读取自定义数据源

330

10分15秒

034_第五章_Flink支持的类型系统

440

9分35秒

035_第五章_Transform（一）_Map

370

5分49秒

036_第五章_Transform（二）_Filter

390

11分24秒

037_第五章_Transform（三）_FlatMap

380

11分6秒

038_第五章_Transform（四）_KeyBy

430

14分3秒

039_第五章_Transform（五）_简单聚合

380

18分52秒

040_第五章_Transform（六）_归约聚合

420

12分25秒

041_第五章_函数类

330

14分7秒

042_第五章_富函数类

430

8分37秒

043_第五章_物理分区（一）_整体介绍

410

3分48秒

044_第五章_物理分区（二）_Shuffle

370

4分43秒

045_第五章_物理分区（三）_Rebalance

400

13分17秒

046_第五章_物理分区（四）_Rescale

410

3分44秒

047_第五章_物理分区（五）_广播和全局分区

360

6分26秒

048_第五章_物理分区（六）_自定义分区

390

10分30秒

049_第五章_Sink（一）_Flink连接到外部系统

480

13分58秒

050_第五章_Sink（二）_写入文件

440

13分38秒

051_第五章_Sink（三）_写入Kafka

420

14分19秒

052_第五章_Sink（四）_写入Redis

410

15分25秒

053_第五章_Sink（五）_写入Es

300

15分2秒

054_第五章_Sink（六）_写入MySQL

360

4分38秒

055_第五章_Sink（七）_自定义Sink

340

16分54秒

056_第六章_时间语义

390

6分49秒

057_第六章_事件时间和窗口

420

6分55秒

058_第六章_水位线的概念

380

18分39秒

059_第六章_水位线的原理和特性

450

9分57秒

060_第六章_水位线生成策略

360

20分41秒

061_第六章_Flink内置水位线生成策略

460

7分2秒

062_第六章_自定义水位线生成

310

4分25秒

063_第六章_在自定义数据源中生成水位线

400

10分3秒

064_第六章_水位线的传递

430

11分58秒

065_第六章_窗口的概念

380

16分23秒

066_第六章_窗口的分类

260

7分55秒

067_第六章_窗口API概览

360

17分12秒

068_第六章_窗口分配器

370

4分49秒

069_第六章_窗口函数整体介绍

360

7分26秒

070_第六章_增量聚合函数（一）_ReduceFunction

370

21分6秒

071_第六章_增量聚合函数（二）_AggregateFunction

440

21分14秒

072_第六章_全窗口函数

460

17分44秒

073_第六章_增量聚合和全窗口函数结合使用

380

16分23秒

074_第六章_测试水位线和窗口

330

15分36秒

075_第六章_其它可选窗口API

370

7分27秒

076_第六章_处理迟到数据（一）_整体介绍

390

6分13秒

077_第六章_处理迟到数据（二）_代码实现

390

10分5秒

078_第六章_处理迟到数据（三）_运行测试

380

17分55秒

079_第七章_基本处理函数（ProcessFunction）

380

7分32秒

080_第七章_处理函数的分类

320

13分18秒

081_第七章_KeyedProcessFunction（一）_处理时间定时器

360

15分45秒

082_第七章_KeyedProcessFunction（二）_事件时间定时器

430

6分17秒

083_第七章_窗口处理函数

390

19分3秒

084_第七章_TopN（一）_使用ProcessAllWindowFunction

480

12分20秒

085_第七章_TopN（二）_使用KeyedProcessFunction（一）

370

14分43秒

086_第七章_TopN（三）_使用KeyedProcessFunction（二）

340

5分26秒

087_第八章_使用Filter实现分流

340

9分54秒

088_第八章_使用侧输出流实现分流

380

14分40秒

089_第八章_联合（Union）

380

10分27秒

090_第八章_连接（Connect）

380

19分41秒

091_第八章_实时对账（一）_基本框架

340

11分55秒

092_第八章_实时对账（二）_具体实现

370

5分40秒

093_第八章_广播连接流

350

15分56秒

094_第八章_窗口联结

380

17分12秒

095_第八章_间隔联结

370

9分6秒

096_第八章_窗口同组联结

310

7分34秒

097_第九章_状态的概念

400

5分51秒

098_第九章_状态的管理

420

9分37秒

099_第九章_状态的分类

360

100

8分40秒

100_第九章_Keyed State概念和特点

340

101

13分19秒

101_第九章_KeyedState类型（一）_值状态

390

102

11分20秒

102_第九章_KeyedState类型（二）_列表状态和映射状态

430

103

13分2秒

103_第九章_KeyedState类型（三）_归约状态和聚合状态

270

104

19分46秒

104_第九章_KeyedState应用（一）_值状态

330

105

12分49秒

105_第九章_KeyedState应用（二）_列表状态

340

106

16分33秒

106_第九章_KeyedState应用（三）_映射状态

330

107

16分47秒

107_第九章_KeyedState应用（四）_聚合状态

320

108

10分10秒

108_第九章_状态生存时间（TTL）

320

109

11分10秒

109_第九章_算子状态的概念和类型

370

110

20分40秒

110_第九章_算子状态应用实例

350

111

8分36秒

111_第九章_广播状态的概念和用法

420

112

23分24秒

112_第九章_广播状态应用实例

410

113

3分54秒

113_第九章_状态持久化（一）_检查点

400

114

12分31秒

114_第九章_状态持久化（二）_状态后端

310

115

16分7秒

115_第十章_检查点的保存

390

116

6分20秒

116_第十章_从检查点恢复状态

340

117

8分34秒

117_第十章_检查点分界线

360

118

16分48秒

118_第十章_检查点算法

360

119

15分5秒

119_第十章_检查点的配置

350

120

10分49秒

120_第十章_保存点

410

121

10分2秒

121_第十章_状态一致性

310

122

11分30秒

122_第十章_端到端状态一致性（一）

360

123

15分17秒

123_第十章_端到端状态一致性（二）

440

124

14分12秒

124_第十章_Flink和Kafka连接的精确一次

390

125

13分22秒

125_第十一章_Table API和SQL整体介绍

360

126

18分16秒

126_第十一章_快速上手

320

127

8分55秒

127_第十一章_整体程序架构

400

128

10分18秒

128_第十一章_表环境

340

129

12分41秒

129_第十一章_创建表

410

130

12分17秒

130_第十一章_表的查询

380

131

6分58秒

131_第十一章_输出表

390

132

13分20秒

132_第十一章_表转换成流

400

133

7分56秒

133_第十一章_流转换成表

340

134

9分10秒

134_第十一章_支持的数据类型

330

135

11分1秒

135_第十一章_动态表和持续查询

390

136

17分1秒

136_第十一章_持续查询的过程

420

137

12分45秒

137_第十一章_动态表编码为流

380

138

19分23秒

138_第十一章_时间属性（一）_在DDL中定义

450

139

10分22秒

139_第十一章_时间属性（二）_流转换为表时定义

430

140

3分30秒

140_第十一章_时间属性（三）_处理时间的定义

370

141

14分43秒

141_第十一章_窗口

320

142

8分14秒

142_第十一章_分组聚合

410

143

14分17秒

143_第十一章_窗口聚合

360

144

16分10秒

144_第十一章_开窗（Over）聚合

310

145

21分27秒

145_第十一章_普通TopN

410

146

11分57秒

146_第十一章_窗口TopN

450

147

7分51秒

147_第十一章_常规Join

330

148

7分46秒

148_第十一章_间隔Join

410

149

14分50秒

149_第十一章_系统函数

350

150

8分1秒

150_第十一章_UDF（一）_整体介绍

340

151

8分19秒

151_第十一章_UDF（二）_标量函数

400

152

17分54秒

152_第十一章_UDF（三）_表函数

440

153

20分45秒

153_第十一章_UDF（四）_聚合函数

340

154

5分32秒

154_第十一章_UDF（五）_表聚合函数（一）_整体介绍

430

155

18分6秒

155_第十一章_UDF（五）_表聚合函数（二）_代码实现

440

156

11分46秒

156_第十一章_UDF（五）_表聚合函数（三）_调用和测试

390

157

10分15秒

157_第十一章_SQL客户端

320

158

15分4秒

158_第十一章_连接到常见的外部系统

340

159

10分27秒

159_第十一章_连接到Hive

410

160

17分17秒

160_第十二章_CEP的基本概念和应用场景

380

161

13分52秒

161_第十二章_快速上手（一）_程序架构和定义模式

390

162

10分55秒

162_第十二章_快速上手（二）_检测处理和测试

400

163

7分11秒

163_第十二章_个体模式（一）_整体介绍

420

164

10分39秒

164_第十二章_个体模式（二）_量词(1)

440

165

10分39秒

164_第十二章_个体模式（二）_量词

360

166

11分10秒

165_第十二章_个体模式（三）_条件

320

167

11分21秒

166_第十二章_组合模式

430

168

4分32秒

167_第十二章_模式组

350

169

9分0秒

168_第十二章_匹配后跳过策略

370

170

13分49秒

169_第十二章_处理匹配事件

480

171

9分36秒

170_第十二章_处理超时事件（一）_基本流程

410

172

19分7秒

171_第十二章_处理超时事件（二）_应用实例

320

173

7分0秒

172_第十二章_处理迟到数据

370

174

8分11秒

173_第十二章_状态机实现（一）_基本原理

400

175

13分45秒

174_第十二章_状态机实现（二）_代码实现

480

176

10分9秒

175_课程总结

350

122_第十章_端到端状态一致性（一）

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐