文章/答案/技术大牛

发布

首页视频115_第九章_状态编程（五）_状态持久化（二）_状态后端

115_第九章_状态编程（五）_状态持久化（二）_状态后端

2022-12-022022-12-02 16:02:17播放42

点赞0 收藏 0

2.尚硅谷大数据学科--核心框架/尚硅谷大数据技术之2022版Flink1.13（Java版）/视频/115_第九章_状态编程（五）_状态持久化（二）_状态后端 .mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:01
了解了检查点，接下来我们再来介绍另外一个flink状态管理机制当中的非常重要的概念，那就是，也就是状态后端。其实对于检查点来说，我们都知道了，他就是。当前flink应用程序里所有状态的一个快照，一个持久化的保存，那本身这些状态它应该是放在哪里的呢？对于一个flink程序而言，所有的算子任务都应该分布式的执行在slot上，而slot是存在于task manager上。呃，本来是task manager上资源的一个划分，划分出了不同的slot。所以本身所有的状态，它应该都是task manager内存里边的一部分。那所以接下来如果说我们要去做快照的话，肯定就会涉及到task manager相关的一些操作。
01:03
而另外呢，我们当前是一个分布式的系统，所有的任务都是并行处理的。那么这就涉及到了所有的task manager，不同的slot，那在这个过程当中，我怎么样能控制他们在同一个时间点去做一个状态的快照持久化的保存呢？这当然就又涉及到了统一的协调和管理。那由谁来管理？自然就是job manager，所以检查点的保存是离不开job manager和task manager他们之间的协调工作的。当然了，这里边既然是涉及到了向外部的持久化入，那就还应该有外部系统的一个协调工作。在。进行检查点保存的时候。首先，那是需要由job manager向所有的task manager发出触发的命令，也就是说，现在我要开始制作检查点了，所有的task manager接收到当前命令的时候，就把当前正在进行的任务。
02:13
所有的状态做一个快照保存。那这个快照保存保存完成之后，当然我们知道本身是在内存里边的一个Java对象，那接下来呢，当然是要做一个做一个序列化，然后把它写入到远程的持久化存储的介质里面去。我们知道一般是。分布式的文件系统，当然如果说我们想把它写到一些特定的数据库也是可以的，那完成之后怎么样才能叫做当前的检查点全部保存成功了呢？并不是说某一个task manager它的状态保存完毕就算成功了。我们当前是一个分布式的系统，如果要能从故障当中恢复出来的话，很显然必须所有的task manager都完成自己当前所有状态的保存。
03:03
所以最终的要求当前检查点真正保存完毕的标志，它是所有task manager都向job manager报告，确认当前检查点完成，这个时候job manager来发发出消息说当前检查点真正的完成。所以我们发现这个过程是分布式进行的。整个这个过程当中，其实是需要很多组件做一系列的协调和控制管理啊，所以整个整个系统来看的话，我们其实最好是有一个专职人员来做这样的一套事情啊，那这个所谓的专职人员就是我们所说的。状态后端。我们这里给出状态后端的具体的定义，那就是在flink当中状态的存储、访问和维护。这就包括了我们本身状态的序列化，序列化持久化保存，发生故障之后的恢复，以及呃，我们说这个病情发生调整之后状态的。
04:11
重组分配，所有的这些都是由一个可插拔的组件决定的，这个组件就叫做state状态后。从定义我们可以看得出来，状态后端其实主要是要负责两方面的事情的，一件事情是本地的状态管理。前面我们说到的。我们直直接从运行上下文里面把它获取出来，定义出来。获取到它的控制句柄，然后直接调用API使用就可以了，底层的那些操作机制我们根本都不需要考考虑，那到底是谁来负责的呢？啊，我们说是flink的底层，Flink底层具体是谁？其实就是状态后端来做这些操作啊，所以它其实是涉及到了我们当前状态，本地状态的一些管理操作的。
05:02
另外一个呢，当然就是需要在进行检查点保存的时候，把本地的状态写入到检查点中，然后存放到远程的持久化存储介质中。这就是状态后端它的功能和用途。那接下来我们再来了解一下状态后端有哪些类型，我们发现了状态后端它是一个可插拔的组件，所以它其实是开箱即用的，一般情况下我们可以进行独立配置，跟业务逻辑是完全没有关系的。Flink里边呢，给我们现在提供的是两类，主要是两类不同的状态后端，一类叫做哈希表状态后端啊，我们发现这其实在源码里边是一个现成的类，叫做。另外一类呢，是内嵌rocks DB状态后端，或者叫嵌入式rocks DB状态后端embedded rocks DB啊，那如果没有特别配置的话，系统里边默认的状态后端是第一种哈希表状态后。
06:15
那这两种状态后端又有哪些特点，他们有哪些区别呢？接下来我们分别做一个介绍，首先看默认的哈希表状态后端，那这种状态后端其实就是我们之前认为的弗对于状态的那种处理方式，就是所有的状态是放在帕manager的内存里面啊，它具体来看的话，那就是说所有的状态就是一个Java对象，一个object。然后所有既然它是抓对象啊，那就是保存在了task manager的GM堆内存上，那所有普通的状态，还有窗口当中收集到的数据，还有触发器trigger啊，所有的这些东西都是状态，他们的存放方式是以键值对的方式形式进行存储，所以我们发现既然是舰职队，那它本质上可以认为就是一个哈希表啊。
07:10
啊，所以它的底层存储结构就是一个哈希表，这也就是为什么这种状态后端叫做哈希表状态后端，它是用这种数据结构进行内部状态的管理和存储的。而对于检查点呢，啊，检查点的话，一般就是我们既然已经当前的这个状态，都是要满足flink里边能够识别，能够管理的那些。类数据类型啊，那这样的话我们就可以做序列化，序列化之后就可以进行持久化的存放了。对于哈希表状态后端，它的检查点一般都是存放在持久化的分布式文件系统上，那最常见的当然就是HDS了。另外也可以通过配置一个叫做checkpoint storage，就是所谓的检查点这样一个选项来单独的进行指定，这些都是可以去做的。
08:09
对于哈希表状态后端来讲，它是把本地状态全部放到内存里面，所以我们就发现了它的优势就在于可以获得最快的读写速度。内存计算就是快嘛啊，所以它的性能是最佳的，那代价呢，当然就是比较耗内存了，当我们当前的状态越来越多，或者说数据量越来越大，窗口数据量非常大的时候，那有可能就会造成我们当前的内存不够用啊。那在。出现这种情况的时候，那得怎么办呢？那就要考虑用其他的状态后端来进行替代了。这就是我们所说的第二种状态，后盾。Embedded DB，一般情况就是把它叫做rock DB状态后啊，那DB其实我们知道它是由Facebook开发出来的，呃，一个开源的，基于k value这样的一个。
09:06
嵌入式的数据库，或者说是存储介质，它是基于Google开发的那个DB的原理其实差不多，那它的特点呢，其实就是可以把当前的数据持久化到本地硬盘里面啊，那当然它也是通过这个k value这种结构进行组织存储的。那如果我们配置了DB状态后端的话，那么所有的状态数据就都会放到DB数据库里。我们可以认为。一个嵌入式的数据库。所以。接下来我们当前所有的状态就变成都放到DB数据库，或者说直接放到本地硬盘里了啊，那默认的话是在task manager的一个本地数据目录里面。我们可以在这个文件本地文件系统里边找到对应的目录，对应的位置。
10:01
那跟前面讲到的哈希表状态后端。所不同的一点，那就是当前的状态。根本就不是Java对内存里，JM对内存里边的一个对象了，现在的话就相当于全放在rocks DB里面了，当然了，Rox DB会有一部分放在内存里进行做缓存的部分啊，但是呢，更大量的数据就会放到本地硬盘当中进行持久化保存。所以这样它的一个特点就是说，我们的读写性能就会差一点，因为你要访问硬盘嘛，既然要访问硬盘，那读写的时候就会涉及到序列化反序列化的过程啊。那呃，如果说我们还要做这个K的比较的话，那它需要按照字节去进行比较，而不是直接调用这个哈，Code或者是ES这样的方法，所以它也会比较慢一点，性能会比较差，那它的好处是什么呢？好处当然非常明显，那就是能够存放的状态更多了，既然它是放到硬盘，自然存放的状态可以更大。
11:06
那对于检查点来讲呢，同样我们也是可以单独配置的，一般情况同样也是写入到远程的持久化文件系统当中，因因为这个的话，我们就不存在性能上的要求嘛，只要能够大量的存放就可以了。另外需要注意的是，Rock DC它执行的是异步快照，也就是说如果说我们配置了DB状态后端的话，我们自然会想到如果说我们是要等到当前的状态。每一个任务啊，如果接收到照manager那边发来的指令，要保存当前状态，做持久化保存了，做快照了，如果说这个时候我就一直等着，等到当前快照做完之后再去处理接下来的数据的话。那很明显，现在因为我要访问稳定硬盘嘛，访问DB这个代价比较大，诶那显然就会造成我们的实时性的降低，延迟就会增加，所以rocks DB它其实是异步执行的，也就是说我们这里边做快照，诶那是那是一个单独的事情。
12:15
想做什么发生这个快照指收到接收到快照指令的时候，我现在就直接开始做当前的。状态的保存，而接下来的数据呢，继续处理，直接读到当前任务里边来同时处理，所以它俩是并行的，这样的话就不会因为我们保存到本地硬盘做快照的这个过程。阻止了数据的处理，不会造成更大的延迟啊，那另外呢，DB还提供了一个，因为我们要保存的。数据量可能比较大，状态比较多，所以D提供了一个增量式的。保存检查点的机制。所谓的增量式，那就是我可以之前先保存一份状态。
13:04
然后我们隔一段时间保存，再保存一个快照，那下一个快照呢，很可能大部分数据跟上一个快照是类似的，所以我不需要保存全量数据，只把它们之间变化的那一部分，相当于是。那个德尔塔保存下来就可以了啊，那这样的话，每一份快照要保存的数据就会更少，所以在很多情况下，这样我们可以大大的提升保存效率。当然了，这样的话，如果我们想要恢复，那就应该要把之前所有的这些快照都要拿过来，然后才能恢复出我们最后的状态。啊，那所以这个过程当中我们就会发现啊，状态后端有两种基本的选择，我们在实际应用当中，到底在什么场景下选择什么样的状态后端呢。通过前面的介绍，他们的对比已经非常的明显了，他们之间最大的区别其实就是在于本地状态放在哪里，一个是放在内存，另外一个是放在D啊，那所以放在内存里面的话，当然就是非常啊，但是它的大小受到内存的限制，如果说我们当前的这个应用是。
14:19
状态不停的增长的话，那么最后内存就会被耗尽，我们就只好停下当前应用，然后再去扩展集群资源了啊。那当然了，就是即使我们能够不停的动态扩展集群资源，它也会带来一个代价，就是我们的成本比较高，因为这个机器内存的这种扩展显然是要耗费大量。大量成本的，所以另外一个选择，那就是rocks DB rocks DB的话，它是硬盘存储，所以它的扩展的代价也很低，所以非常适用于超级海量状态的存储。不过它带来的缺陷就在于当前的读写速度状态的读写速度变慢了，因为每一次访问硬盘要去进行序列化和反序列化啊，那所以整体来讲的话，DB状态后端要比哈希表状态后端慢一个数量级。
15:14
所以在实际应用当中，其实就是一个权衡取舍的过程，我我们就是要看到底是要快还是要要存储，用更低的成本存储更大量更海量的状态呢？啊在实际应用的当中，一般推荐的就是如果状态比较小，而且状态比较稳定，不会随着时间不停的增长，而且我们对于性能要求比较高的时候，那当然是用哈希表状态后端比较合适，而如果说我们的状态比较大，超级海量，或者说是随着时间的推移会不停的增长，增长到海量。或者说是我们对于成本非常的敏感，而对于运行的速度不那么的强调，那这个时候就用DB状态后会比较合适。
16:04
了解了状态后端的不同类型，那接下来我们再来说一下状态后端的配置啊，在状态后端我们知道默认情况下啊，其实就都已经使用的是哈希表状态后端了，在我们不做任何配置的时候，应用程序使用的默认状态后端那是由集群的配置文件flink-com.ya这个文件配置的，那配置的键的名称K名称就是state.back end。啊，那我们知道这一个配置默认配置项啊，是对集群上运行的所有作业，所有应用都是有效的，那我们可以通过更改这一个配置项来去更改默认的状态后端啊，那另外还有一种方法是可以在代码里边去单独设置代码里边设置好的那个状态后端，那就是只针对当前应用有效了，它会覆盖掉默认集群里边的那个配置配配置的默认值。
17:02
啊，那首先我们看一下在集群的配置文件里边怎么样去配置状态后端啊，其实非常简单，就是的这个字段，然后冒号后边跟着的就是指默认情况下呢，就是哈希map，我们可以这样去指定，也可以不指定，那如果说我们想要去配置一个embeded rocks DB state又该怎么配呢？啊，那就把这个直接改成rocks DB就可以了啊，就是小写的rocks DB。这就是非常简单的一个配置的过程，那另外我们说还可以配置当前存放检查点的。路径啊，那这个路径的话就叫做state checkpoint Di啊，那后边的话，一般情况我们用的是一个分布式文件系统的路径，最常见的当然就是HDFS了，一般情况就是这样去做一个配置就可以了。那另外呢，对于这个默认的状态后端来说，我们除了哈希map和rock db2个选项之外，我们发现在这个源码里边。
18:08
这两种不同的状态后端其实就是两个不同的类嘛，所以我们其实它本身是可可插拔的一个组件，我们也可以自定义，那如果要自定义的话，那就必须是实现了状态后端工厂类的一个完全的类的类名，限定的类名就是state back factory，实现了这个接口的类，我们就可以放在这里作为状态后端配置。那除了集群默认的配置文件里面的定义之外，我们还可以为每一个作业或者说每一个应用单独去配置一下当前的状态后端，那这个就需要在代码里边去做配置了，那代码里边怎么配呢？同样也是env在环境里边去做一个简单的配置啊，我们可以在代码里边同样来看一下。代码里面如果要是。
19:01
默认情况下当然也是是哈希表的状态后端了啊，如果我们想单独做配置的话，那就是set state back，这里边我们可以去你一个哈希表，哈希map，这个是完全没有问题的，当然了，这个本身没有必要。另外，我们也可以直接创建一个rocks DB的。Inbed。Rocks DB。State back end。其实我们已经发现了，在这个敲的过程当中，会发现并没有对应的类能够让我们直接使用啊，这要说明的一点是，在idea里边，在我们这个集成开发环境里边，是本身引入的flink相关的包，是不包含rock DB后端的支的，所以我们还需要引入相关的，这个的话其实也是官方给我们提供的，直接就叫做flink rock DB啊，后面这个是的版本，然后下边对应的版本是当前flink的版本，我们可以直接把它copy过来。
20:13
直接放到home键下面。我们把它引入之后。接下来。就有了对应的这个。我们也可以点进去看到它确实是实现了。一个这样一个象类，然后一步的话，我们会看到它本身是实现了这样一个。我们如果是在idea里边进行开发的话，那是必须要引入相关的依赖，而事实上呢，在flink的发行版里边本身是包含了D这样一个依赖的，所以如果说我们直接把当前的代码打包提交到集群环境里边去运行的话，那是没有必要把我们刚刚引入的这个依赖打包进去的啊。
21:07
它是直接可以正常运行的，这就是关于状态后端在代码里边的配置。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之2022版Flink1.13（Java版）

（115/171）

6分39秒

001_Flink课程简介

510

12分54秒

002_第一章_Flink简介（一）_Flink起源和设计理念

350

12分25秒

003_第一章_Flink简介（二）_Flink在企业的应用

400

8分41秒

004_第一章_Flink简介（三）_Flink的优势

440

18分2秒

005_第一章_Flink简介（四）_数据处理框架的演变

460

4分55秒

006_第一章_Flink简介（五）_流处理的应用场景

290

6分57秒

007_第一章_Flink简介（六）_Flink的分层API

350

10分5秒

008_第一章_Flink简介（七）_Flink和Spark的区别

350

11分58秒

009_第二章_Flink快速上手（一）_环境准备和创建项目

410

15分19秒

010_第二章_Flink快速上手（二）_批处理_Word Count（一）

420

8分31秒

011_第二章_Flink快速上手（二）_批处理_Word Count（二）

430

13分47秒

012_第二章_Flink快速上手（三）_流处理（一）_有界流处理Word Count（一）

400

6分42秒

013_第二章_Flink快速上手（三）_流处理（一）_有界流处理Word Count（二）

360

11分47秒

014_第二章_Flink快速上手（三）_流处理（二）无界流处理Word Count

410

18分16秒

015_第三章_Flink部署（一）_快速启动一个集群（一）_环境配置和基本介绍

360

8分41秒

016_第三章_Flink部署（一）_快速启动一个集群（二）_集群启动

440

12分31秒

017_第三章_Flink部署（一）_快速启动一个集群（三）_提交作业（一）_Web UI提交

360

11分3秒

018_第三章_Flink部署（一）_快速启动一个集群（三）_提交作业（二）_命令行提交

330

10分59秒

019_第三章_Flink部署（二）_部署模式

320

3分49秒

020_第三章_Flink部署（三）_独立模式的部署

380

18分50秒

021_第三章_Flink部署（四）_Yarn模式的部署

400

13分39秒

022_第四章_Flink运行时架构（一）_Flink系统架构

390

12分12秒

023_第四章_Flink运行时架构（二）_作业提交流程

370

10分46秒

024_第四章_Flink运行时架构（三）_一些重要概念（一）_数据流图

450

12分15秒

025_第四章_Flink运行时架构（三）_一些重要概念（二）_并行度

400

14分53秒

026_第四章_Flink运行时架构（三）_一些重要概念（三）_算子链

390

6分13秒

027_第四章_Flink运行时架构（三）_一些重要概念（四）_执行图

390

17分36秒

028_第四章_Flink运行时架构（三）_一些重要概念（五）_Task Slots

450

6分23秒

029_第四章_Flink运行时架构（四）_Flink的任务调度

380

5分40秒

030_第五章_DataStream API（基础篇）（一）_整体介绍

370

16分12秒

031_第五章_DataStream API（基础篇）（二）_执行环境

400

5分18秒

032_第五章_DataStream API（基础篇）（三）_源算子（一）_整体介绍

400

5分17秒

033_第五章_DataStream API（基础篇）（三）_源算子（二）_准备工作

460

17分14秒

034_第五章_DataStream API（基础篇）（三）_源算子（三）_读取有界流

370

4分4秒

035_第五章_DataStream API（基础篇）（三）_源算子（四）_读取Socket文本流

350

11分50秒

036_第五章_DataStream API（基础篇）（三）_源算子（五）_读取Kafka

400

14分50秒

037_第五章_DataStream API（基础篇）（三）_源算子（六）_自定义Source

470

6分32秒

038_第五章_DataStream API（基础篇）（三）_源算子（七）_自定义并行Source

380

10分21秒

039_第五章_DataStream API（基础篇）（三）_源算子（八）_Flink支持的数据类型（一）

400

12分59秒

040_第五章_DataStream API（基础篇）（三）_源算子（八）_Flink支持的数据类型（二）

360

13分14秒

041_第五章_DataStream API（基础篇）（四）_Transform（一）_Map

460

10分46秒

042_第五章_DataStream API（基础篇）（四）_Transform（二）_Filter

410

13分37秒

043_第五章_DataStream API（基础篇）（四）_Transform（三）_FlatMap

350

12分14秒

044_第五章_DataStream API（基础篇）（四）_Transform（五）_KeyBy

430

13分17秒

045_第五章_DataStream API（基础篇）（四）_Transform（六）_简单聚合

390

20分24秒

046_第五章_DataStream API（基础篇）（四）_Transform（七）_归约聚合

370

9分24秒

047_第五章_DataStream API（基础篇）（四）_Transform（八）_UDF（一）_函数类和匿名函数

420

14分40秒

048_第五章_DataStream API（基础篇）（四）_Transform（八）_UDF（二）_富函数类

470

18分2秒

049_第五章_DataStream API（基础篇）（四）_Transform（九）_物理分区（一）_随机和轮询分区

400

14分19秒

050_第五章_DataStream API（基础篇）（四）_Transform（十）_物理分区（二）_Rescale

320

8分37秒

051_第五章_DataStream API（基础篇）（四）_Transform（十）_物理分区（三）_广播、全局及自定义分区

350

11分48秒

052_第五章_DataStream API（基础篇）（五）_Sink（一）_连接到外部系统

430

15分23秒

053_第五章_DataStream API（基础篇）（五）_Sink（二）_输出到文件

320

13分0秒

054_第五章_DataStream API（基础篇）（五）_Sink（三）_输出到Kafka

440

13分56秒

055_第五章_DataStream API（基础篇）（五）_Sink（四）_输出到Redis

240

13分13秒

056_第五章_DataStream API（基础篇）（五）_Sink（五）_输出到Elasticsearch

390

14分28秒

057_第五章_DataStream API（基础篇）（五）_Sink（六）_输出到MySQL

400

5分4秒

058_第五章_DataStream API（基础篇）（五）_Sink（七）_自定义Sink输出

350

13分30秒

059_第六章_Flink中的时间和窗口（一）_时间语义

410

10分20秒

060_第六章_Flink中的时间和窗口（二）_水位线（一）_水位线的概念

410

17分17秒

061_第六章_Flink中的时间和窗口（二）_水位线（二）_水位线的原理和特性

370

14分25秒

062_第六章_Flink中的时间和窗口（二）_水位线（三）_水位线在代码中的生成（一）

370

8分48秒

063_第六章_Flink中的时间和窗口（二）_水位线（三）_水位线在代码中的生成（二）

390

11分3秒

064_第六章_Flink中的时间和窗口（二）_水位线（四）_自定义水位线的生成

470

6分58秒

065_第六章_Flink中的时间和窗口（二）_水位线（五）_水位线的传递

440

9分52秒

066_第六章_Flink中的时间和窗口（三）_窗口（一）_窗口的基本概念

350

20分50秒

067_第六章_Flink中的时间和窗口（三）_窗口（二）_窗口的分类

370

4分10秒

068_第六章_Flink中的时间和窗口（三）_窗口（三）_窗口API概览

340

12分27秒

069_第六章_Flink中的时间和窗口（三）_窗口（四）_窗口分配器

370

5分30秒

070_第六章_Flink中的时间和窗口（三）_窗口（五）_窗口函数整体介绍

440

5分33秒

071_第六章_Flink中的时间和窗口（三）_窗口（六）_窗口函数分类

430

9分7秒

072_第六章_Flink中的时间和窗口（三）_窗口（七）_增量聚合函数（一）_ReduceFunction

420

13分20秒

073_第六章_Flink中的时间和窗口（三）_窗口（七）_增量聚合函数（二）_AggregateFunction

420

19分42秒

074_第六章_Flink中的时间和窗口（三）_窗口（七）_增量聚合函数（三）_应用实例

410

18分31秒

075_第六章_Flink中的时间和窗口（三）_窗口（八）_全窗口函数

450

10分55秒

076_第六章_Flink中的时间和窗口（三）_窗口（九）_两种窗口函数结合

410

11分43秒

077_第六章_Flink中的时间和窗口（三）_窗口（十）_窗口函数综合应用实例

400

19分44秒

078_第六章_Flink中的时间和窗口（三）_窗口（十一）_窗口其它API

380

11分32秒

079_第六章_Flink中的时间和窗口（四）_处理迟到数据（一）_代码实现

430

12分42秒

080_第六章_Flink中的时间和窗口（四）_处理迟到数据（二）_测试

370

17分1秒

081_第七章_处理函数（一）_处理函数的概念和分类

460

14分16秒

082_第七章_处理函数（二）_ProcessFunction

420

12分2秒

083_第七章_处理函数（三）_KeyedProcessFunction（一）_处理时间定时器

460

11分32秒

084_第七章_处理函数（三）_KeyedProcessFunction（二）_事件时间定时器

340

5分23秒

085_第七章_处理函数（四）_ProcessWindowFunction

330

15分49秒

086_第七章_处理函数（五）_Top N（一）_使用ProcessAllWindowFunction（一）_基本思路

350

14分44秒

087_第七章_处理函数（五）_Top N（一）_使用ProcessAllWindowFunction（二）_代码实现和测试

370

22分11秒

088_第七章_处理函数（五）_Top N（二）_使用KeyedProcessFunction

290

16分2秒

089_第八章_多流转换（一）_分流

450

13分50秒

090_第八章_多流转换（二）_合流（一）_ 联合（Union）

380

12分56秒

091_第八章_多流转换（二）_合流（二）_ 连接（Connect）

330

23分18秒

092_第八章_多流转换（二）_合流（三）_ 应用实例（一）_程序架构和实现思路

380

15分1秒

093_第八章_多流转换（二）_合流（三）_ 应用实例（二）_具体代码实现

320

6分14秒

094_第八章_多流转换（二）_合流（四）_ 广播连接流

440

21分14秒

095_第八章_多流转换（三）_双流Join（一）_ 窗口联结

380

20分8秒

096_第八章_多流转换（三）_双流Join（二）_ 间隔联结

470

15分17秒

097_第八章_多流转换（三）_双流Join（三）_ 窗口同组联结

400

13分50秒

098_第九章_状态编程（一）_Flink中的状态（一）_ 状态的定义

420

12分59秒

099_第九章_状态编程（一）_Flink中的状态（二）_ 状态的管理

430

100

16分6秒

100_第九章_状态编程（一）_Flink中的状态（三）_ 状态的分类

410

101

19分38秒

101_第九章_状态编程（二）_按键分区状态（一）_ 基本概念和类型

410

102

13分56秒

102_第九章_状态编程（二）_按键分区状态（二）_ 代码中的使用（一）_基本方式和值状态

280

103

17分16秒

103_第九章_状态编程（二）_按键分区状态（二）_ 代码中的使用（二）_其它状态

440

104

24分34秒

104_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（一）_值状态

390

105

19分29秒

105_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（二）_列表状态

370

106

22分14秒

106_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（三）_映射状态

420

107

20分8秒

107_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（四）_聚合状态

340

108

17分18秒

108_第九章_状态编程（二）_按键分区状态（四）_ 状态生存时间

340

109

14分27秒

109_第九章_状态编程（三）_算子状态（一）_ 基本概念和类型

400

110

12分5秒

110_第九章_状态编程（三）_算子状态（二）_应用实例（一）_基本思路和框架

370

111

16分31秒

111_第九章_状态编程（三）_算子状态（二）_应用实例（二）_具体实现和测试

340

112

8分54秒

112_第九章_状态编程（四）_广播状态（一）_基本概念和用法

410

113

22分48秒

113_第九章_状态编程（四）_广播状态（二）_应用实例

380

114

9分52秒

114_第九章_状态编程（五）_状态持久化（一）_检查点

450

115

21分15秒

115_第九章_状态编程（五）_状态持久化（二）_状态后端

420

116

11分54秒

116_第十章_容错机制（一）_检查点（一）_检查点的保存原理（一）_周期性的保存

340

117

15分2秒

117_第十章_容错机制（一）_检查点（一）_检查点的保存原理（二）_保存的时间点

340

118

6分40秒

118_第十章_容错机制（一）_检查点（二）_从检查点恢复状态

320

119

15分0秒

119_第十章_容错机制（一）_检查点（三）_检查点算法（一）_分界线

390

120

22分22秒

120_第十章_容错机制（一）_检查点（三）_检查点算法（二）_分布式快照算法

360

121

19分19秒

121_第十章_容错机制（一）_检查点（四）_检查点配置

310

122

13分12秒

122_第十章_容错机制（一）_检查点（五）_保存点

300

123

10分50秒

123_第十章_容错机制（二）_状态一致性（一）_一致性的概念和级别

430

124

15分16秒

124_第十章_容错机制（二）_状态一致性（二）_端到端状态一致性（一）

290

125

15分54秒

125_第十章_容错机制（二）_状态一致性（二）_端到端状态一致性（二）

380

126

18分22秒

126_第十章_容错机制（二）_状态一致性（三）_端到端精确一次

310

127

13分26秒

127_第十一章_Table API和SQL（一）_整体介绍

350

128

19分18秒

128_第十一章_Table API和SQL（二）_快速上手

360

129

12分48秒

129_第十一章_Table API和SQL（三）_基本API（一）_程序架构

370

130

13分40秒

130_第十一章_Table API和SQL（三）_基本API（二）_表环境

410

131

16分31秒

131_第十一章_Table API和SQL（三）_基本API（三）_创建表

340

132

20分33秒

132_第十一章_Table API和SQL（三）_基本API（四）_表的查询和输出（一）

410

133

15分0秒

133_第十一章_Table API和SQL（三）_基本API（四）_表的查询和输出（二）

400

134

12分24秒

134_第十一章_Table API和SQL（三）_基本API（五）_表和流的转换（一）_表转换成流

350

135

13分25秒

135_第十一章_Table API和SQL（三）_基本API（五）_表和流的转换（二）_流转换成表

390

136

16分21秒

136_第十一章_Table API和SQL（四）_流处理中的表（一）_动态表和持续查询

440

137

25分10秒

137_第十一章_Table API和SQL（四）_流处理中的表（二）_流转换成动态表做动态查询

420

138

15分2秒

138_第十一章_Table API和SQL（四）_流处理中的表（三）_动态表编码成数据流

380

139

16分23秒

139_第十一章_Table API和SQL（五）_时间属性和窗口（一）_时间属性（一）_在DDL中定义

390

140

11分55秒

140_第十一章_Table API和SQL（五）_时间属性和窗口（一）_时间属性（二）_流转换成表时定义

360

141

22分46秒

141_第十一章_Table API和SQL（五）_时间属性和窗口（二）_窗口

320

142

21分5秒

142_第十一章_Table API和SQL（六）_聚合查询（一）_分组聚合

420

143

16分1秒

143_第十一章_Table API和SQL（六）_聚合查询（二）_窗口聚合

400

144

15分22秒

144_第十一章_Table API和SQL（六）_聚合查询（三）_开窗聚合

410

145

28分4秒

145_第十一章_Table API和SQL（六）_聚合查询（四）_TopN（一）_普通TopN

370

146

15分27秒

146_第十一章_Table API和SQL（六）_聚合查询（四）_TopN（二）_窗口TopN

450

147

14分58秒

147_第十一章_Table API和SQL（七）_联结查询

420

148

22分9秒

148_第十一章_Table API和SQL（八）_函数（一）_系统函数

390

149

9分46秒

149_第十一章_Table API和SQL（八）_函数（二）_UDF（一）_整体介绍和分类

410

150

9分6秒

150_第十一章_Table API和SQL（八）_函数（二）_UDF（二）_标量函数

410

151

16分40秒

151_第十一章_Table API和SQL（八）_函数（二）_UDF（三）_表函数

370

152

18分24秒

152_第十一章_Table API和SQL（八）_函数（二）_UDF（四）_聚合函数

350

153

25分19秒

153_第十一章_Table API和SQL（八）_函数（二）_UDF（五）_表聚合函数

300

154

9分2秒

154_第十一章_Table API和SQL（九）_SQL客户端

360

155

14分49秒

155_第十一章_Table API和SQL（十）_连接到外部系统（一）_常见的外部存储

370

156

14分11秒

156_第十一章_Table API和SQL（十）_连接到外部系统（二）_Hive

380

157

17分24秒

157_第十二章_Flink CEP（一）_基本概念和应用

380

158

17分40秒

158_第十二章_Flink CEP（二）_快速上手（一）_需求分析和定义模式

350

159

14分1秒

159_第十二章_Flink CEP（二）_快速上手（二）_检测处理代码实现和测试

370

160

13分58秒

160_第十二章_Flink CEP（三）_模式API（一）_个体模式（一）_量词

380

161

15分45秒

161_第十二章_Flink CEP（三）_模式API（一）_个体模式（二）_条件

420

162

16分31秒

162_第十二章_Flink CEP（三）_模式API（二）_组合模式

300

163

5分31秒

163_第十二章_Flink CEP（三）_模式API（三）_模式组

400

164

12分38秒

164_第十二章_Flink CEP（三）_模式API（四）_匹配后跳过策略

390

165

14分14秒

165_第十二章_Flink CEP（四）_模式的检测处理（一）_处理匹配事件

350

166

18分42秒

166_第十二章_Flink CEP（四）_模式的检测处理（二）_处理超时事件（一）_需求分析和准备工作

370

167

16分39秒

167_第十二章_Flink CEP（四）_模式的检测处理（二）_处理超时事件（二）_代码实现和测试

350

168

7分26秒

168_第十二章_Flink CEP（四）_模式的检测处理（三）_处理迟到数据

440

169

9分20秒

169_第十二章_Flink CEP（五）_CEP状态机实现（一）_思路分析和程序框架

390

170

16分32秒

170_第十二章_Flink CEP（五）_CEP状态机实现（二）_定义状态机

330

171

7分53秒

171_第十二章_Flink CEP（五）_CEP状态机实现（三）_实现处理逻辑及测试

380

115_第九章_状态编程（五）_状态持久化（二）_状态后端

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐