文章/答案/技术大牛

发布

首页视频120_第十章_容错机制（一）_检查点（三）_检查点算法（二）_分布式快照算法

120_第十章_容错机制（一）_检查点（三）_检查点算法（二）_分布式快照算法

2022-12-022022-12-02 16:02:17播放36

点赞0 收藏 0

2.尚硅谷大数据学科--核心框架/尚硅谷大数据技术之2022版Flink1.13（Java版）/视频/120_第十章_容错机制（一）_检查点（三）_检查点算法（二）_分布式快照算法 .mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:01
有了分界线barrier，那接下来我们就知道每一个任务都是在接收到barrier的时候去保存自己的状态，我们就可以明确的知道检查点到底什么时候去保存啊，那在同一条流里边，我们知道这个bar瑞尔和数据的相对位置它是固定的，那在他之前所有的数据都应该要先处理，因为我们是流处理，来一个处理一个嘛，之前所有的数据都应该先处理完，然后才能轮到barrier，那这样的话，之前所有数据的。对应的状态改变就会保存在里边了啊，这也是我们说它可以按照barrier，按照检查点把前后两部分的数据分隔开，我们把它叫做检查点的分界线。但是我们知道在flink里边本身它是一个。分布式的流处理框架，那所有的任务都应该是并行的。
01:03
如果是并行的话，那我们就会发现这个流的结构就不会是那么的简单了，不会是按照顺序依次执行依次去处理了，有可能会出现乱序，这就跟我们之前讲到的水位线ma是一样的。那假如说这个时候考虑到分布式执行的时候，又得考虑哪些要点呢？Barrier的处理又有哪些细节需要去考虑呢？这就是我们接下来要去讲的。分布式快照算法。呃，可以首先回忆一下水位线的处理，因为我们在前面的了解过程当中都已经发现了，Barrier和walmark其实是有很多共通之处的，他们都是插入到当前数据里边的一个特殊的数据结构。那bar瑞尔在进行并行任务之间，上下游之间传递的时候，它的规则是什么呢？诶，那就是上游的任务向多个并行下游子任务传递water rockck的时候，那是直接广播出去的。
02:12
而如果有多个上游任务向同一个下游任务去传递watermark的时候，那又应该怎么样呢？诶，那我们说当时walmark的意义，它的含义主要是要表示当前的事件时间啊，那如果说我们能够正确处理乱序数据的话，那当前的事件时间，事件时如果进展到了某一个时刻，那就应该表示在这之前所有的数据都已经齐了，哎，那所以这个W呢，那是应该取一个。每一，每一个分区，Water mark，最小的那个。我们设置不同的分区，Water mark最小的那个作为当前任务的事件。所以我们就想到了在barrier的并行数据流里面，传输的时候是不是也应该有类似的规则设置呢？确实是这样。
03:07
对于barriry而而言，它指示的是之前的所有数据，它的状态改变应该要保存到当前检查点里，而那他不是说之前的所有数据都应该处理完了，都应该到齐吗？所以他们表示的含义都是一个截止时间。所以他们是非常类似。那具体实现上呢，其实flink的。检查点算法是昌迪兰伯特算法的一种变体啊，被叫做异步分界线快照算法，它的核心其实就是两个原则，一个就是上游任务向多个下游任务并行的子任务发送barrier的时候，那还是直接广播出去。那如果是多个上游并行的子任务向同一个下游任务传递barri的时候，那应该怎么办呢？
04:00
诶，之前我们是water mark里边是直接取最小，那现在没有小不小说了，现在的barrier它只就是一个标志，它表示当前要进行检查点的保存，哎，那我们的要求就是必须等到。不同分区的所有的标志，所有的barrier。都来了的时候，我才能保证所有分区之前的数据都已经处理完了啊，那这个时候我才去保存当前任务的状态，所以这个操作叫做分界线对齐。也就是说，等到所有上游的并行子分区barrier都不全部到齐，这个时候才开始保存。啊，那接下来我们还是针对之前的。这个应用事例来详细的解释一下检查点算法的原理啊，那为了更加的明确说明它分布式快照的这个算法，我们把它做一个扩展，那就是扩展成并行度为二的场景，那这个时候的话就不像之前我们只有一条牛的输入了，我们现在并行度为二，那应该有两个并行的SS任务同时在读取当前的数据。
05:16
那这里我们拥有了两条流啊，或者是我们认为这是从同一条流，或者说同一个数据源里边划分出来的不同分区，我们用并行的两个S任务去进行读取，那这里的数据呢，我们认为它都是一样的，跟之前的设定是一样的，都是一个hello，一个word，然后hello flink hello word hello flink，这样交错开。然后接下来我们看一看，后边也就同样有了两个并行的map任务，还有两个并行的丧任务，那我们接下来看一下现在的状态变成了什么样子呢？因为我们知道后边经过K败之后，那就有可能。第一个分区SS任务读进来的数据有可能会分到下边的这个分区来，而第二个分区读取进来的数据呢，也有可能K之后会分到上边的第一个分区来啊，我们现在的话就假如哈，这个K就分到了第一个分区，Word这个K分到了第二个分区，我们看一下现在的状态是什么样。
06:19
现在我们会看到，呃，我们就为了方便描述的话，就把这个叫SS1版，下面这个叫S2吧，我们会看到现在SS1。偏移量是三，S2偏移量是一，所以S1跟前面一样，已经读取了hello word hello3个数据。而S2呢，只读取了一个数据，就是一个哈。那我们知道本身flink里边的不同的任务，他们处理数据是有先后的，而且他们是并行执行的，互相之间各不干扰，所以S任务读取到了S1读取到了三，S2读取到了一，后边的数据呢，后边的任务呢，并不一定是处理完了这两个数据，所以我们看到map任务，哎，这个时候MAP1。
07:07
他其实是处理完了第一个哈和后边的word，第二个哈还没有处理，还正在处理中，而第二个map呢，Map这里是把。第二个SS2读进来的哈，已经处理完了。然后接下来看some some这里边上面的第一个分区K，哈哈，是只处理了一个，这是来自于上边第一个分区SS一传过来的浅色大楼。而第二个分区的深色的哈呢还在处理过程中。前面还有一个数据，那是word word这个是分到了第二个分区，现在也还没有处理，所以这里边word是零，所以我们看到上面这个第一个任务啊，第一个算子S，这里S1处理了三个数据，S2处理了一个数据，但是这四个数据呢，其实最后在萨任务这里只处理了一个。
08:09
那剩下的一些数据。有一些是还在some任务这里正处理边的啊，一个是这个word，另外一个是SOUTH2这里的哈，他们俩是在some任务这里处理的，那第二个哈呢，浅色的这个哈，还在map任务这里处理。他们当前处理的状态，当前的这个时间点是不同的。那接下来就是检查点保存的具体的算法了。那首先我们应该想到由job manager要发出一个指令，触发检查点的保存啊，那这个时候它会向所有的S任务去发出指令。SS任务接到之后就会。插入一个分界线，在当前数据流里边直接插入一个分界线，所以我们发现了针对不同的流，或者是同一个流的不同分区读入的这个不同的分区，我们不需要要求当前SS1和SS2它的偏移量一定要一致，因为这个就没关系嘛，他我第一个S可能读的快一点，读到了三个数据，第二个S呢，我就只读到一个数据，这个是没问题的。
09:20
我们只要最后保存的时候把并行的任务。对应的偏移量同时都保存下来就可以了啊，所以当前SS任务接收到了Barry的时候，那就把当前的偏移量作为状态保存下。具体在执行的过程当中，其实我们知道manager肯定是向task manager发出的指令，它是周期性的，向每个task manager发送一条当前的呃，带有新检查点ID的这样一个消息啊，那当前的这个barrier里边包含的信息其实就一个，就是当前的检查点ID，比方说这是一号检查点啊，我们就可以把它放在这里。
10:03
接下接下来这个每一个task manager上就检查每一个是S任务，就在S任务里边插入检查点，然后保存状态。而在SS任务保存状态的过程中，我们会发现这个时候后面的任务并不受影响，它完全并行，而且各干各的，互不干涉，所以后边我们会看到sum任务这里，诶，终于把这个word处理完了，它也输出了一个WORD1现在状态word这里。改成了一变，变化成了一，而后边的两个哈呢，还都没有处理完，所以还在路上。接下来我们就继续看。Barry在不同的任务之间流动的过程，以及后续任务对它的保存处理的过程。接下来第二步啊，那我们就会看到。第一个SS任务状态如果已经保存完毕的话，那分界线就要向下游去传递，传递的规则那应该是。
11:06
直接向下游广播出去啊，那这里面我们会发现这个，呃，在真正划分了。真正合并了算子链之后，哎，那其实第一个S任务和map任务其实应该是合在一起的啊，他们之间是one one的关系吧，而且并行度又相同，所以这个过程当中其实是不存在广播的这个过程，我们可以认为它直接就过来了。那关键是要到后边才要做这样的一个广播啊，那在这个过程当中，在前面这个map任务进行传输的过程当中，后边同样不受影响，萨任务还在继续处理，我们看到现现在接下来。S2，这里深色的这个哈也处理完毕了，所以又输出了一个哈二啊，那当然了。浅色的上面S1处理的第二个哈，还在路上，还没有处理完啊，后续我们才会去进行处理，而且我们知道当前的S任务如果已经把它的状态全部保存完成之后，已经在持久化存储空间里边保存完毕了，那这个时候呢，他会向manager发一个确认信息，告诉manager我的快照已经保存完毕了。
12:24
然后接下来那瑞就朝下游传递。这里面会涉及到另外一个问题。就是照manager这个时候是不是就可以确认当前的检查点已经完成了呢？呃，我们知道当前检查点其实只完成了一部分，只是S任务完成了，这并不代表检查点已经完成，因为之后我们是要靠这一个检查点去从故障恢复状态，那你如果直接把这个拿出来恢复的话，后边的状态都没有啊，就显然不能够从故障里边恢复啊，那当前的manager不能直接确认检查点完成，而是要等到所有的任务都确认保存完毕的时候才能够。
13:08
确认检查点真正的完成。接下来当然就是Barry尔向下游任务传递的过程了啊，Map任务我们知道没有状态，所以它会继续向下游传递，我们这里边下游是进行了KBY分区，所以我们知道下游有两个并行的子任务，这这里面我们认为是并行度为二，然后刚好两个K分到了两个并行子任务里面，所以barrier当然就要广播到下游并行的两个子任务里面去，这里需要注意的是。经过并行传输，我们分布式传输之后，Barrier其实向下游传递的过程。也是有快有慢。那就是第一条流，就是像我们这个上面SS1，这里SS1MAP1和SS2MAP2，他们的barrier，像some任务传递的过程呢，可能是有先有后的，比如说。
14:07
现在我们就是当前是二二这里的。Barrier第第二条流里的barrier先到达了上面的sum衣这个子任务，哎，那这个时候我们就会发现当前sum任务需要去直接保存当前的状态吗？这个时候是不对的，我们知道现在萨姆这里边哈，判断当前的状态是。本身在之前啊，这里面本身应该是二，那这个时候我不能直接就做保存，因为。SOUTH1SOUTH2MAP2这里的哈都已经处理完了，在在这个检查点分界线之前的哈都处理完了，因为我收到他的barri了，但是。S1MAP1这条流里边的哈，还不能确定它都处理完了啊，所以这个时候呢，我们还应该继续等待，等待什么呢，把S1。
15:07
MAP1这里的哈也全处理完，那怎么样能处理完呢？当然就是要等到对应的那个barrier也到来，这就是barrier对齐的一个过程。当然了，下边的第二个分区word也是一样，如果说诶，我们这里边是先来了S1MAP1这里的bar的话，那同样。第二个分区的萨姆任务，萨姆二也不能直接保存自己的状态，即使现在我们看到这个就应该它的状态就应该是一，这也不能直接保存，而是要等到两个BARRY2都对齐都到来的时候，这个时候才能进行状态的保存。啊，所以我们会看到啊，接下来我们要做的就是barrier对齐，等到所有上游分区的Barry全部到。那如果全部到来之后，接下来我们就知道了，可以把当前的状态进行保存了，保存的话，我们保存到的就是HELLO3WORD1。
16:08
那大家如果仔细看的话，可能会发现，诶，对于这个第二个分区SUM2来讲，好像看起来我们这个WORD1很早就都已经处理完了呀，后边的这个等待的这个过程是不是就没有必要呢？诶并不是这样，这主要是因为我们要判断的这个时间节点，保存的时间节点是什么呢？其实是。S1处理完三个数据，SS2处理完一个数据的那个时间节点，诶，所以我。只处理完一个WORD1的时候，这个时候我并不能确定已经第一条流处理完三个数据，第二条流处理完一个数据，我必须要等到两个barrier到齐，这个时候我们才能够确认这一点啊，所以这就是分界线对齐它的意义所在。
17:02
那当然了，在分界线对齐的这个过程当中，是有可能还会收到新的数据的啊，那这个时候当然我们的状态是不能直接保存的，但是我们知道当前如果收到新的数据的话，继续做计算，那这个状态就会改变。是不是所有的数据都是来者不拒，来了之后就做计算呢？这里需要做一个区分啊。那就是如果对于当前的萨一来讲，如果他接收到的数据首先来到的是SOUTH1MAP1，也就是浅色的第一条留分区里边到来的数据的话，诶，那当然对应的这个barrier还没来嘛，所以之前的数据当然是要处理的，我们就正常处理，把它状态的改变叠加在里边，然后输出数据就可以了。但是假如说假如说这个第二条流里边，这个分区里边处理的速度特别快。
18:02
当前他的Barry来了之后呢，紧跟着后边的这个word哈就都已经来了，那我们知道word是分到了第二个分区，那哈呢，又分到了上面这个分区，这个时候就已经来了，那这个哈还要再加一吗。这里就不能再去加一了，因为当前这个分区的barrier已经到来了，它之后的数据就不应该状态改变，保保存在当前的checkpoint里面，所以那接下来来的深色的哈，那就应该要缓存起来，不能正常处理。而浅色的哈，就是Barry没有到来的那个分区的哈，就可以正常处理状态都叠加在里面啊，所以这个过程当中我们可能还要把一些数据缓存起来。那当我们把当前的状态都已经保存完毕之后啊，那所有任务都已经完成了，就会通知到job manager job manager就会确认当前的检查点已经保存成功，那如果发生故障的话，就从这个检查点去读取状态进行恢复就可以了。
19:10
然后接下来所有的任务就可以正常继续执行了，我们所说的正常执行并不是说要把之前的阻塞住，我们看到在前面处理后，后续这个sum任务保存的时候，SS任务就直接正常去读取了。因为它的任务该。它的状态该保存什么，其实都已经保存完毕了，所以就正常读后面的数据，也就是因为前面能够继继续的正常处理数据，所以后边我们再做检查点。保存，在做这个barrier对齐的过程当中，才有可能需要去缓存一些处理的比较快的数据啊，那接下来如果当前萨任务都已经保存状态完毕了，检查点都已经保存成功了，那这个时候它的缓存数据就可以继续正常处理了。而且我们要注意，为了保证我们所有数据的先后顺序，应该先把之前缓存的数据一个一个拿出来处理，处理完了之后再去正常读取接下来的数据。
20:16
那之后的顺序就完全跟我们正常处理的过程完全一致了。还要注意的另外一点就是因为分界线对齐，它是要求先到达的分区，是得做缓存等待的，哎，那所以在这个过程当中，先到达的这个分区相当于数据就要堆积起来了，哎，那如果说我们之前的这个任务，它处理数据的速度特别快的话，我们这里数据就会越堆越多，诶那就有可能会出现所谓的反压或者叫被压bad pressure，那出现这种情况。就会导致我们一层一层递推回去，我们的任务进行检查点保存的时候可能要保存很久，而且堆积了大量的缓冲数据，我们整个系统的性能就会大大的降低啊，那为了应对这种情况呢？呃，Flink01:11版本之后就提供了不对的检查点的保存方式，那所谓的不对齐的保存方式呢？那就是它可以让我们在收到一个。
21:30
分区对应的那个barrier的时候，就直接把当前的状态做一个保存，诶那我们可能会想到，那你如果不做对齐，来了一个barrier就直接保存，那是不是就会导致另外其他的分区有些数据的状态就没有保存进来呢？呃，确实是这样的，所以它的代价就是在保存做这个状态保存的同时，也要把未处理的缓冲数据，也就是说已经接收到的其他的一些数据，类似于当前的一些上下文信息，也要保存到检查点里边来。
22:05
啊，那这样的话，我们只要遇到一个分区bar的时候，不需要等待，直接就可以启动，保存就会更快，延迟更低，但是可能我们每一个检查点就要保存更多的信息。这就是检查点的具体算法。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之2022版Flink1.13（Java版）

（120/171）

6分39秒

001_Flink课程简介

510

12分54秒

002_第一章_Flink简介（一）_Flink起源和设计理念

350

12分25秒

003_第一章_Flink简介（二）_Flink在企业的应用

400

8分41秒

004_第一章_Flink简介（三）_Flink的优势

440

18分2秒

005_第一章_Flink简介（四）_数据处理框架的演变

460

4分55秒

006_第一章_Flink简介（五）_流处理的应用场景

290

6分57秒

007_第一章_Flink简介（六）_Flink的分层API

350

10分5秒

008_第一章_Flink简介（七）_Flink和Spark的区别

350

11分58秒

009_第二章_Flink快速上手（一）_环境准备和创建项目

410

15分19秒

010_第二章_Flink快速上手（二）_批处理_Word Count（一）

420

8分31秒

011_第二章_Flink快速上手（二）_批处理_Word Count（二）

430

13分47秒

012_第二章_Flink快速上手（三）_流处理（一）_有界流处理Word Count（一）

400

6分42秒

013_第二章_Flink快速上手（三）_流处理（一）_有界流处理Word Count（二）

360

11分47秒

014_第二章_Flink快速上手（三）_流处理（二）无界流处理Word Count

410

18分16秒

015_第三章_Flink部署（一）_快速启动一个集群（一）_环境配置和基本介绍

360

8分41秒

016_第三章_Flink部署（一）_快速启动一个集群（二）_集群启动

440

12分31秒

017_第三章_Flink部署（一）_快速启动一个集群（三）_提交作业（一）_Web UI提交

360

11分3秒

018_第三章_Flink部署（一）_快速启动一个集群（三）_提交作业（二）_命令行提交

330

10分59秒

019_第三章_Flink部署（二）_部署模式

320

3分49秒

020_第三章_Flink部署（三）_独立模式的部署

380

18分50秒

021_第三章_Flink部署（四）_Yarn模式的部署

400

13分39秒

022_第四章_Flink运行时架构（一）_Flink系统架构

390

12分12秒

023_第四章_Flink运行时架构（二）_作业提交流程

370

10分46秒

024_第四章_Flink运行时架构（三）_一些重要概念（一）_数据流图

450

12分15秒

025_第四章_Flink运行时架构（三）_一些重要概念（二）_并行度

400

14分53秒

026_第四章_Flink运行时架构（三）_一些重要概念（三）_算子链

390

6分13秒

027_第四章_Flink运行时架构（三）_一些重要概念（四）_执行图

390

17分36秒

028_第四章_Flink运行时架构（三）_一些重要概念（五）_Task Slots

450

6分23秒

029_第四章_Flink运行时架构（四）_Flink的任务调度

380

5分40秒

030_第五章_DataStream API（基础篇）（一）_整体介绍

370

16分12秒

031_第五章_DataStream API（基础篇）（二）_执行环境

400

5分18秒

032_第五章_DataStream API（基础篇）（三）_源算子（一）_整体介绍

400

5分17秒

033_第五章_DataStream API（基础篇）（三）_源算子（二）_准备工作

460

17分14秒

034_第五章_DataStream API（基础篇）（三）_源算子（三）_读取有界流

370

4分4秒

035_第五章_DataStream API（基础篇）（三）_源算子（四）_读取Socket文本流

350

11分50秒

036_第五章_DataStream API（基础篇）（三）_源算子（五）_读取Kafka

400

14分50秒

037_第五章_DataStream API（基础篇）（三）_源算子（六）_自定义Source

470

6分32秒

038_第五章_DataStream API（基础篇）（三）_源算子（七）_自定义并行Source

380

10分21秒

039_第五章_DataStream API（基础篇）（三）_源算子（八）_Flink支持的数据类型（一）

400

12分59秒

040_第五章_DataStream API（基础篇）（三）_源算子（八）_Flink支持的数据类型（二）

360

13分14秒

041_第五章_DataStream API（基础篇）（四）_Transform（一）_Map

460

10分46秒

042_第五章_DataStream API（基础篇）（四）_Transform（二）_Filter

410

13分37秒

043_第五章_DataStream API（基础篇）（四）_Transform（三）_FlatMap

350

12分14秒

044_第五章_DataStream API（基础篇）（四）_Transform（五）_KeyBy

430

13分17秒

045_第五章_DataStream API（基础篇）（四）_Transform（六）_简单聚合

390

20分24秒

046_第五章_DataStream API（基础篇）（四）_Transform（七）_归约聚合

370

9分24秒

047_第五章_DataStream API（基础篇）（四）_Transform（八）_UDF（一）_函数类和匿名函数

420

14分40秒

048_第五章_DataStream API（基础篇）（四）_Transform（八）_UDF（二）_富函数类

470

18分2秒

049_第五章_DataStream API（基础篇）（四）_Transform（九）_物理分区（一）_随机和轮询分区

400

14分19秒

050_第五章_DataStream API（基础篇）（四）_Transform（十）_物理分区（二）_Rescale

320

8分37秒

051_第五章_DataStream API（基础篇）（四）_Transform（十）_物理分区（三）_广播、全局及自定义分区

350

11分48秒

052_第五章_DataStream API（基础篇）（五）_Sink（一）_连接到外部系统

430

15分23秒

053_第五章_DataStream API（基础篇）（五）_Sink（二）_输出到文件

320

13分0秒

054_第五章_DataStream API（基础篇）（五）_Sink（三）_输出到Kafka

440

13分56秒

055_第五章_DataStream API（基础篇）（五）_Sink（四）_输出到Redis

240

13分13秒

056_第五章_DataStream API（基础篇）（五）_Sink（五）_输出到Elasticsearch

390

14分28秒

057_第五章_DataStream API（基础篇）（五）_Sink（六）_输出到MySQL

400

5分4秒

058_第五章_DataStream API（基础篇）（五）_Sink（七）_自定义Sink输出

350

13分30秒

059_第六章_Flink中的时间和窗口（一）_时间语义

410

10分20秒

060_第六章_Flink中的时间和窗口（二）_水位线（一）_水位线的概念

410

17分17秒

061_第六章_Flink中的时间和窗口（二）_水位线（二）_水位线的原理和特性

370

14分25秒

062_第六章_Flink中的时间和窗口（二）_水位线（三）_水位线在代码中的生成（一）

370

8分48秒

063_第六章_Flink中的时间和窗口（二）_水位线（三）_水位线在代码中的生成（二）

390

11分3秒

064_第六章_Flink中的时间和窗口（二）_水位线（四）_自定义水位线的生成

470

6分58秒

065_第六章_Flink中的时间和窗口（二）_水位线（五）_水位线的传递

440

9分52秒

066_第六章_Flink中的时间和窗口（三）_窗口（一）_窗口的基本概念

350

20分50秒

067_第六章_Flink中的时间和窗口（三）_窗口（二）_窗口的分类

370

4分10秒

068_第六章_Flink中的时间和窗口（三）_窗口（三）_窗口API概览

340

12分27秒

069_第六章_Flink中的时间和窗口（三）_窗口（四）_窗口分配器

370

5分30秒

070_第六章_Flink中的时间和窗口（三）_窗口（五）_窗口函数整体介绍

440

5分33秒

071_第六章_Flink中的时间和窗口（三）_窗口（六）_窗口函数分类

430

9分7秒

072_第六章_Flink中的时间和窗口（三）_窗口（七）_增量聚合函数（一）_ReduceFunction

420

13分20秒

073_第六章_Flink中的时间和窗口（三）_窗口（七）_增量聚合函数（二）_AggregateFunction

420

19分42秒

074_第六章_Flink中的时间和窗口（三）_窗口（七）_增量聚合函数（三）_应用实例

410

18分31秒

075_第六章_Flink中的时间和窗口（三）_窗口（八）_全窗口函数

450

10分55秒

076_第六章_Flink中的时间和窗口（三）_窗口（九）_两种窗口函数结合

410

11分43秒

077_第六章_Flink中的时间和窗口（三）_窗口（十）_窗口函数综合应用实例

400

19分44秒

078_第六章_Flink中的时间和窗口（三）_窗口（十一）_窗口其它API

380

11分32秒

079_第六章_Flink中的时间和窗口（四）_处理迟到数据（一）_代码实现

430

12分42秒

080_第六章_Flink中的时间和窗口（四）_处理迟到数据（二）_测试

370

17分1秒

081_第七章_处理函数（一）_处理函数的概念和分类

460

14分16秒

082_第七章_处理函数（二）_ProcessFunction

420

12分2秒

083_第七章_处理函数（三）_KeyedProcessFunction（一）_处理时间定时器

460

11分32秒

084_第七章_处理函数（三）_KeyedProcessFunction（二）_事件时间定时器

340

5分23秒

085_第七章_处理函数（四）_ProcessWindowFunction

330

15分49秒

086_第七章_处理函数（五）_Top N（一）_使用ProcessAllWindowFunction（一）_基本思路

350

14分44秒

087_第七章_处理函数（五）_Top N（一）_使用ProcessAllWindowFunction（二）_代码实现和测试

370

22分11秒

088_第七章_处理函数（五）_Top N（二）_使用KeyedProcessFunction

290

16分2秒

089_第八章_多流转换（一）_分流

450

13分50秒

090_第八章_多流转换（二）_合流（一）_ 联合（Union）

380

12分56秒

091_第八章_多流转换（二）_合流（二）_ 连接（Connect）

330

23分18秒

092_第八章_多流转换（二）_合流（三）_ 应用实例（一）_程序架构和实现思路

380

15分1秒

093_第八章_多流转换（二）_合流（三）_ 应用实例（二）_具体代码实现

320

6分14秒

094_第八章_多流转换（二）_合流（四）_ 广播连接流

440

21分14秒

095_第八章_多流转换（三）_双流Join（一）_ 窗口联结

380

20分8秒

096_第八章_多流转换（三）_双流Join（二）_ 间隔联结

470

15分17秒

097_第八章_多流转换（三）_双流Join（三）_ 窗口同组联结

400

13分50秒

098_第九章_状态编程（一）_Flink中的状态（一）_ 状态的定义

420

12分59秒

099_第九章_状态编程（一）_Flink中的状态（二）_ 状态的管理

430

100

16分6秒

100_第九章_状态编程（一）_Flink中的状态（三）_ 状态的分类

410

101

19分38秒

101_第九章_状态编程（二）_按键分区状态（一）_ 基本概念和类型

410

102

13分56秒

102_第九章_状态编程（二）_按键分区状态（二）_ 代码中的使用（一）_基本方式和值状态

280

103

17分16秒

103_第九章_状态编程（二）_按键分区状态（二）_ 代码中的使用（二）_其它状态

440

104

24分34秒

104_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（一）_值状态

390

105

19分29秒

105_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（二）_列表状态

370

106

22分14秒

106_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（三）_映射状态

420

107

20分8秒

107_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（四）_聚合状态

340

108

17分18秒

108_第九章_状态编程（二）_按键分区状态（四）_ 状态生存时间

340

109

14分27秒

109_第九章_状态编程（三）_算子状态（一）_ 基本概念和类型

400

110

12分5秒

110_第九章_状态编程（三）_算子状态（二）_应用实例（一）_基本思路和框架

370

111

16分31秒

111_第九章_状态编程（三）_算子状态（二）_应用实例（二）_具体实现和测试

340

112

8分54秒

112_第九章_状态编程（四）_广播状态（一）_基本概念和用法

410

113

22分48秒

113_第九章_状态编程（四）_广播状态（二）_应用实例

380

114

9分52秒

114_第九章_状态编程（五）_状态持久化（一）_检查点

450

115

21分15秒

115_第九章_状态编程（五）_状态持久化（二）_状态后端

420

116

11分54秒

116_第十章_容错机制（一）_检查点（一）_检查点的保存原理（一）_周期性的保存

340

117

15分2秒

117_第十章_容错机制（一）_检查点（一）_检查点的保存原理（二）_保存的时间点

340

118

6分40秒

118_第十章_容错机制（一）_检查点（二）_从检查点恢复状态

320

119

15分0秒

119_第十章_容错机制（一）_检查点（三）_检查点算法（一）_分界线

390

120

22分22秒

120_第十章_容错机制（一）_检查点（三）_检查点算法（二）_分布式快照算法

360

121

19分19秒

121_第十章_容错机制（一）_检查点（四）_检查点配置

310

122

13分12秒

122_第十章_容错机制（一）_检查点（五）_保存点

300

123

10分50秒

123_第十章_容错机制（二）_状态一致性（一）_一致性的概念和级别

430

124

15分16秒

124_第十章_容错机制（二）_状态一致性（二）_端到端状态一致性（一）

290

125

15分54秒

125_第十章_容错机制（二）_状态一致性（二）_端到端状态一致性（二）

380

126

18分22秒

126_第十章_容错机制（二）_状态一致性（三）_端到端精确一次

310

127

13分26秒

127_第十一章_Table API和SQL（一）_整体介绍

350

128

19分18秒

128_第十一章_Table API和SQL（二）_快速上手

360

129

12分48秒

129_第十一章_Table API和SQL（三）_基本API（一）_程序架构

370

130

13分40秒

130_第十一章_Table API和SQL（三）_基本API（二）_表环境

410

131

16分31秒

131_第十一章_Table API和SQL（三）_基本API（三）_创建表

340

132

20分33秒

132_第十一章_Table API和SQL（三）_基本API（四）_表的查询和输出（一）

410

133

15分0秒

133_第十一章_Table API和SQL（三）_基本API（四）_表的查询和输出（二）

400

134

12分24秒

134_第十一章_Table API和SQL（三）_基本API（五）_表和流的转换（一）_表转换成流

350

135

13分25秒

135_第十一章_Table API和SQL（三）_基本API（五）_表和流的转换（二）_流转换成表

390

136

16分21秒

136_第十一章_Table API和SQL（四）_流处理中的表（一）_动态表和持续查询

440

137

25分10秒

137_第十一章_Table API和SQL（四）_流处理中的表（二）_流转换成动态表做动态查询

420

138

15分2秒

138_第十一章_Table API和SQL（四）_流处理中的表（三）_动态表编码成数据流

380

139

16分23秒

139_第十一章_Table API和SQL（五）_时间属性和窗口（一）_时间属性（一）_在DDL中定义

390

140

11分55秒

140_第十一章_Table API和SQL（五）_时间属性和窗口（一）_时间属性（二）_流转换成表时定义

360

141

22分46秒

141_第十一章_Table API和SQL（五）_时间属性和窗口（二）_窗口

320

142

21分5秒

142_第十一章_Table API和SQL（六）_聚合查询（一）_分组聚合

420

143

16分1秒

143_第十一章_Table API和SQL（六）_聚合查询（二）_窗口聚合

400

144

15分22秒

144_第十一章_Table API和SQL（六）_聚合查询（三）_开窗聚合

410

145

28分4秒

145_第十一章_Table API和SQL（六）_聚合查询（四）_TopN（一）_普通TopN

370

146

15分27秒

146_第十一章_Table API和SQL（六）_聚合查询（四）_TopN（二）_窗口TopN

450

147

14分58秒

147_第十一章_Table API和SQL（七）_联结查询

420

148

22分9秒

148_第十一章_Table API和SQL（八）_函数（一）_系统函数

390

149

9分46秒

149_第十一章_Table API和SQL（八）_函数（二）_UDF（一）_整体介绍和分类

410

150

9分6秒

150_第十一章_Table API和SQL（八）_函数（二）_UDF（二）_标量函数

410

151

16分40秒

151_第十一章_Table API和SQL（八）_函数（二）_UDF（三）_表函数

370

152

18分24秒

152_第十一章_Table API和SQL（八）_函数（二）_UDF（四）_聚合函数

350

153

25分19秒

153_第十一章_Table API和SQL（八）_函数（二）_UDF（五）_表聚合函数

300

154

9分2秒

154_第十一章_Table API和SQL（九）_SQL客户端

360

155

14分49秒

155_第十一章_Table API和SQL（十）_连接到外部系统（一）_常见的外部存储

370

156

14分11秒

156_第十一章_Table API和SQL（十）_连接到外部系统（二）_Hive

380

157

17分24秒

157_第十二章_Flink CEP（一）_基本概念和应用

380

158

17分40秒

158_第十二章_Flink CEP（二）_快速上手（一）_需求分析和定义模式

350

159

14分1秒

159_第十二章_Flink CEP（二）_快速上手（二）_检测处理代码实现和测试

370

160

13分58秒

160_第十二章_Flink CEP（三）_模式API（一）_个体模式（一）_量词

380

161

15分45秒

161_第十二章_Flink CEP（三）_模式API（一）_个体模式（二）_条件

420

162

16分31秒

162_第十二章_Flink CEP（三）_模式API（二）_组合模式

300

163

5分31秒

163_第十二章_Flink CEP（三）_模式API（三）_模式组

400

164

12分38秒

164_第十二章_Flink CEP（三）_模式API（四）_匹配后跳过策略

390

165

14分14秒

165_第十二章_Flink CEP（四）_模式的检测处理（一）_处理匹配事件

350

166

18分42秒

166_第十二章_Flink CEP（四）_模式的检测处理（二）_处理超时事件（一）_需求分析和准备工作

370

167

16分39秒

167_第十二章_Flink CEP（四）_模式的检测处理（二）_处理超时事件（二）_代码实现和测试

350

168

7分26秒

168_第十二章_Flink CEP（四）_模式的检测处理（三）_处理迟到数据

440

169

9分20秒

169_第十二章_Flink CEP（五）_CEP状态机实现（一）_思路分析和程序框架

390

170

16分32秒

170_第十二章_Flink CEP（五）_CEP状态机实现（二）_定义状态机

330

171

7分53秒

171_第十二章_Flink CEP（五）_CEP状态机实现（三）_实现处理逻辑及测试

380

120_第十章_容错机制（一）_检查点（三）_检查点算法（二）_分布式快照算法

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐