文章/答案/技术大牛

发布

首页视频126_第十章_容错机制（二）_状态一致性（三）_端到端精确一次

126_第十章_容错机制（二）_状态一致性（三）_端到端精确一次

2022-12-022022-12-02 16:02:17播放31

点赞0 收藏 0

2.尚硅谷大数据学科--核心框架/尚硅谷大数据技术之2022版Flink1.13（Java版）/视频/126_第十章_容错机制（二）_状态一致性（三）_端到端精确一次 .mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
了解了状态一致性和端到端状态一致性的概念啊，接下来我们就可以看一个具体的应用实例，那就是考察一下flink跟卡夫卡进行连接的时候，怎么样保证端到端的精确一次状态一致性。啊，我们知道在流处理当中，最好的流处理器目前当然就是flink，而最好的数据源和外部系统应该是什么呢？我们知道如果想要保证精确一次的状态一致性的话。首先数据源这边就得保证它能重放数据，那我们知道卡夫卡它是可以重置偏移量的，就符合这样的一个要求，而且它本身就是流式的处理数据的这种方式，它是消息队列嘛，诶那所以卡夫卡跟flink可以说是天生一对，往往我们在流处理应用当中都是以卡夫卡作为数据源。读取数据之后，然后进入flink进行处理计算得到的结果我们还可以写入到卡夫卡当中，所以接下来我们就考察一样一下这样的一套系统怎么样去实现真正意义上的端到端。
01:14
那首先我们先看一下这个整体我们想要做什么样的操作，那首先既然是端到端的exactlys，那我们就得保证三个环节，三个组件都能够实现精确一次的保证。首先flink内部这个就不用说了，我们直接开启检查点，那就可以保证内部是精确一次。然后在输入端，输入端这个也非常简单，我们知道卡夫卡本身是可以重新提交偏移量的，它可以对数据进行持久化的保存，我们只要重新提交偏移量，就可以再次去访问之前已经消费过的数据啊，那所以我们可以在当前的S任务，也就是。Flink跟卡夫卡的连接器里面有对应的那个consumer flink卡夫卡consumer里面可以去配置，把当前的读取的偏移量保存成一个算子状态，然后写入到检查点当中，发生故障的时候呢，只要从检查点里边读取出对应的偏移量，然后再重新连接卡夫卡的。
02:19
连接卡普卡去重新提交偏移量，重新读取数据，就可以保证我们所有的数据不会丢失了，这样的话至少就能保证至少一次。这个过程呢，不需要我们单独的去进行任何的处理，因为flink卡卡这个连接器里边其实已经帮我们全部处理完成了。那更加重要的呢，其实是输出这一段，因为之前我们知道输出这一端的话，最严格意义上的一个实现其实是两阶段提交啊，那对于flink卡卡的连接的话，官方连接器flink卡夫卡producer，它能不能实现两阶段提交呢？
03:02
完全是可以的，我们可以在源码当中去做一个考察，我们可以看一下之前写过的。到写入到卡夫卡的这个过程，看一眼当时添加的flink卡夫卡producer，我们会看到。本身弗卡夫卡producer。实现的就是一个face commit function，这就是之前我们提到过的Li给我们提供的两阶段提交的s function接口，啊，当然了，本身这是一个。抽象类啊，那这里我们的flink卡夫卡producer就是继承了这样一个抽象类的对应的这个接口，这个抽象类里边当然就有各种各样做两阶段提交的方法，比如说我们这里看到有commit，就是做正式提交的时候要做什么样的操作，那另外当然就还有pre commit预提交啊，这两阶段提交可以看的非常的明显。
04:00
当然了，也还会有跟事务相关的一些操作，Transaction相关的一些操作，那具体的这个流程我们就不在源码里面去看了，可能会比较复杂，我们直接梳理一下，通过图例的方式做一个讲解。那首先我们先看一下当前的这个系统应该是什么样子，那当前我们要的呢，整个中间的这一部分是flink系统，我们现在简单起见，就三个任务，三个算子，首先是source，我们知道当前算子是连接是卡夫卡，从卡夫卡消费数据，那就应该是flink卡夫卡consumer，然后接下来是一个window算子要开窗，然后经过开窗操作，经过开窗计算之后得到的呢，直接就通过think任务输出到外部的卡塔里面去了，所以这里面的thinkk当然就是一个。Flink卡夫卡啊，那所以前边是从卡夫卡去读取数据，后边又是写入到卡夫卡当中去，这就是我们整个的。
05:02
端到端的连接起来的一个完整的应用，而接下来还涉及到的其他组件呢，首先应该有manager manager当然是起到了一个协调调度的作用啊，在做这个检查点操作的时候。只需要装manager者出现的，另外呢，还有状态后端，状态后端这边是涉及到了，我们要把检查点做持久化的保存，是要写入到这里面去的。接下来我们就看。首先。应该要启动，第一步就是启动检查点的保存。启动检查点的操作呢，是由job manager发起的啊，它会给所有的task manager发出一个指令，那我们知道所有的task manager接到指令之后，就会在S任务里边去插入一个检查点的分界线。那这一时刻就标志着我们进入了两阶段的。预提交阶段啊，当然了，现在其实还没有具体提可以提交的数据，但是其实这个状态已经是预提交阶段了，所以首先我们这里边是要启动检查点的保存，那么S任务就会插入一个barrier，而且把自己的状态就要开始保存了。接下来barrier就要在这所有的任务之间顺着这个数据流向下游流动，每一个接收到barrier的任务都要保存自己当前的状态。
06:29
那所以接下来呢，我们就是每一个算子任务需要对状态进行快照，首先我们会看到SS任务它的快，它的状态当然就是当前读取的偏移量了啊，所以首先应该把自己的状态做一个快照保存，保存到状态后端里面去，保存完成之后呢，应该要通知job manager，然后把barrier朝下游传递。那接下来下游的每一个算子任务都做相同的操作，都是把自己的状态保存起来，做快照，保存到状态后端，然后通知job manager，然后继续朝下游保存，继续朝下游传递。
07:14
当然了，这个过程还是一个预提交的阶段，因为我们当前还没有数据到达think这里，还没有真正的朝外部系统提交呢。啊，那最终我们关注的就是要达到了thinkk任务，Thinkink任务同样也要把自己的状态做一个快照，保存到状态后端，然后接下来要通知job manager，另外还需要当前的数据，如果要是处理的话，那需要把它通过事物。预提交到外部系统当中，所以我们会发现当前的S任务，它对于数据的处理。那是当前我们考察的应该分成了两种情况，一种是遇到了正常的数据。
08:00
那就开启一个事物。通过事物把它预提交到外部系统，那如果说当前遇到的是barrier的话，那么就把当前的状态做一个快照保存，然后通知manager当前保存完成。诶，那我们可能会考虑到当前的这一个barrier，如果遇到的话，难道不应该是表示应该要提交当前事物了吗？怎么只是把当前的这个快照做一个保存呢？这里我们需要注意，当前的barrier只是一个分界线，以它为界，之前的所有数据是前一个检查点，所以也就应该是前一个。事物去进行预提交，而在它之后呢，再来的数据，那就应该是下一个检查点，同样也就应该开启一个新的事物去进行提交。它的区别在这里，而真正这个事物最终的提交并不是以当前的barrier作为分界的，而是要等job manager那边确认所有的任务都已经完成状态保存的时候，当前的checkpoint真正保存完毕的时候，这个时候才去提交。之前。
09:21
指代的对应的检查点，对应的那样一个事物，哎，所以这里这个开启事物和提交事务的节点我们一定要搞清楚。所以当前thinkin任务看到一个barrier的时候，他所做的操作其实是。把当前的状态做保存，然后通知job manager接下来要开启一个新的事物。在barri之后到来的所有数据的提交就要通过下一个事物去进行预提交了。当然有可能上一个事物还没有真正的提交，因为有可能还没有做完检查点的保存嘛。我们现在是一个分布式的系统，当前这一个think任务它已经保存完毕，不代表其他的任务都保存完毕，所以接下来我们还要等。
10:15
一直要等到job manager通知所有的任务当前的check的保存完成啊，那前提当然就是照manager这边收到了所有任务发来的确认消息，那这个时候就可以通知所有任务了，保存完成，这个时候think任务就可以把之前的。事务一去做一个真正意义上的提交了，所以这个阶段才是真正的正式提交。这就是我们所说的两阶段提交，在这之前都是预提交，在这一步才是真正的提交。那它的优势就在于，跟我们前面提到的预写日志wal这种方式相比的话，它不是一批批量的去写入数据，而是之前所有的数据其实通过这个事物都已经写入到卡夫卡里边了，当前只是发起一个消息告诉卡夫卡我当前要把这个事物做一个正式提交，这些数据正式可用，仅此而已。所以当然当前的效率是非常高的，而我们的写入也是流逝的，写入这个过程没有任何的性能上的影响，时间延迟也会非常的低。
11:31
这里还要需要注意的一点是，在卡夫卡里边之前。通过事务提交的数据，在卡夫卡当中其实是会标记为未确认，也就是我们所说的uncommitted啊，那这些未确认的数据其实正常来讲，我们是对于卡夫卡来讲是不能去消费的，因为你如果消费了未确认的数据的话，那相当于。在外部系统看来，对于外部的用户看来的话，就相当于我已经拿到了一次数据了啊，那如果要是发生故障，当前这个事物被撤销的话，回滚的话，相当于之后我还会再去写入一次，那外部用户可能会看到两次写入，所以我们应该保证uncommitted未确认的数据应该是不能被消费。
12:20
而之后如果我们已经接收到了manager发来的确认检查点保存完成的消息的时候，这个时候正式做提交，提交当前事务，卡夫卡才会把之前的所有数据，在事物当中提交的所有数据标记成已确认，那接下来就可以正常的去做消费。那我们知道在。整个的这个流程当中，任何一个环节其实都有可能发生故障，那发生只要发生故障，我们就直接从上一个已经保存好的checkpoint恢复所有的状态，而如果要是当前没有正式提交的事物就都会被回滚，因为我们知道事物跟checkpoint是完全一一对应的，所以只要是之前已经保存好的checkpoint。
13:13
对应的那些数据当然就已经正式提交了，而没有保存的那些的对应的数据，当然对应所有即使是已经做了预提交啊，那当然也会回滚，也会撤销啊，那接下来我们就真正能保证。写入一次，而且只写入一次，这样的话就实现了端到端的one状态一致性的保证。那这里我们会发现，其实真正在实际应用的时候呢，还要去做一些额外的配置啊，那首先我们知道肯定在代码当中首先是要启用检查点啊，如果不启用检查点的话，那中间flink处理的这个环节就直接没有效果了嘛啊，所以这是首先我们要保证的第一点前提。
14:03
主要是针对flink卡夫卡producer，也就是我们的S端，这里我们需要去做一些处理。在源码里面我们可以看到，对于Li卡法producer来说。它的构造方法里边。有一种构造方法的传入，是可以传入一个所谓的producer SE，一个语义的，这个语义就是所谓的。状态一致性的语义，我们可以看到，这里边可以选择ones at least one和none啊，也就是说这个none当然就是at most ones了，其实是一样的嘛，没有任何保证，如果说我们想让它真正意义上达到。精确一次的状态一致性级别的话，一定要把它设置成one，一定要在它的构造方法里边去传入这个参数，因为默认情况下其实使用的是at least one，这是我们需要去注意的一点。
15:06
除了代码当中我们需要传入one这样一个基本的参数之外，那其实对于端到端的状态一致性的话，我们还要去做一些额外的配置，比如说卡夫卡的消费者隔离级别啊，因为我们知道对于卡夫卡而言，默认的隔离级别isolation.level其实是read uncommitted。这里边所说的卡夫卡，我们要配置主要是配置，配置写入的那个外部系统卡夫卡，而那预提交阶段数据，我们写入的时候，它标记的是未提交嘛，Uncommted，那假如说我们默认直接就是read UN committed的话，相当于就可以直接去消费它了。这不符合我们对于端到端精确一次状态一致性的定义啊，那所以如果说我们真正要想做到精确一次的话，应该把隔离级别配置成read committed，这样的话，消费者如果想要去访问未提交的消息的时候，就不能直接访问啊，那我们必须要等到真正的checkpoint做完，当前事务已经正式提交了之后。
16:15
当前的数据标记成了committed的时候，才可以真正去做消费啊，那当然了，如果这样做的话，外部应用消费这个数据可能就会有一个延迟了，因为类似于我们又得一直等，等到这个事物真正提交啊，这个延迟会稍微的大一点。除此之外，我们还有一个地方需要去做配置，那就是事物的超时配置，这就是之前我们说的。如果说当前我们在做这一个checkpoint过程当中时间比较长，而本身的事物。超过了它的超时时间的话，那就相当于这个事物直接失效了，那甚至有可能会导致我们整个数据丢失啊，这里面有一个非常重要的点，就是弗Li卡夫卡的连接器，它本身是有一个事物的超时时间默认是一小时，这个是比较长的，因为考虑到我们要做很复杂的呃，检查点的保存，还有其他很复杂的一些计算，而卡夫卡集群里边配置的事物最大超时时间默认是。
17:20
15分钟，所以这样的话就有可能会出现卡夫卡连接器，这是我们的sink任务，Sink任务这边认为。事物还没有超时，还可以继续进行事物的，呃，当前检查点的保存继续等待。而卡夫卡集群那边可能已经超过了对应的时间，已经把它关闭了啊，那这样的话我们就会丢弃预提交的数据，所以说如果说我们想要不出现这种情况的话，那应该要配置。前边的这个超时时间应该要小于等于后边卡夫卡集群配置的集群超时时间，当然一般情况我们是把这个集群的超时时间调大就可以解决这个问题。
18:07
所以我们会发现端到端的。精确一次状态一致性的实现还是比较复杂的，我们要考虑很多非常实际的细节点。这就是关于状态一致性的所有的内容。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之2022版Flink1.13（Java版）

（126/171）

6分39秒

001_Flink课程简介

510

12分54秒

002_第一章_Flink简介（一）_Flink起源和设计理念

350

12分25秒

003_第一章_Flink简介（二）_Flink在企业的应用

400

8分41秒

004_第一章_Flink简介（三）_Flink的优势

440

18分2秒

005_第一章_Flink简介（四）_数据处理框架的演变

460

4分55秒

006_第一章_Flink简介（五）_流处理的应用场景

290

6分57秒

007_第一章_Flink简介（六）_Flink的分层API

350

10分5秒

008_第一章_Flink简介（七）_Flink和Spark的区别

350

11分58秒

009_第二章_Flink快速上手（一）_环境准备和创建项目

410

15分19秒

010_第二章_Flink快速上手（二）_批处理_Word Count（一）

420

8分31秒

011_第二章_Flink快速上手（二）_批处理_Word Count（二）

430

13分47秒

012_第二章_Flink快速上手（三）_流处理（一）_有界流处理Word Count（一）

400

6分42秒

013_第二章_Flink快速上手（三）_流处理（一）_有界流处理Word Count（二）

360

11分47秒

014_第二章_Flink快速上手（三）_流处理（二）无界流处理Word Count

410

18分16秒

015_第三章_Flink部署（一）_快速启动一个集群（一）_环境配置和基本介绍

360

8分41秒

016_第三章_Flink部署（一）_快速启动一个集群（二）_集群启动

440

12分31秒

017_第三章_Flink部署（一）_快速启动一个集群（三）_提交作业（一）_Web UI提交

360

11分3秒

018_第三章_Flink部署（一）_快速启动一个集群（三）_提交作业（二）_命令行提交

330

10分59秒

019_第三章_Flink部署（二）_部署模式

320

3分49秒

020_第三章_Flink部署（三）_独立模式的部署

380

18分50秒

021_第三章_Flink部署（四）_Yarn模式的部署

400

13分39秒

022_第四章_Flink运行时架构（一）_Flink系统架构

390

12分12秒

023_第四章_Flink运行时架构（二）_作业提交流程

370

10分46秒

024_第四章_Flink运行时架构（三）_一些重要概念（一）_数据流图

450

12分15秒

025_第四章_Flink运行时架构（三）_一些重要概念（二）_并行度

400

14分53秒

026_第四章_Flink运行时架构（三）_一些重要概念（三）_算子链

390

6分13秒

027_第四章_Flink运行时架构（三）_一些重要概念（四）_执行图

390

17分36秒

028_第四章_Flink运行时架构（三）_一些重要概念（五）_Task Slots

450

6分23秒

029_第四章_Flink运行时架构（四）_Flink的任务调度

380

5分40秒

030_第五章_DataStream API（基础篇）（一）_整体介绍

370

16分12秒

031_第五章_DataStream API（基础篇）（二）_执行环境

400

5分18秒

032_第五章_DataStream API（基础篇）（三）_源算子（一）_整体介绍

400

5分17秒

033_第五章_DataStream API（基础篇）（三）_源算子（二）_准备工作

460

17分14秒

034_第五章_DataStream API（基础篇）（三）_源算子（三）_读取有界流

370

4分4秒

035_第五章_DataStream API（基础篇）（三）_源算子（四）_读取Socket文本流

350

11分50秒

036_第五章_DataStream API（基础篇）（三）_源算子（五）_读取Kafka

400

14分50秒

037_第五章_DataStream API（基础篇）（三）_源算子（六）_自定义Source

470

6分32秒

038_第五章_DataStream API（基础篇）（三）_源算子（七）_自定义并行Source

380

10分21秒

039_第五章_DataStream API（基础篇）（三）_源算子（八）_Flink支持的数据类型（一）

400

12分59秒

040_第五章_DataStream API（基础篇）（三）_源算子（八）_Flink支持的数据类型（二）

360

13分14秒

041_第五章_DataStream API（基础篇）（四）_Transform（一）_Map

460

10分46秒

042_第五章_DataStream API（基础篇）（四）_Transform（二）_Filter

410

13分37秒

043_第五章_DataStream API（基础篇）（四）_Transform（三）_FlatMap

350

12分14秒

044_第五章_DataStream API（基础篇）（四）_Transform（五）_KeyBy

430

13分17秒

045_第五章_DataStream API（基础篇）（四）_Transform（六）_简单聚合

390

20分24秒

046_第五章_DataStream API（基础篇）（四）_Transform（七）_归约聚合

370

9分24秒

047_第五章_DataStream API（基础篇）（四）_Transform（八）_UDF（一）_函数类和匿名函数

420

14分40秒

048_第五章_DataStream API（基础篇）（四）_Transform（八）_UDF（二）_富函数类

470

18分2秒

049_第五章_DataStream API（基础篇）（四）_Transform（九）_物理分区（一）_随机和轮询分区

400

14分19秒

050_第五章_DataStream API（基础篇）（四）_Transform（十）_物理分区（二）_Rescale

320

8分37秒

051_第五章_DataStream API（基础篇）（四）_Transform（十）_物理分区（三）_广播、全局及自定义分区

350

11分48秒

052_第五章_DataStream API（基础篇）（五）_Sink（一）_连接到外部系统

430

15分23秒

053_第五章_DataStream API（基础篇）（五）_Sink（二）_输出到文件

320

13分0秒

054_第五章_DataStream API（基础篇）（五）_Sink（三）_输出到Kafka

440

13分56秒

055_第五章_DataStream API（基础篇）（五）_Sink（四）_输出到Redis

240

13分13秒

056_第五章_DataStream API（基础篇）（五）_Sink（五）_输出到Elasticsearch

390

14分28秒

057_第五章_DataStream API（基础篇）（五）_Sink（六）_输出到MySQL

400

5分4秒

058_第五章_DataStream API（基础篇）（五）_Sink（七）_自定义Sink输出

350

13分30秒

059_第六章_Flink中的时间和窗口（一）_时间语义

410

10分20秒

060_第六章_Flink中的时间和窗口（二）_水位线（一）_水位线的概念

410

17分17秒

061_第六章_Flink中的时间和窗口（二）_水位线（二）_水位线的原理和特性

370

14分25秒

062_第六章_Flink中的时间和窗口（二）_水位线（三）_水位线在代码中的生成（一）

370

8分48秒

063_第六章_Flink中的时间和窗口（二）_水位线（三）_水位线在代码中的生成（二）

390

11分3秒

064_第六章_Flink中的时间和窗口（二）_水位线（四）_自定义水位线的生成

470

6分58秒

065_第六章_Flink中的时间和窗口（二）_水位线（五）_水位线的传递

440

9分52秒

066_第六章_Flink中的时间和窗口（三）_窗口（一）_窗口的基本概念

350

20分50秒

067_第六章_Flink中的时间和窗口（三）_窗口（二）_窗口的分类

370

4分10秒

068_第六章_Flink中的时间和窗口（三）_窗口（三）_窗口API概览

340

12分27秒

069_第六章_Flink中的时间和窗口（三）_窗口（四）_窗口分配器

370

5分30秒

070_第六章_Flink中的时间和窗口（三）_窗口（五）_窗口函数整体介绍

440

5分33秒

071_第六章_Flink中的时间和窗口（三）_窗口（六）_窗口函数分类

430

9分7秒

072_第六章_Flink中的时间和窗口（三）_窗口（七）_增量聚合函数（一）_ReduceFunction

420

13分20秒

073_第六章_Flink中的时间和窗口（三）_窗口（七）_增量聚合函数（二）_AggregateFunction

420

19分42秒

074_第六章_Flink中的时间和窗口（三）_窗口（七）_增量聚合函数（三）_应用实例

410

18分31秒

075_第六章_Flink中的时间和窗口（三）_窗口（八）_全窗口函数

450

10分55秒

076_第六章_Flink中的时间和窗口（三）_窗口（九）_两种窗口函数结合

410

11分43秒

077_第六章_Flink中的时间和窗口（三）_窗口（十）_窗口函数综合应用实例

400

19分44秒

078_第六章_Flink中的时间和窗口（三）_窗口（十一）_窗口其它API

380

11分32秒

079_第六章_Flink中的时间和窗口（四）_处理迟到数据（一）_代码实现

430

12分42秒

080_第六章_Flink中的时间和窗口（四）_处理迟到数据（二）_测试

370

17分1秒

081_第七章_处理函数（一）_处理函数的概念和分类

460

14分16秒

082_第七章_处理函数（二）_ProcessFunction

420

12分2秒

083_第七章_处理函数（三）_KeyedProcessFunction（一）_处理时间定时器

460

11分32秒

084_第七章_处理函数（三）_KeyedProcessFunction（二）_事件时间定时器

340

5分23秒

085_第七章_处理函数（四）_ProcessWindowFunction

330

15分49秒

086_第七章_处理函数（五）_Top N（一）_使用ProcessAllWindowFunction（一）_基本思路

350

14分44秒

087_第七章_处理函数（五）_Top N（一）_使用ProcessAllWindowFunction（二）_代码实现和测试

370

22分11秒

088_第七章_处理函数（五）_Top N（二）_使用KeyedProcessFunction

290

16分2秒

089_第八章_多流转换（一）_分流

450

13分50秒

090_第八章_多流转换（二）_合流（一）_ 联合（Union）

380

12分56秒

091_第八章_多流转换（二）_合流（二）_ 连接（Connect）

330

23分18秒

092_第八章_多流转换（二）_合流（三）_ 应用实例（一）_程序架构和实现思路

380

15分1秒

093_第八章_多流转换（二）_合流（三）_ 应用实例（二）_具体代码实现

320

6分14秒

094_第八章_多流转换（二）_合流（四）_ 广播连接流

440

21分14秒

095_第八章_多流转换（三）_双流Join（一）_ 窗口联结

380

20分8秒

096_第八章_多流转换（三）_双流Join（二）_ 间隔联结

470

15分17秒

097_第八章_多流转换（三）_双流Join（三）_ 窗口同组联结

400

13分50秒

098_第九章_状态编程（一）_Flink中的状态（一）_ 状态的定义

420

12分59秒

099_第九章_状态编程（一）_Flink中的状态（二）_ 状态的管理

430

100

16分6秒

100_第九章_状态编程（一）_Flink中的状态（三）_ 状态的分类

410

101

19分38秒

101_第九章_状态编程（二）_按键分区状态（一）_ 基本概念和类型

410

102

13分56秒

102_第九章_状态编程（二）_按键分区状态（二）_ 代码中的使用（一）_基本方式和值状态

280

103

17分16秒

103_第九章_状态编程（二）_按键分区状态（二）_ 代码中的使用（二）_其它状态

440

104

24分34秒

104_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（一）_值状态

390

105

19分29秒

105_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（二）_列表状态

370

106

22分14秒

106_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（三）_映射状态

420

107

20分8秒

107_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（四）_聚合状态

340

108

17分18秒

108_第九章_状态编程（二）_按键分区状态（四）_ 状态生存时间

340

109

14分27秒

109_第九章_状态编程（三）_算子状态（一）_ 基本概念和类型

400

110

12分5秒

110_第九章_状态编程（三）_算子状态（二）_应用实例（一）_基本思路和框架

370

111

16分31秒

111_第九章_状态编程（三）_算子状态（二）_应用实例（二）_具体实现和测试

340

112

8分54秒

112_第九章_状态编程（四）_广播状态（一）_基本概念和用法

410

113

22分48秒

113_第九章_状态编程（四）_广播状态（二）_应用实例

380

114

9分52秒

114_第九章_状态编程（五）_状态持久化（一）_检查点

450

115

21分15秒

115_第九章_状态编程（五）_状态持久化（二）_状态后端

420

116

11分54秒

116_第十章_容错机制（一）_检查点（一）_检查点的保存原理（一）_周期性的保存

340

117

15分2秒

117_第十章_容错机制（一）_检查点（一）_检查点的保存原理（二）_保存的时间点

340

118

6分40秒

118_第十章_容错机制（一）_检查点（二）_从检查点恢复状态

320

119

15分0秒

119_第十章_容错机制（一）_检查点（三）_检查点算法（一）_分界线

390

120

22分22秒

120_第十章_容错机制（一）_检查点（三）_检查点算法（二）_分布式快照算法

360

121

19分19秒

121_第十章_容错机制（一）_检查点（四）_检查点配置

310

122

13分12秒

122_第十章_容错机制（一）_检查点（五）_保存点

300

123

10分50秒

123_第十章_容错机制（二）_状态一致性（一）_一致性的概念和级别

430

124

15分16秒

124_第十章_容错机制（二）_状态一致性（二）_端到端状态一致性（一）

290

125

15分54秒

125_第十章_容错机制（二）_状态一致性（二）_端到端状态一致性（二）

380

126

18分22秒

126_第十章_容错机制（二）_状态一致性（三）_端到端精确一次

310

127

13分26秒

127_第十一章_Table API和SQL（一）_整体介绍

350

128

19分18秒

128_第十一章_Table API和SQL（二）_快速上手

360

129

12分48秒

129_第十一章_Table API和SQL（三）_基本API（一）_程序架构

370

130

13分40秒

130_第十一章_Table API和SQL（三）_基本API（二）_表环境

410

131

16分31秒

131_第十一章_Table API和SQL（三）_基本API（三）_创建表

340

132

20分33秒

132_第十一章_Table API和SQL（三）_基本API（四）_表的查询和输出（一）

410

133

15分0秒

133_第十一章_Table API和SQL（三）_基本API（四）_表的查询和输出（二）

400

134

12分24秒

134_第十一章_Table API和SQL（三）_基本API（五）_表和流的转换（一）_表转换成流

350

135

13分25秒

135_第十一章_Table API和SQL（三）_基本API（五）_表和流的转换（二）_流转换成表

390

136

16分21秒

136_第十一章_Table API和SQL（四）_流处理中的表（一）_动态表和持续查询

440

137

25分10秒

137_第十一章_Table API和SQL（四）_流处理中的表（二）_流转换成动态表做动态查询

420

138

15分2秒

138_第十一章_Table API和SQL（四）_流处理中的表（三）_动态表编码成数据流

380

139

16分23秒

139_第十一章_Table API和SQL（五）_时间属性和窗口（一）_时间属性（一）_在DDL中定义

390

140

11分55秒

140_第十一章_Table API和SQL（五）_时间属性和窗口（一）_时间属性（二）_流转换成表时定义

360

141

22分46秒

141_第十一章_Table API和SQL（五）_时间属性和窗口（二）_窗口

320

142

21分5秒

142_第十一章_Table API和SQL（六）_聚合查询（一）_分组聚合

420

143

16分1秒

143_第十一章_Table API和SQL（六）_聚合查询（二）_窗口聚合

400

144

15分22秒

144_第十一章_Table API和SQL（六）_聚合查询（三）_开窗聚合

410

145

28分4秒

145_第十一章_Table API和SQL（六）_聚合查询（四）_TopN（一）_普通TopN

370

146

15分27秒

146_第十一章_Table API和SQL（六）_聚合查询（四）_TopN（二）_窗口TopN

450

147

14分58秒

147_第十一章_Table API和SQL（七）_联结查询

420

148

22分9秒

148_第十一章_Table API和SQL（八）_函数（一）_系统函数

390

149

9分46秒

149_第十一章_Table API和SQL（八）_函数（二）_UDF（一）_整体介绍和分类

410

150

9分6秒

150_第十一章_Table API和SQL（八）_函数（二）_UDF（二）_标量函数

410

151

16分40秒

151_第十一章_Table API和SQL（八）_函数（二）_UDF（三）_表函数

370

152

18分24秒

152_第十一章_Table API和SQL（八）_函数（二）_UDF（四）_聚合函数

350

153

25分19秒

153_第十一章_Table API和SQL（八）_函数（二）_UDF（五）_表聚合函数

300

154

9分2秒

154_第十一章_Table API和SQL（九）_SQL客户端

360

155

14分49秒

155_第十一章_Table API和SQL（十）_连接到外部系统（一）_常见的外部存储

370

156

14分11秒

156_第十一章_Table API和SQL（十）_连接到外部系统（二）_Hive

380

157

17分24秒

157_第十二章_Flink CEP（一）_基本概念和应用

380

158

17分40秒

158_第十二章_Flink CEP（二）_快速上手（一）_需求分析和定义模式

350

159

14分1秒

159_第十二章_Flink CEP（二）_快速上手（二）_检测处理代码实现和测试

370

160

13分58秒

160_第十二章_Flink CEP（三）_模式API（一）_个体模式（一）_量词

380

161

15分45秒

161_第十二章_Flink CEP（三）_模式API（一）_个体模式（二）_条件

420

162

16分31秒

162_第十二章_Flink CEP（三）_模式API（二）_组合模式

300

163

5分31秒

163_第十二章_Flink CEP（三）_模式API（三）_模式组

400

164

12分38秒

164_第十二章_Flink CEP（三）_模式API（四）_匹配后跳过策略

390

165

14分14秒

165_第十二章_Flink CEP（四）_模式的检测处理（一）_处理匹配事件

350

166

18分42秒

166_第十二章_Flink CEP（四）_模式的检测处理（二）_处理超时事件（一）_需求分析和准备工作

370

167

16分39秒

167_第十二章_Flink CEP（四）_模式的检测处理（二）_处理超时事件（二）_代码实现和测试

350

168

7分26秒

168_第十二章_Flink CEP（四）_模式的检测处理（三）_处理迟到数据

440

169

9分20秒

169_第十二章_Flink CEP（五）_CEP状态机实现（一）_思路分析和程序框架

390

170

16分32秒

170_第十二章_Flink CEP（五）_CEP状态机实现（二）_定义状态机

330

171

7分53秒

171_第十二章_Flink CEP（五）_CEP状态机实现（三）_实现处理逻辑及测试

380

126_第十章_容错机制（二）_状态一致性（三）_端到端精确一次

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐