文章/答案/技术大牛

发布

首页视频046_第五章_DataStream API（基础篇）（四）_Transform（七）_归约聚合

046_第五章_DataStream API（基础篇）（四）_Transform（七）_归约聚合

2022-12-022022-12-02 16:02:16播放37

点赞0 收藏 0

2.尚硅谷大数据学科--核心框架/尚硅谷大数据技术之2022版Flink1.13（Java版）/视频/046_第五章_DataStream API（基础篇）（四）_Transform（七）_归约聚合.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
了解了简单聚合的用法。那其实我们发现。简单聚合，整体来讲就是两步，首先先要基于一个data stream做一个K，得到k stream，那stream本质上当然也还是data stream了，只不过它是增加了一个key的信息，根据当前指定的键去进行分组操作，那。这里所用的分组操作是什么呢？当然就是分组聚合了，所以基于我们可以去直接调用flink帮我们内嵌进去的一系列简单句合运算，那这里面最常见的就是some以及max me。这样的几种操作啊，那max可以认为是特殊化的max。这些操作比较简单，但是我们会发现它的应用场景其实非常局限的，就只有求和、求最大最小值这样几种需求，那对于真正的应用场景而言，需求可能是五花八门的，这个时候我们怎么样去自定义更加灵活的聚合操作呢？那当然这就需要有一个更加一般化、更加底层的接口定义了。
01:13
这就是所谓的里边的方法。其实这样一个操作是可以说是大名鼎鼎啊，我们知道从map开始，我们对它就非常熟悉了啊，那简单的一些转换，我们都可以把它归结成map操作，而对于规约聚合，类似这样一个统计计算的过程呢，我们都可把它归结成reduce操作啊，那所以这里边flink里边定义的reduce呢，跟我们所理解的reduce也没有太大的区别。那整体来讲，这就是一个规约聚合的过程。源码里面很明显的可以看到它要传入的就是一个规约函数，一个reduce方式啊，那这个操作很显然跟之前map filter map就又一致了，就调一个reduce方法里边传入一个实现了reduce接口的一个类的对象啊。
02:11
这样的话，我们就可以定义到底怎么样去做对应的句号。我们可以看到这样一个reduce接口里边，同样它有唯一的抽象方法，也就叫做reduce，而且我们看到它的泛型呢，也只有一个T，说明经过聚合转换之后，当前的数据类型是不变的，这和之前我们看到的呃，简单聚合运算是一样的。那我们看一看当前这个reduce方法到底是个什么呢？看起来非常简单，它只有两个T类型的参数，Y61 Y62，返回值也是一个T类型。那这到底是要干什么事儿呢？简单来说的话，我们可以认为这个方法接收到的是两个T类型的事件。
03:01
那这里边的两个事件分别是什么意思呢？呃，那从规约的本意上来看的话，我们可以认为就是把所有收集到的集合里边的每一个数据拿出来，按照一定的规则，不停的规约，不停的规约，不停的规约。那我们知道规约得到的结果又是一个相同类型的数据，所以我们就会发现了两两规约又得到一个相同类型的数据，接下来又跟下一个数据，两两规约又得到一个新的值，再去两两规约，那最终按照同一个规约方法。不停的迭代调用下去，最终就会得到一个唯一的规约聚合的结果，这就是所谓reduce的基本的含义。那当然了，在处理的过程当中，我们应该怎么看待这里的Y61和Y62呢？我们可以认为，VALUE1就是我们进行规约操作这两两规约的第一个数。
04:02
来二，那当然就是第二个数了。那我们会想到，如果当前真的就是所有数据里边的第一个数和第二个数的话，这个没问题，那假如说已经处理到了后边的数据的话，新来了一个数据的话，那当前的VALUE1 value2又表示什么呢？很显然。VALUE1表示的是当前已经规约好的结果，这在规约的时候它就变成第一个数了，那同样接下来如果我们是跟第四个数据进行规约的话，那VALUE1就是当前前三个数去调用reduce方法，然后进行规约之后得到的结果。那VALUE2呢，就是当前新输入的第四个数，所以我们会看到，本质上来讲，Reduce其实是针对一个列表去进行两两规约的啊，那它的内部呢，很明显我们应该对之前已经规约好的结果要进行一个保存。
05:03
接下来我们输入一个新的数据的时候，要把当前数据和之前的数据两两之前数据已经规约好的结果，他们俩做一个规约啊，那所以当前的VALUE1其实是之前所有数据规约出来得到的一个结果值。在flink流处理的底层实现过程当中，实际上呢，我们这里就要把之前所有规约聚合的结果保存下来，这个东西就叫做。状态。这就是我们所说的flink是有状态的流处理，那在做规约聚合的过程当中就使用到了状态。其实如果如果我们去较真的话，会发现前面提到的简单聚合操作，不管是some还是max，很显然，在当前数据某一个数据新的数据传进来的时候，也应该要结合之前所有数据保存下来的一个状态去进行对比，不管是做叠加some，还是做最大最小的一个对比判断之前，我们都应该保存某一个数据，这个数据也是当前聚合运算的状态。
06:20
就是所说的state。关于状态这一部分呢，我们还是会在后续章节里边做详细的介绍，现在我们至少就可以知道在flink当中确实是有状态的操作啊，接下来呢，我们就可以来用一个具体的案例来看一看。Reduce进行规约聚合，到底怎么做？所以接下来我们可以在当前下边去重新创建一个测试的va。我们当前是。Reduce test。同样也是做聚合的测试，它比前面我们讲的简单聚合就要更加一般化，更加底层，更加灵活一些了。啊，那整个的测试的框架其实跟之前还是一样的，我们把异常抛出，然后前面的内容呢，我们可以直接创建流式执行环境和数据的读取，直接copy简单聚合的这一部分。
07:22
接下来我们要做的是一个具体的需求了。呃，我们可以做一个比较复杂的设想，我们现在想要统计的是当前访问量最大，也就是点击次数最多的那个用户，最活跃的用户到底是谁？诶，那这个就稍微复杂一点了，什么叫做最活跃，我们已经说明了，那就是当前它的访问量最大，那访问量最大的话，我们当前数据输入进来之后，并没有访问量这样一个参数啊，所以我们首先要做一个访问量的统计。这个统计其实跟前面的work count就非常类似了，很简单，那就是来一条Mary的数据，我们就记一个MARY1好，那接下来如果再来一个Mary数据的话，那就应该是把它叠加起来，Count加一变成MARY2啊，那我们类似之前work count的做法，就可以每来一条数据，把它map成一个二元组，就一个user一个一，User一个一，后边直接做一个简单聚合some起来就可以了。
08:25
那当然了，我们也可以用reduce去实现一个类似sum的功能。在接下来呢，接下来就涉及到我们还需要对当前所有的用户，不同的用户做一个最大访问值的筛选，所以还应该实现一个类似于max的功能。我们应该把对应的。访问量最大的那个用户，把他的数据提取出来。所以这里我们的第一步。应该分两步走。第一步是要。
09:01
每个用户的访问频次。这是我们的第一步，就是把每一个用户的count数先统计出来啊，那这个的话其实比较简单，基于stream，我们可以先做一个map，把它转换成二元组啊，那这里边我们可以直接使用拉姆达表达式转换成一个啊，TEMP2也可以，因为如果是拉姆达表达式的话，我们知道后边涉及到泛型擦除还需要有一个returns啊，那这里我们也可以直接去new一个方式，匿名类的方式写在这里也是一样的啊，那当然了，这里我们转换之后的类型。就应该变成了TEMP2。对应的两个元素，一个是string类型的user，另外一个是长整型的count值，这是我们能够想到的转换里边必须要实现一个map方法，诶，那就直接return。直接一个TEMP2了，那我们知道调用的是temp2.2方法里边value.user以及一个1EL，哎，这就是我们简单的一个转换过程。
10:11
后，接下来我们应该要基于当前的二元组数据统计每一个user对应它出现的频次，那所以呃，如果直接调简单聚合方法的话，那就直接K之后some就可以了。而现在呢，我们希望实现的是一个reduce聚合，我们可以看看reduce怎么样去实现那些简单聚合方法啊。所以这里边reduce首先也要K，我们说flink里边必须先分按键分组，然后才能做聚合操作，Reduce也不例外，所以先，那这里面有一个问题什么呢？我们当然可以，因为现在是二元组嘛，我们可以KY0，按照当前的这个字段位置的索引来进行一个定义，但是我们发现这种方式其实要被弃用了，那更好的方式是什么呢？很明显，我们应该传入当前的字段的名称或者。
11:10
传入一个key select，这里其实最推荐的方法就是select，我们其实直接写一个拉表达式就可以了，那我们要提取的是什么，其实很明显就是。就是当前。二元组里边的它的两个元素分别叫做F0和F1嘛，所以我们要选取的就是F0。分组之后定义了K，那接下来就可以直接reduce去做聚合了。reduce里边要传入一个reduce function，所以我们可以看到当前的reduce function就是传入的这个泛型参数，就是当前的数据类型。因为我们已经做过了map转换，当前的数据类型当然就是二元组类型了，那这里边我们要实现的方法，那就是基于之前规约聚合得到的结果，然后再结合当前新传入的数据Y62，怎么样得到一个新的聚合结果呢？啊，其实我们知道最后得到的新的规约结结果既要更新成下一次的VALUE1啊，既要更新我们内部的状态，也要作为返回数据直接输出出去。
12:27
交给下一步去进行进一步的操作，那所以这里面我们想要去返回的也应该是一个二元组点二。那里面的字段。User当然不变了，Y61.F0，其实我们知道Y62也是对应的，也是同一个user，因为我们K的话。接下来关键就是后边的第二个字段怎么去定义count值怎么办？诶，那其实我们知道count值的话，不能直接去做加一啊，当然如果要加一的话，基于VALUE1的count值去加一是可以的，但是一定不能基于VALUE2的count值去加一。
13:04
因为当前的2Y2是新输入的当前数据，它的第二个字段一定是一。而VALUE1呢，是之前的规约结果，它的字段其实是之前的一个count累积的状态。所以接下来我们最为稳妥的方式其实就是一点F1，也不要直接加一，而是加上VALUE2点F1。这是最为稳妥的方式，把两个要规约的值，它的第二个字段叠加起来。这样的话，我们就实现了每个用户访问频次的统计，那这样得到的结果呢？经过聚合之后，当然就又得到了single output stream operator啊，这本质上就就是一个新的data stream，注意它和stream是不同的，他们都继承自data stream。但是。当前的这个算子啊，Single output stream operator，它并不是K，当前是没有K的定义，它就是普普通通的get啊，所以当前我们可以把它叫成。
14:12
比方说叫LIS by user，每一个用户的点击访问事件统计的个数。然后接下来的第二步，那就是要根据当前的个数选取出最活跃的用户了。所以我们是。选取。当前最活跃。活跃的用户。那这个过程如果我们直接调用简单聚合方法的话，那就是直接把所有数据里边对应的后边这一个count值最大的提取出来就可以了。而呢，现在我们是想要用reduce的方式来做一个实现，但这里面又涉及到另外一个问题，因为我们知道基于这个by user这样一个数据。
15:03
想要做max统计，或者说我们用一个reduce做一个规约聚合的话。首先我们得。得按键做分组分区啊。那现在我们基于哪一个可以做做分分区呢。很显然，我们现在不能基于user再做分区了。因为当前我们要统计的是所有用户里边访问次数最大，那当前既然所有用户都得包含在里边，User不能作为K字段，那我们当前这个KY是不是就没有办法做了呢？其实也不是。因为当前我们在API调用的过程当中，是要求必须基于KSTEM才能调用聚合方法，但是没有限制我们k stream里边它的K到底指定成什么样，哎，那我们当前呢，完全可以不从data里边去提取字段，我直接就定义一个string类型的字段，就叫做K。
16:00
那这代表的含义就是。所有的数据都分配到了相同的一个K，都分配到相，所有的数据都会有相同的一个K，就叫做K，那么他们就都会被分配到同一个分组，同一个分区去。当然了，在实际应用过程当中，我们要慎用这种方式，因为它会造成我们所有的数据没有办法并行，全部扔到一个slot上去进行聚合计算。但是在有些场景下，如果我们前面已经对于分区的数据进行统计了，最后得到的是少量的数据，那最后我们要全局统计出一个最活跃的话，那最后这一步也是不可缺少的了，必须把它整合在一起啊，那这个时候就相当于分到同一组去做计算。后边我们同样还是来一个啊，那这里我们还是直接reduce，你有一个reduce方式，这里边我们要做的计算呢，是提取第二个字段最大的那个元素。
17:04
那这个时候又怎么办呢？啊，那其实我们会发现最终返回的值，前边我们已经规约聚合得到的这个结果，它就是之前某个最活跃的用户相关的那个数据。所以我们最后返回的呢，要不就是Y61，要么就是Y62。而这里我们其实就是要做一个判断了，如果value一点，它的抗值F一看谁大，如果要大于。Y62.1的话。那么我们就直接返回。VALUE1的。直接返回Y61整个这个事件，这个二元组，因为我们的数据类型不能变啊，那当然了，谁大就返回谁嘛，否则的话，那就直接返回VALUE2。这就是我们定义的这个过程。
18:00
那我们可以把这个叫叫做最后的result。我们可以把做一个打印输出，下边不要忘记env execute执行起来。接下来我们就可以看到当前最活跃的用户了。当然这里面涉及到一个问题，就是如果两者相等怎么办呢？按照我们当前的逻辑，显然如果两者相等的话，那就是直接输出Y62，用最新的这个数据来替代我们之前已经规约聚合好的数据。那就是只要。跟之前一致了的话，我们就用最新的这个用户啊，最最活跃的用户里边选一个最新还在活跃的用户，把它做一个输出，那具体到底要不要相等。这个逻辑是由业务需求来指定。为了更加明确的看到一个测试结果，我们这里还是调整一下测试的数据，因为我们看到这里边很显然啊，一直访问次数最大的就是Bob啊，那前面是Mary，后面是Bob，来了之后就更新成Bob啊，在后面是爱丽丝，然后又是Bob，那我们知道如果当前Alice丝的数据。
19:08
其实我们也不用统计更多。只要把它放在。提前一条放在这个Bob的第二条后边的话，那很明显爱丽丝的第二条数据来了之后是会更新当前最大的，最最活跃，而且最新的用户是Alice，所以接下来我们可以运行一下，看一看聚合出来的结果是否符合预期。我们可以看到Mary第一条数据来了之后，哎，当然当前。访问次数最多的只有Mary一个嘛，是MARY1，鲍B来了之后，鲍B就把它更新了，是BOB1，因为我们是最活跃和最新最近访问的这样一个原则啊，那另外ice丝来了之后，爱ice丝一，那鲍B第二条数据来了之后，诶，那就更新成鲍B最活跃了吗？鲍B是二，然后同样爱丽丝来了第二条数据之后，同样会替代掉Bob是爱ice丝二，接下来就全都是Bob是当前最活跃的用户了。
20:06
BB3 BB4b5。这就是我们能够看到的reduce规约聚合的、一般化的、更加灵活的应用。在实际应用场景里边，其实使用去进行规约聚合，就可以实现大部分的需求了。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之2022版Flink1.13（Java版）

（46/171）

6分39秒

001_Flink课程简介

510

12分54秒

002_第一章_Flink简介（一）_Flink起源和设计理念

350

12分25秒

003_第一章_Flink简介（二）_Flink在企业的应用

400

8分41秒

004_第一章_Flink简介（三）_Flink的优势

440

18分2秒

005_第一章_Flink简介（四）_数据处理框架的演变

460

4分55秒

006_第一章_Flink简介（五）_流处理的应用场景

290

6分57秒

007_第一章_Flink简介（六）_Flink的分层API

350

10分5秒

008_第一章_Flink简介（七）_Flink和Spark的区别

350

11分58秒

009_第二章_Flink快速上手（一）_环境准备和创建项目

410

15分19秒

010_第二章_Flink快速上手（二）_批处理_Word Count（一）

420

8分31秒

011_第二章_Flink快速上手（二）_批处理_Word Count（二）

430

13分47秒

012_第二章_Flink快速上手（三）_流处理（一）_有界流处理Word Count（一）

400

6分42秒

013_第二章_Flink快速上手（三）_流处理（一）_有界流处理Word Count（二）

360

11分47秒

014_第二章_Flink快速上手（三）_流处理（二）无界流处理Word Count

410

18分16秒

015_第三章_Flink部署（一）_快速启动一个集群（一）_环境配置和基本介绍

360

8分41秒

016_第三章_Flink部署（一）_快速启动一个集群（二）_集群启动

440

12分31秒

017_第三章_Flink部署（一）_快速启动一个集群（三）_提交作业（一）_Web UI提交

360

11分3秒

018_第三章_Flink部署（一）_快速启动一个集群（三）_提交作业（二）_命令行提交

330

10分59秒

019_第三章_Flink部署（二）_部署模式

320

3分49秒

020_第三章_Flink部署（三）_独立模式的部署

380

18分50秒

021_第三章_Flink部署（四）_Yarn模式的部署

400

13分39秒

022_第四章_Flink运行时架构（一）_Flink系统架构

390

12分12秒

023_第四章_Flink运行时架构（二）_作业提交流程

370

10分46秒

024_第四章_Flink运行时架构（三）_一些重要概念（一）_数据流图

450

12分15秒

025_第四章_Flink运行时架构（三）_一些重要概念（二）_并行度

400

14分53秒

026_第四章_Flink运行时架构（三）_一些重要概念（三）_算子链

390

6分13秒

027_第四章_Flink运行时架构（三）_一些重要概念（四）_执行图

390

17分36秒

028_第四章_Flink运行时架构（三）_一些重要概念（五）_Task Slots

450

6分23秒

029_第四章_Flink运行时架构（四）_Flink的任务调度

380

5分40秒

030_第五章_DataStream API（基础篇）（一）_整体介绍

370

16分12秒

031_第五章_DataStream API（基础篇）（二）_执行环境

400

5分18秒

032_第五章_DataStream API（基础篇）（三）_源算子（一）_整体介绍

400

5分17秒

033_第五章_DataStream API（基础篇）（三）_源算子（二）_准备工作

460

17分14秒

034_第五章_DataStream API（基础篇）（三）_源算子（三）_读取有界流

370

4分4秒

035_第五章_DataStream API（基础篇）（三）_源算子（四）_读取Socket文本流

350

11分50秒

036_第五章_DataStream API（基础篇）（三）_源算子（五）_读取Kafka

400

14分50秒

037_第五章_DataStream API（基础篇）（三）_源算子（六）_自定义Source

470

6分32秒

038_第五章_DataStream API（基础篇）（三）_源算子（七）_自定义并行Source

380

10分21秒

039_第五章_DataStream API（基础篇）（三）_源算子（八）_Flink支持的数据类型（一）

400

12分59秒

040_第五章_DataStream API（基础篇）（三）_源算子（八）_Flink支持的数据类型（二）

360

13分14秒

041_第五章_DataStream API（基础篇）（四）_Transform（一）_Map

460

10分46秒

042_第五章_DataStream API（基础篇）（四）_Transform（二）_Filter

410

13分37秒

043_第五章_DataStream API（基础篇）（四）_Transform（三）_FlatMap

350

12分14秒

044_第五章_DataStream API（基础篇）（四）_Transform（五）_KeyBy

430

13分17秒

045_第五章_DataStream API（基础篇）（四）_Transform（六）_简单聚合

390

20分24秒

046_第五章_DataStream API（基础篇）（四）_Transform（七）_归约聚合

370

9分24秒

047_第五章_DataStream API（基础篇）（四）_Transform（八）_UDF（一）_函数类和匿名函数

420

14分40秒

048_第五章_DataStream API（基础篇）（四）_Transform（八）_UDF（二）_富函数类

470

18分2秒

049_第五章_DataStream API（基础篇）（四）_Transform（九）_物理分区（一）_随机和轮询分区

400

14分19秒

050_第五章_DataStream API（基础篇）（四）_Transform（十）_物理分区（二）_Rescale

320

8分37秒

051_第五章_DataStream API（基础篇）（四）_Transform（十）_物理分区（三）_广播、全局及自定义分区

350

11分48秒

052_第五章_DataStream API（基础篇）（五）_Sink（一）_连接到外部系统

430

15分23秒

053_第五章_DataStream API（基础篇）（五）_Sink（二）_输出到文件

320

13分0秒

054_第五章_DataStream API（基础篇）（五）_Sink（三）_输出到Kafka

440

13分56秒

055_第五章_DataStream API（基础篇）（五）_Sink（四）_输出到Redis

240

13分13秒

056_第五章_DataStream API（基础篇）（五）_Sink（五）_输出到Elasticsearch

390

14分28秒

057_第五章_DataStream API（基础篇）（五）_Sink（六）_输出到MySQL

400

5分4秒

058_第五章_DataStream API（基础篇）（五）_Sink（七）_自定义Sink输出

350

13分30秒

059_第六章_Flink中的时间和窗口（一）_时间语义

410

10分20秒

060_第六章_Flink中的时间和窗口（二）_水位线（一）_水位线的概念

410

17分17秒

061_第六章_Flink中的时间和窗口（二）_水位线（二）_水位线的原理和特性

370

14分25秒

062_第六章_Flink中的时间和窗口（二）_水位线（三）_水位线在代码中的生成（一）

370

8分48秒

063_第六章_Flink中的时间和窗口（二）_水位线（三）_水位线在代码中的生成（二）

390

11分3秒

064_第六章_Flink中的时间和窗口（二）_水位线（四）_自定义水位线的生成

470

6分58秒

065_第六章_Flink中的时间和窗口（二）_水位线（五）_水位线的传递

440

9分52秒

066_第六章_Flink中的时间和窗口（三）_窗口（一）_窗口的基本概念

350

20分50秒

067_第六章_Flink中的时间和窗口（三）_窗口（二）_窗口的分类

370

4分10秒

068_第六章_Flink中的时间和窗口（三）_窗口（三）_窗口API概览

340

12分27秒

069_第六章_Flink中的时间和窗口（三）_窗口（四）_窗口分配器

370

5分30秒

070_第六章_Flink中的时间和窗口（三）_窗口（五）_窗口函数整体介绍

440

5分33秒

071_第六章_Flink中的时间和窗口（三）_窗口（六）_窗口函数分类

430

9分7秒

072_第六章_Flink中的时间和窗口（三）_窗口（七）_增量聚合函数（一）_ReduceFunction

420

13分20秒

073_第六章_Flink中的时间和窗口（三）_窗口（七）_增量聚合函数（二）_AggregateFunction

420

19分42秒

074_第六章_Flink中的时间和窗口（三）_窗口（七）_增量聚合函数（三）_应用实例

410

18分31秒

075_第六章_Flink中的时间和窗口（三）_窗口（八）_全窗口函数

450

10分55秒

076_第六章_Flink中的时间和窗口（三）_窗口（九）_两种窗口函数结合

410

11分43秒

077_第六章_Flink中的时间和窗口（三）_窗口（十）_窗口函数综合应用实例

400

19分44秒

078_第六章_Flink中的时间和窗口（三）_窗口（十一）_窗口其它API

380

11分32秒

079_第六章_Flink中的时间和窗口（四）_处理迟到数据（一）_代码实现

430

12分42秒

080_第六章_Flink中的时间和窗口（四）_处理迟到数据（二）_测试

370

17分1秒

081_第七章_处理函数（一）_处理函数的概念和分类

460

14分16秒

082_第七章_处理函数（二）_ProcessFunction

420

12分2秒

083_第七章_处理函数（三）_KeyedProcessFunction（一）_处理时间定时器

460

11分32秒

084_第七章_处理函数（三）_KeyedProcessFunction（二）_事件时间定时器

340

5分23秒

085_第七章_处理函数（四）_ProcessWindowFunction

330

15分49秒

086_第七章_处理函数（五）_Top N（一）_使用ProcessAllWindowFunction（一）_基本思路

350

14分44秒

087_第七章_处理函数（五）_Top N（一）_使用ProcessAllWindowFunction（二）_代码实现和测试

370

22分11秒

088_第七章_处理函数（五）_Top N（二）_使用KeyedProcessFunction

290

16分2秒

089_第八章_多流转换（一）_分流

450

13分50秒

090_第八章_多流转换（二）_合流（一）_ 联合（Union）

380

12分56秒

091_第八章_多流转换（二）_合流（二）_ 连接（Connect）

330

23分18秒

092_第八章_多流转换（二）_合流（三）_ 应用实例（一）_程序架构和实现思路

380

15分1秒

093_第八章_多流转换（二）_合流（三）_ 应用实例（二）_具体代码实现

320

6分14秒

094_第八章_多流转换（二）_合流（四）_ 广播连接流

440

21分14秒

095_第八章_多流转换（三）_双流Join（一）_ 窗口联结

380

20分8秒

096_第八章_多流转换（三）_双流Join（二）_ 间隔联结

470

15分17秒

097_第八章_多流转换（三）_双流Join（三）_ 窗口同组联结

400

13分50秒

098_第九章_状态编程（一）_Flink中的状态（一）_ 状态的定义

420

12分59秒

099_第九章_状态编程（一）_Flink中的状态（二）_ 状态的管理

430

100

16分6秒

100_第九章_状态编程（一）_Flink中的状态（三）_ 状态的分类

410

101

19分38秒

101_第九章_状态编程（二）_按键分区状态（一）_ 基本概念和类型

410

102

13分56秒

102_第九章_状态编程（二）_按键分区状态（二）_ 代码中的使用（一）_基本方式和值状态

280

103

17分16秒

103_第九章_状态编程（二）_按键分区状态（二）_ 代码中的使用（二）_其它状态

440

104

24分34秒

104_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（一）_值状态

390

105

19分29秒

105_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（二）_列表状态

370

106

22分14秒

106_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（三）_映射状态

420

107

20分8秒

107_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（四）_聚合状态

340

108

17分18秒

108_第九章_状态编程（二）_按键分区状态（四）_ 状态生存时间

340

109

14分27秒

109_第九章_状态编程（三）_算子状态（一）_ 基本概念和类型

400

110

12分5秒

110_第九章_状态编程（三）_算子状态（二）_应用实例（一）_基本思路和框架

370

111

16分31秒

111_第九章_状态编程（三）_算子状态（二）_应用实例（二）_具体实现和测试

340

112

8分54秒

112_第九章_状态编程（四）_广播状态（一）_基本概念和用法

410

113

22分48秒

113_第九章_状态编程（四）_广播状态（二）_应用实例

380

114

9分52秒

114_第九章_状态编程（五）_状态持久化（一）_检查点

450

115

21分15秒

115_第九章_状态编程（五）_状态持久化（二）_状态后端

420

116

11分54秒

116_第十章_容错机制（一）_检查点（一）_检查点的保存原理（一）_周期性的保存

340

117

15分2秒

117_第十章_容错机制（一）_检查点（一）_检查点的保存原理（二）_保存的时间点

340

118

6分40秒

118_第十章_容错机制（一）_检查点（二）_从检查点恢复状态

320

119

15分0秒

119_第十章_容错机制（一）_检查点（三）_检查点算法（一）_分界线

390

120

22分22秒

120_第十章_容错机制（一）_检查点（三）_检查点算法（二）_分布式快照算法

360

121

19分19秒

121_第十章_容错机制（一）_检查点（四）_检查点配置

310

122

13分12秒

122_第十章_容错机制（一）_检查点（五）_保存点

300

123

10分50秒

123_第十章_容错机制（二）_状态一致性（一）_一致性的概念和级别

430

124

15分16秒

124_第十章_容错机制（二）_状态一致性（二）_端到端状态一致性（一）

290

125

15分54秒

125_第十章_容错机制（二）_状态一致性（二）_端到端状态一致性（二）

380

126

18分22秒

126_第十章_容错机制（二）_状态一致性（三）_端到端精确一次

310

127

13分26秒

127_第十一章_Table API和SQL（一）_整体介绍

350

128

19分18秒

128_第十一章_Table API和SQL（二）_快速上手

360

129

12分48秒

129_第十一章_Table API和SQL（三）_基本API（一）_程序架构

370

130

13分40秒

130_第十一章_Table API和SQL（三）_基本API（二）_表环境

410

131

16分31秒

131_第十一章_Table API和SQL（三）_基本API（三）_创建表

340

132

20分33秒

132_第十一章_Table API和SQL（三）_基本API（四）_表的查询和输出（一）

410

133

15分0秒

133_第十一章_Table API和SQL（三）_基本API（四）_表的查询和输出（二）

400

134

12分24秒

134_第十一章_Table API和SQL（三）_基本API（五）_表和流的转换（一）_表转换成流

350

135

13分25秒

135_第十一章_Table API和SQL（三）_基本API（五）_表和流的转换（二）_流转换成表

390

136

16分21秒

136_第十一章_Table API和SQL（四）_流处理中的表（一）_动态表和持续查询

440

137

25分10秒

137_第十一章_Table API和SQL（四）_流处理中的表（二）_流转换成动态表做动态查询

420

138

15分2秒

138_第十一章_Table API和SQL（四）_流处理中的表（三）_动态表编码成数据流

380

139

16分23秒

139_第十一章_Table API和SQL（五）_时间属性和窗口（一）_时间属性（一）_在DDL中定义

390

140

11分55秒

140_第十一章_Table API和SQL（五）_时间属性和窗口（一）_时间属性（二）_流转换成表时定义

360

141

22分46秒

141_第十一章_Table API和SQL（五）_时间属性和窗口（二）_窗口

320

142

21分5秒

142_第十一章_Table API和SQL（六）_聚合查询（一）_分组聚合

420

143

16分1秒

143_第十一章_Table API和SQL（六）_聚合查询（二）_窗口聚合

400

144

15分22秒

144_第十一章_Table API和SQL（六）_聚合查询（三）_开窗聚合

410

145

28分4秒

145_第十一章_Table API和SQL（六）_聚合查询（四）_TopN（一）_普通TopN

370

146

15分27秒

146_第十一章_Table API和SQL（六）_聚合查询（四）_TopN（二）_窗口TopN

450

147

14分58秒

147_第十一章_Table API和SQL（七）_联结查询

420

148

22分9秒

148_第十一章_Table API和SQL（八）_函数（一）_系统函数

390

149

9分46秒

149_第十一章_Table API和SQL（八）_函数（二）_UDF（一）_整体介绍和分类

410

150

9分6秒

150_第十一章_Table API和SQL（八）_函数（二）_UDF（二）_标量函数

410

151

16分40秒

151_第十一章_Table API和SQL（八）_函数（二）_UDF（三）_表函数

370

152

18分24秒

152_第十一章_Table API和SQL（八）_函数（二）_UDF（四）_聚合函数

350

153

25分19秒

153_第十一章_Table API和SQL（八）_函数（二）_UDF（五）_表聚合函数

300

154

9分2秒

154_第十一章_Table API和SQL（九）_SQL客户端

360

155

14分49秒

155_第十一章_Table API和SQL（十）_连接到外部系统（一）_常见的外部存储

370

156

14分11秒

156_第十一章_Table API和SQL（十）_连接到外部系统（二）_Hive

380

157

17分24秒

157_第十二章_Flink CEP（一）_基本概念和应用

380

158

17分40秒

158_第十二章_Flink CEP（二）_快速上手（一）_需求分析和定义模式

350

159

14分1秒

159_第十二章_Flink CEP（二）_快速上手（二）_检测处理代码实现和测试

370

160

13分58秒

160_第十二章_Flink CEP（三）_模式API（一）_个体模式（一）_量词

380

161

15分45秒

161_第十二章_Flink CEP（三）_模式API（一）_个体模式（二）_条件

420

162

16分31秒

162_第十二章_Flink CEP（三）_模式API（二）_组合模式

300

163

5分31秒

163_第十二章_Flink CEP（三）_模式API（三）_模式组

400

164

12分38秒

164_第十二章_Flink CEP（三）_模式API（四）_匹配后跳过策略

390

165

14分14秒

165_第十二章_Flink CEP（四）_模式的检测处理（一）_处理匹配事件

350

166

18分42秒

166_第十二章_Flink CEP（四）_模式的检测处理（二）_处理超时事件（一）_需求分析和准备工作

370

167

16分39秒

167_第十二章_Flink CEP（四）_模式的检测处理（二）_处理超时事件（二）_代码实现和测试

350

168

7分26秒

168_第十二章_Flink CEP（四）_模式的检测处理（三）_处理迟到数据

440

169

9分20秒

169_第十二章_Flink CEP（五）_CEP状态机实现（一）_思路分析和程序框架

390

170

16分32秒

170_第十二章_Flink CEP（五）_CEP状态机实现（二）_定义状态机

330

171

7分53秒

171_第十二章_Flink CEP（五）_CEP状态机实现（三）_实现处理逻辑及测试

380

046_第五章_DataStream API（基础篇）（四）_Transform（七）_归约聚合

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐