文章/答案/技术大牛

发布

首页视频088_第七章_处理函数（五）_Top N（二）_使用KeyedProcessFunction

088_第七章_处理函数（五）_Top N（二）_使用KeyedProcessFunction

2022-12-022022-12-02 16:02:17播放29

点赞0 收藏 0

2.尚硅谷大数据学科--核心框架/尚硅谷大数据技术之2022版Flink1.13（Java版）/视频/088_第七章_处理函数（五）_Top N（二）_使用KeyedProcessFunction .mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
可以看到前面我们用的这种方法是直接基于当前所有的数据去开窗，然后把所有的数据放在一个窗口里边，用一个哈希map来对它进行分组统计啊，所以这就相当于本来我们应该是在外边K就可以把这个数据分组分开了，而我们呢，诶没有把它分开，我们是手动用了一个哈希map去分别保存，其实大家知道底层的原理肯定都一样，所以这里边其实我们就是把它做了一个手动实现。用了一个哈希map做中间状态，保存所有数据的统计值，等到到了这个结束时间的时候，我们把它拿出来转换成一个a release，然后去排序，当然了这一步操作我们是直接在get result这一步做了也可以，我们get result就把这个哈map返回，那返回来之后呢，在全窗口函数这里再去把它做这个转换也是一样的，因为这两步操作它就是前后脚嘛啊，我们就是说这里调了这个get result，拿到结果之后，就把它作为输入传递给后边的全窗口函数作为后边的输入，所以你在那边做也可以，在这里前面做这一步也可以啊，这个就大家去选择这个时机啊，其实没什么区别啊，那这里我们前面的增量聚合呢，主要就是。
01:18
往哈希map里边叠加写数计算的那个过程省略掉了逻辑好理解是实现起来之后，它的这个效率其实你实际在项目当中运行会很低，为什么呢？因为你这样写的话，所有数据在同一个窗口里面window or大家想这个数据量大的时候，WINDOW2在同一个窗口里边处处理不能分区，哎不能分区的话，那它的并行度就是一。那我们这个并行架构，这还有什么用呢？我们本来最重要的就是要开窗去处理你所有的处理操作啊，最重要的处理操作前面还可以并行，后面全是并行度是一啊，那我们这个就整体处理的效率就太低了，那怎么解决这个问题呢？
02:01
哎，自然我们就想到了解决这个问题的方法，那就是你还是把它拆开，不要用哈希map了，哈希map你这是自己把所有数据收集起来，自己再去分分K嘛，那我们直接就有KBY，然后还能分区，还能并行，何乐而不为呢？诶，所以我们就想到了最好的方式还是按照URL，我我们要统计的是URL的话，那就按照URL先做一个分区，先做一个KBY。然后呢，先开窗，按照每个URL的这个数据先把它统计出来，所以这个过程就跟我们之前讲到的URL view这个example写的实现的是完全一样啊，所以我们先把这个放在这儿。那接下来的问题就来了，第二步，如果说我们想要对于窗口统计出来的再去进行收集和排序，又该怎么做呢？我们在处理的过程当中，一定要树立一个观点，就是我们整个处理的都是数据流。
03:01
数据流在任务之间流动，数据在任务间流动，铁打的营盘，流水的兵，所以你看之前我们这个数据测试的时候，其实就是诶，来了一个数据，来了一个数据，这是流逝的数据，对吧，不停的来，不停的来，来到这儿，这是一个窗口计算。窗口计算的话，哎，那它是会在这儿先截住拦住就是，哎，有一些数据来了这儿之后，我还不到窗口触发时间，那我在里边可以增量聚合，也可以不做聚合，就直接保存着，等到窗口触发时间到的时候，我再把里边的那个计算结果输出一个。而对于K败之后再做窗口操作的话，那不同K的结果会怎么样呢？那其实大家也发现了，不同K的结果是不是会在窗口结束的那一瞬间同时输出啊，啊，我们感觉是同时输出，其实对于弗林克而言，你还是留啊，我们现在并行度是一，即使是那个并行度不是一，是有多个并行子任务，你也得有一个分发的过程啊，你也是轮旋分发，或者是其他的一些转换，所以它还是依次处理的，流的特点就是这样，它是依次处理的，所以对于我们当前的输出结果而言，它是。
04:13
到了一个窗口，出发时间。按照K输出好几个统计结果，然后呢，过一段时间之后，诶，可能又到了另外一个窗口的出发时间，连续的输出好几个统计结果，所以是这样的。那从下游的任务看来，就假如说我们现在要基于这个URL counter stream啊，基于这个东西再去做一个处理的话，那我们在这里看到的数据就变成什么了呢？就都是一个一个的URL view count，当前其实就是一个一个数据轮流来，这个数据都叫做URL view count，然后它这个数据呢，它的来的特点是有点儿像这个一会儿来一堆，前面一个窗口结束了，那这里边我们就会收集到一堆当前窗口的统计信息。然后呢，隔一段时间可能没数据来，然后再到一个窗口结束的时候又来一堆，所以这里你要处理的也是一个流，只不过这个流里边的数据有点特点而已。
05:10
那我们现在的问题就是你怎么把这个流里边的数据。按照不同的窗口进行收集和排序呢？那我就按照之前的节奏，不是滑动窗口五秒钟出一次结果吗？那我后边就开这个五秒钟窗口，每五秒收集一次数据，然后统计输出就完了啊，那自然我们就想到了这个就涉及到一个你总是五秒钟收集一次的话，那是不是有可能啊，这个收集齐了数据之后，你得等五秒才能输出结果啊，啊，这个不是我们想要的东西，我们其实知道它的间隔大概是五秒，但不是绝对意义上的五秒，我只能是知道就是当前输出的这个数据啊，它是确实是到了那个结束时间，两个结束时间的那个触发点是五秒。但是当前的这个，真正你拿到当前数据的时候的那个water mark到底是不是叉五，这个就不好说了，所以我们的做法是。
06:08
我不需要开五秒的窗口，一直等他。我只需要等一会儿就可以了，哎，所以这是我们真正关键的这个思路啊，就是你的数据不是来了吗？我等一会儿把这个当前的一个窗口输出的这个数据收集齐就完事了。之前我们不还说了吗，你现在是五秒钟，所以中间还隔了一段时间，这个隔的比较明显，那假如说。我们是两秒钟，一秒钟就输出一次呢。那如果说前后两次窗口之间的这个数据甚至有可能会受到乱序数据的影响呢？这个时候又该怎么办呢？啊，那我们自然就想到了URL count里边不是有那个窗口对应的信息吗？那我是可以判断你当前这个数据到底属于哪个窗口的呀，所以我后边干脆就在。按照窗口去做一个分组。
07:02
按照窗口当前的那个不是有Windows start和window and吗？我随便找一个对吧，按照window and做一个分组，分组之后就是当前同一个窗口收集到的所有统计数据，然后呢，哎，我基于这个收集到的所有统计数据。定一个定时器，稍微的等一会儿，他就全到齐了，全到齐了之后，那是不是我直接就把所有的数据做一个排序输出前两名就完了啊，这就是我们基本的一个想法啊，那这里就又涉及到另外一个问题，就是说。既然是要稍微等一会儿，那就需要设一个定时器，其实原理跟窗口是一样的，窗口是按照窗口结束时间设的定时器嘛，那我们现在呢，当前它的window and不是本身我们之前窗口结束触发它输出的那个时间点吗？我们就在这个window and的基础上。再多等一点点，多等一毫秒就够了啊，为什么呢？因为我们都是water mark出发嘛，这个跟乱序数据没关，只要是water mark超过了window and加一毫秒的数据的话，诶，那我们现在就可以保证所有的数据都到齐了，这是第一个考量点，第二个考量点是那当前在这个后面做处理的时候。
08:18
我的这个数据又怎么收集起来呢？你又不用窗口了，窗口的话，我们说全窗口函数就直接把它收集在里边了嘛，有一个table类型，那现在你既然没有了，那怎么办呢。我们应该对后边的这个算子，这里的这个算子单独定义一个一个列表，把所有的数据保存进来，那你定义这个列表，大家知道后边我们这个做计算的时候，它本身这个任务应该是运行在本地的，我们刚才不是针对那个window做了一个分组吗？你如果要是就是在本地创建一个a list的话，Java是不会看你当前这一个key是什么的，只要是一个并行任务，我执行在本地，那所有的数据是不是都会看到这个list呀？
09:05
那他就不分K了。哎，那这怎么办呢？啊，这就要给大家提到一个我们后边接触到的概念，我们要创建。状态。而且这个状态呢。可以只跟当前的key有关系，所以这个状态叫key state。也就是跟键有关的按键分组的状态。我们自定义了这样一个状态，当然是一个列表状态了啊，就是有一个列表来一个数据就把它塞进去，来一个数据就把它塞进去，而且呢，创建一个按照窗口结束时间加一毫秒之后触发的定时器，等到触发定时器的时候，确保所有数据都到齐了，我们就从这个状态列表里边把它提取出来，然后做一个排序输出，这就是我们完整的流程。啊，所以大家会看到就是这个过程还是稍微有一点麻烦的啊，又用到了后边我们还没有讲到的，没有详细讲到的状态的用法啊，所以这个就当是先做一个预热吧，就用一个比较复杂的例子，把所有东西都串起来。
10:13
那既然有了基本的思路，那接下来我们看一看到底应该怎么处理啊，那既然是既要用到定时器，又要有状态自定义状态，那什么样的操作符合这个需求呢？当然就是大招，当然就是process function式啊，就是对于这个自定义状态，之前我们说一般的这个reach function也是可以搞定的，但是对于这个定时器而言，那就只有process function，而且是必须得是key的process function式啊，所以接下来我们就要做一个分组，然后自定义一个key的process function。Ul countt stream，然后一个KBY，当前我们K的是。是当前的window信息啊，我们基于这个window and啊，因为这个比较重要，后面我们还要基于它去定义定时器吗？啊就把这个就列举出来就可以了啊，然后接下来就是直接一个process了。
11:09
一边要去拗一个我们自己啊，Key的process function啊，这个我就直接叫做。Top nes result，但是这里边我们既然说top n，那大家会发现其实可以有一个参数，就是这个N应该是可选的，那比方说我这里边传一个二，那就表示N取这个TOP2，我们把它这个print啊放在这里，那接下来我们关键就是实现这个东西了。直线自定义的。Process。啊，这个实现的过程呢，其实也并不复杂，At class。我们先把这个copy一下啊。现在既然是key的process function嘛，那我们需要继承key process function。
12:02
它的泛型KIO，当前的K，当前的K是window and，你得根据当前的来啊，当前是window and，所以这是长着，然后后边是这个输入，输入当然是UR count了。好的，这个po类，然后最后输出还是string，我们还是刚才那样啊，实话的把它这个在控制台打印输出，就像一个监控屏一样，对不对啊，监控大屏不停的看这个，呃，每五秒钟，每五秒钟输出一次啊啊，然后接下来既然你这里边有一个这个二嘛，那我们应该得有一个属性啊，所以这里边我们定义一个属性。N把它定义成private对吧，直接把它定义成N。然后接下来，那这个就需要有对应的构造方法了。我们把这个这个N给一个构造方法，这样的话上面就不报错了。接下来我们知道。必须实现一个process element方法，然后这个process element方法里边呢，其实是每来一个数据，我是要先把它扔到一个list列表里面去，哎，那所以这里面是涉及到了一个所谓的状态，这样一个list列表我们是作为一个状态来保存起来的，这里涉及到状态的应用，这个状态怎么用呢？啊，我们先在外面做一个定义。
13:23
定义。列表状态。这个所谓的列表状态还是private定义出来啊，定义一个list state。这个东西就叫做list state，你既然它是个list嘛，那我总得知道这个列表里边具体的元素是什么类型啊，啊，所以有泛型，我们当前就是把每一个元素保存进来啊，那也就不用客气了，直接URL count就可以了，好，所以接下来我们自己定义一个啊，叫做UR count list state，那是不是定义了之后这里就能直接用了呢？诶，大家看到这里边我们没有直接把它拗出来是吧？诶那这个如果要是创建的话，是不是应该就是直接new一个Lisa state就完了呢。
14:05
注意不是啊，你有一个，那我们new的是一个本地的Java对象啊，所以这里边你定义出来之后也是一个Java对象，现在你得用flink把它管理起来，因为我们不光是本地的一个操作啊，本地内存里边的一个东西，你还要让它根据不同的K能够保存不同的列表啊，保存不同的状态啊，这是弗link可以直接帮我们搞定的。但是你如果要是想让flink帮我们把它管理起来的话，就必须哎，环境中就是运行时环境中。获取状态的控制距离。啊，那所以这里边创建状态时得怎么创建呢？大家记得process function，它本身也是负函数嘛，那么在这个负函数里边。有一个方法叫at runtime context，可以获取当前的这个运行上下文，然后就可以获取里边的状态了，诶所以根据那个方法之前大家看到的啊，运营上下文里边获取状态的方法，就可以让flink管理起来，然后我们从环境里边获取这个状态就可以了，但是你直接在这儿让它等于然后去去get啊，看你这么去get，我们现在get一个list state可以这么去写。
15:20
这个不对，为什么呢？现在的这一个类啊，Static这个类大家知道你在这儿声明的时候，定义的时候。当前还没有runtime context对不对，那你这样去去解析这个代码的时候，它解析不出来啊，哪有这个运行时呢？没有，那怎么办呢？你必须得等当前任务跑起来之后，整个这个任务启动才能有运行时。那任务怎么办呢？难道我得到process element里面去取吗？不需要，我们有生命周期方法，我们只要取一次就对了，不需要每次都去取吗？所以里边我们在open生命周期里边获取状态啊，所以是这样去做的这个操作啊。
16:00
Ul you can'list sit，这我们可以去at run time contact，然后get list sit这边大家看要传的啊，是一个。List state script，那这个稍微有点奇怪，只要大概知道它是什么东西，它是个描述器，所以这是固定的用法啊，它的语法就是这样的，然后里边呢，要传一个当前的名字name啊，那比方说我就叫URL count list。然后后边还需要给一个类型，因为弗link得知道啊，你得告诉flink这类型是什么，名字是什么，才能找到对应的状态嘛，那这里边的话，当然类型就用types定义了，我们现在这个types是个URL will count，所以这是个types，欧洲里边把URL view count class在这，我们就把这个状态声明出来了。哎，那反而后边的这个做法就非常的简单了，后边我们要做的就是来了数据之后。将铸具保存到状态中。
17:05
那这里面我们要做的就是URL，大家看这个状态，它有一个at方法啊，那当然就是可以就像我们那个list的操作一样，把它at进来完事了吗？哎，另外还有一步操作，诶，注册一个定时器，注册window and结束时间。加一毫秒的定时地啊，那这个注册也非常简单，调用时间服务，定时服务register time，然后这里边我们要的是结束时间，结束时间从哪去取呢？UR count里边不是有吗？啊，这个也可以啊，或者我们知道上下文里边也有，因为我们KBY之后KBY就用的是这个window and嘛，诶，所以这个其实从K里边直接可以拿得到啊。Ctx减二的K当前的这个值加一，这就是加上一毫米。但这个没完，我们的核心其实是等到复发值器的时候才会有用开r on开R这个方法里边才是我们真正要去做计算的这个过程啊，那这个过程的话，其实大家也知道了，肯定就是要创建一个飞的类似的这个过程，对吧，这个我就详细去写了啊，我们直接从这边汇过来就可以了，类似的这个做法，我们可以直接创建一个a list。
18:23
当然了，这里面我们不需要是元组类型啊，不需要是temp，我们还是定义这个UI view count就可以了。后面我们提取的时候也是直接用这个字段就可以嘛，所以这个比较简单啊啊，那这里边比方说我们定义这个不要叫result了，我们把这个叫做URL啊release吧，就叫。那后面这也没有他map里边操作那么麻烦，里边关键是要把这一个状态里边的东西拿出来，然后转成这个a list啊，那所以这里边啊，最简单的方式看这个状态本身这个URL welcome list state啊，本身这个list state是一个me state边有一个able，是有这样的一个迭代的类型的，只不过你要找到这个able稍微麻烦一点啊，你看它这这里边就是只是提供了这些接口方法啊，这个我们讲到状态的时候可以再说，这里只要知道怎么用就行了，我就直接做一个便利。
19:19
这里面的每一个URL count。是可以直接。案例有一个点的方法，得到的就是这个out，这个out是什么呢？前面大家其实看到过。那就是这个类型对吧，大家看me state这里边有一个out类型啊，所以它的out是一个interable类型，我们这里的这个方法可以直接把对应的这一个able出来啊，那既然你get的出来了，可以便利，那我们就把对应的这个list里边依次添加进去，URL will count。诶，那后边这里就可以做sort了，URL list做一个sort，那这里边不对，对吧，我们还是重新来new一个啊又一个competor。
20:08
里边还后减前，那应该是O2点对吧，应该是这个value减去Oe.on.inter value h去啊，那后边这个构建前两名，这个过程就完全类似，直接凹这个之前的。这里的这个处理过程大家看，这不是已经有对应的那个结果了吗？我们接下来就直接stream builder，好，这接下来我们就是。包装信息啊，应输出后面这里是排序，前面是从那个状态里边提取数据。提取到这个release的主要就是为了排序嘛啊，你直接那个状态，他没有给我们提供这个排序的接口啊，所以这个是没办法做的，这边只要稍微的更改一下就可以，比方说这里边我们的这个。
21:00
这个叫ctx。也就不是window了啊，Ctx里边本来就没有window，我们当前的这个时间戳窗口结束时间应该是Ctx.current啊，这样的话就可以直接拿到，然后接下来。取前两个的话，我们拿到的是这个啊，URL这个list，那这里面类型就不对了，我们要的是。肉类URL count，后边这里也是直接去提取URL以及count就完事了。我们把这个就要搞定了，然后运行一下看看效果。当前五秒钟一个窗口，前面我们还把这个数据打印出来了，数据比较少，所以它都是一嘛，然后现在数据多了，大家看3242啊，跟之前的那个状态是一样的，五秒钟一个窗口，五秒钟一个窗口，把当前的访问量最大的啊，这是URL了啊URL，然后打印输出。这就是我们呃用这种方法的一个测试，它的好处在于我们前面都是按照K去做了分组，做的是并行计算。
22:08
所以这就是靠N优化之后的效果。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之2022版Flink1.13（Java版）

（88/171）

6分39秒

001_Flink课程简介

510

12分54秒

002_第一章_Flink简介（一）_Flink起源和设计理念

350

12分25秒

003_第一章_Flink简介（二）_Flink在企业的应用

400

8分41秒

004_第一章_Flink简介（三）_Flink的优势

440

18分2秒

005_第一章_Flink简介（四）_数据处理框架的演变

460

4分55秒

006_第一章_Flink简介（五）_流处理的应用场景

290

6分57秒

007_第一章_Flink简介（六）_Flink的分层API

350

10分5秒

008_第一章_Flink简介（七）_Flink和Spark的区别

350

11分58秒

009_第二章_Flink快速上手（一）_环境准备和创建项目

410

15分19秒

010_第二章_Flink快速上手（二）_批处理_Word Count（一）

420

8分31秒

011_第二章_Flink快速上手（二）_批处理_Word Count（二）

430

13分47秒

012_第二章_Flink快速上手（三）_流处理（一）_有界流处理Word Count（一）

400

6分42秒

013_第二章_Flink快速上手（三）_流处理（一）_有界流处理Word Count（二）

360

11分47秒

014_第二章_Flink快速上手（三）_流处理（二）无界流处理Word Count

410

18分16秒

015_第三章_Flink部署（一）_快速启动一个集群（一）_环境配置和基本介绍

360

8分41秒

016_第三章_Flink部署（一）_快速启动一个集群（二）_集群启动

440

12分31秒

017_第三章_Flink部署（一）_快速启动一个集群（三）_提交作业（一）_Web UI提交

360

11分3秒

018_第三章_Flink部署（一）_快速启动一个集群（三）_提交作业（二）_命令行提交

330

10分59秒

019_第三章_Flink部署（二）_部署模式

320

3分49秒

020_第三章_Flink部署（三）_独立模式的部署

380

18分50秒

021_第三章_Flink部署（四）_Yarn模式的部署

400

13分39秒

022_第四章_Flink运行时架构（一）_Flink系统架构

390

12分12秒

023_第四章_Flink运行时架构（二）_作业提交流程

370

10分46秒

024_第四章_Flink运行时架构（三）_一些重要概念（一）_数据流图

450

12分15秒

025_第四章_Flink运行时架构（三）_一些重要概念（二）_并行度

400

14分53秒

026_第四章_Flink运行时架构（三）_一些重要概念（三）_算子链

390

6分13秒

027_第四章_Flink运行时架构（三）_一些重要概念（四）_执行图

390

17分36秒

028_第四章_Flink运行时架构（三）_一些重要概念（五）_Task Slots

450

6分23秒

029_第四章_Flink运行时架构（四）_Flink的任务调度

380

5分40秒

030_第五章_DataStream API（基础篇）（一）_整体介绍

370

16分12秒

031_第五章_DataStream API（基础篇）（二）_执行环境

400

5分18秒

032_第五章_DataStream API（基础篇）（三）_源算子（一）_整体介绍

400

5分17秒

033_第五章_DataStream API（基础篇）（三）_源算子（二）_准备工作

460

17分14秒

034_第五章_DataStream API（基础篇）（三）_源算子（三）_读取有界流

370

4分4秒

035_第五章_DataStream API（基础篇）（三）_源算子（四）_读取Socket文本流

350

11分50秒

036_第五章_DataStream API（基础篇）（三）_源算子（五）_读取Kafka

400

14分50秒

037_第五章_DataStream API（基础篇）（三）_源算子（六）_自定义Source

470

6分32秒

038_第五章_DataStream API（基础篇）（三）_源算子（七）_自定义并行Source

380

10分21秒

039_第五章_DataStream API（基础篇）（三）_源算子（八）_Flink支持的数据类型（一）

400

12分59秒

040_第五章_DataStream API（基础篇）（三）_源算子（八）_Flink支持的数据类型（二）

360

13分14秒

041_第五章_DataStream API（基础篇）（四）_Transform（一）_Map

460

10分46秒

042_第五章_DataStream API（基础篇）（四）_Transform（二）_Filter

410

13分37秒

043_第五章_DataStream API（基础篇）（四）_Transform（三）_FlatMap

350

12分14秒

044_第五章_DataStream API（基础篇）（四）_Transform（五）_KeyBy

430

13分17秒

045_第五章_DataStream API（基础篇）（四）_Transform（六）_简单聚合

390

20分24秒

046_第五章_DataStream API（基础篇）（四）_Transform（七）_归约聚合

370

9分24秒

047_第五章_DataStream API（基础篇）（四）_Transform（八）_UDF（一）_函数类和匿名函数

420

14分40秒

048_第五章_DataStream API（基础篇）（四）_Transform（八）_UDF（二）_富函数类

470

18分2秒

049_第五章_DataStream API（基础篇）（四）_Transform（九）_物理分区（一）_随机和轮询分区

400

14分19秒

050_第五章_DataStream API（基础篇）（四）_Transform（十）_物理分区（二）_Rescale

320

8分37秒

051_第五章_DataStream API（基础篇）（四）_Transform（十）_物理分区（三）_广播、全局及自定义分区

350

11分48秒

052_第五章_DataStream API（基础篇）（五）_Sink（一）_连接到外部系统

430

15分23秒

053_第五章_DataStream API（基础篇）（五）_Sink（二）_输出到文件

320

13分0秒

054_第五章_DataStream API（基础篇）（五）_Sink（三）_输出到Kafka

440

13分56秒

055_第五章_DataStream API（基础篇）（五）_Sink（四）_输出到Redis

240

13分13秒

056_第五章_DataStream API（基础篇）（五）_Sink（五）_输出到Elasticsearch

390

14分28秒

057_第五章_DataStream API（基础篇）（五）_Sink（六）_输出到MySQL

400

5分4秒

058_第五章_DataStream API（基础篇）（五）_Sink（七）_自定义Sink输出

350

13分30秒

059_第六章_Flink中的时间和窗口（一）_时间语义

410

10分20秒

060_第六章_Flink中的时间和窗口（二）_水位线（一）_水位线的概念

410

17分17秒

061_第六章_Flink中的时间和窗口（二）_水位线（二）_水位线的原理和特性

370

14分25秒

062_第六章_Flink中的时间和窗口（二）_水位线（三）_水位线在代码中的生成（一）

370

8分48秒

063_第六章_Flink中的时间和窗口（二）_水位线（三）_水位线在代码中的生成（二）

390

11分3秒

064_第六章_Flink中的时间和窗口（二）_水位线（四）_自定义水位线的生成

470

6分58秒

065_第六章_Flink中的时间和窗口（二）_水位线（五）_水位线的传递

440

9分52秒

066_第六章_Flink中的时间和窗口（三）_窗口（一）_窗口的基本概念

350

20分50秒

067_第六章_Flink中的时间和窗口（三）_窗口（二）_窗口的分类

370

4分10秒

068_第六章_Flink中的时间和窗口（三）_窗口（三）_窗口API概览

340

12分27秒

069_第六章_Flink中的时间和窗口（三）_窗口（四）_窗口分配器

370

5分30秒

070_第六章_Flink中的时间和窗口（三）_窗口（五）_窗口函数整体介绍

440

5分33秒

071_第六章_Flink中的时间和窗口（三）_窗口（六）_窗口函数分类

430

9分7秒

072_第六章_Flink中的时间和窗口（三）_窗口（七）_增量聚合函数（一）_ReduceFunction

420

13分20秒

073_第六章_Flink中的时间和窗口（三）_窗口（七）_增量聚合函数（二）_AggregateFunction

420

19分42秒

074_第六章_Flink中的时间和窗口（三）_窗口（七）_增量聚合函数（三）_应用实例

410

18分31秒

075_第六章_Flink中的时间和窗口（三）_窗口（八）_全窗口函数

450

10分55秒

076_第六章_Flink中的时间和窗口（三）_窗口（九）_两种窗口函数结合

410

11分43秒

077_第六章_Flink中的时间和窗口（三）_窗口（十）_窗口函数综合应用实例

400

19分44秒

078_第六章_Flink中的时间和窗口（三）_窗口（十一）_窗口其它API

380

11分32秒

079_第六章_Flink中的时间和窗口（四）_处理迟到数据（一）_代码实现

430

12分42秒

080_第六章_Flink中的时间和窗口（四）_处理迟到数据（二）_测试

370

17分1秒

081_第七章_处理函数（一）_处理函数的概念和分类

460

14分16秒

082_第七章_处理函数（二）_ProcessFunction

420

12分2秒

083_第七章_处理函数（三）_KeyedProcessFunction（一）_处理时间定时器

460

11分32秒

084_第七章_处理函数（三）_KeyedProcessFunction（二）_事件时间定时器

340

5分23秒

085_第七章_处理函数（四）_ProcessWindowFunction

330

15分49秒

086_第七章_处理函数（五）_Top N（一）_使用ProcessAllWindowFunction（一）_基本思路

350

14分44秒

087_第七章_处理函数（五）_Top N（一）_使用ProcessAllWindowFunction（二）_代码实现和测试

370

22分11秒

088_第七章_处理函数（五）_Top N（二）_使用KeyedProcessFunction

290

16分2秒

089_第八章_多流转换（一）_分流

450

13分50秒

090_第八章_多流转换（二）_合流（一）_ 联合（Union）

380

12分56秒

091_第八章_多流转换（二）_合流（二）_ 连接（Connect）

330

23分18秒

092_第八章_多流转换（二）_合流（三）_ 应用实例（一）_程序架构和实现思路

380

15分1秒

093_第八章_多流转换（二）_合流（三）_ 应用实例（二）_具体代码实现

320

6分14秒

094_第八章_多流转换（二）_合流（四）_ 广播连接流

440

21分14秒

095_第八章_多流转换（三）_双流Join（一）_ 窗口联结

380

20分8秒

096_第八章_多流转换（三）_双流Join（二）_ 间隔联结

470

15分17秒

097_第八章_多流转换（三）_双流Join（三）_ 窗口同组联结

400

13分50秒

098_第九章_状态编程（一）_Flink中的状态（一）_ 状态的定义

420

12分59秒

099_第九章_状态编程（一）_Flink中的状态（二）_ 状态的管理

430

100

16分6秒

100_第九章_状态编程（一）_Flink中的状态（三）_ 状态的分类

410

101

19分38秒

101_第九章_状态编程（二）_按键分区状态（一）_ 基本概念和类型

410

102

13分56秒

102_第九章_状态编程（二）_按键分区状态（二）_ 代码中的使用（一）_基本方式和值状态

280

103

17分16秒

103_第九章_状态编程（二）_按键分区状态（二）_ 代码中的使用（二）_其它状态

440

104

24分34秒

104_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（一）_值状态

390

105

19分29秒

105_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（二）_列表状态

370

106

22分14秒

106_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（三）_映射状态

420

107

20分8秒

107_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（四）_聚合状态

340

108

17分18秒

108_第九章_状态编程（二）_按键分区状态（四）_ 状态生存时间

340

109

14分27秒

109_第九章_状态编程（三）_算子状态（一）_ 基本概念和类型

400

110

12分5秒

110_第九章_状态编程（三）_算子状态（二）_应用实例（一）_基本思路和框架

370

111

16分31秒

111_第九章_状态编程（三）_算子状态（二）_应用实例（二）_具体实现和测试

340

112

8分54秒

112_第九章_状态编程（四）_广播状态（一）_基本概念和用法

410

113

22分48秒

113_第九章_状态编程（四）_广播状态（二）_应用实例

380

114

9分52秒

114_第九章_状态编程（五）_状态持久化（一）_检查点

450

115

21分15秒

115_第九章_状态编程（五）_状态持久化（二）_状态后端

420

116

11分54秒

116_第十章_容错机制（一）_检查点（一）_检查点的保存原理（一）_周期性的保存

340

117

15分2秒

117_第十章_容错机制（一）_检查点（一）_检查点的保存原理（二）_保存的时间点

340

118

6分40秒

118_第十章_容错机制（一）_检查点（二）_从检查点恢复状态

320

119

15分0秒

119_第十章_容错机制（一）_检查点（三）_检查点算法（一）_分界线

390

120

22分22秒

120_第十章_容错机制（一）_检查点（三）_检查点算法（二）_分布式快照算法

360

121

19分19秒

121_第十章_容错机制（一）_检查点（四）_检查点配置

310

122

13分12秒

122_第十章_容错机制（一）_检查点（五）_保存点

300

123

10分50秒

123_第十章_容错机制（二）_状态一致性（一）_一致性的概念和级别

430

124

15分16秒

124_第十章_容错机制（二）_状态一致性（二）_端到端状态一致性（一）

290

125

15分54秒

125_第十章_容错机制（二）_状态一致性（二）_端到端状态一致性（二）

380

126

18分22秒

126_第十章_容错机制（二）_状态一致性（三）_端到端精确一次

310

127

13分26秒

127_第十一章_Table API和SQL（一）_整体介绍

350

128

19分18秒

128_第十一章_Table API和SQL（二）_快速上手

360

129

12分48秒

129_第十一章_Table API和SQL（三）_基本API（一）_程序架构

370

130

13分40秒

130_第十一章_Table API和SQL（三）_基本API（二）_表环境

410

131

16分31秒

131_第十一章_Table API和SQL（三）_基本API（三）_创建表

340

132

20分33秒

132_第十一章_Table API和SQL（三）_基本API（四）_表的查询和输出（一）

410

133

15分0秒

133_第十一章_Table API和SQL（三）_基本API（四）_表的查询和输出（二）

400

134

12分24秒

134_第十一章_Table API和SQL（三）_基本API（五）_表和流的转换（一）_表转换成流

350

135

13分25秒

135_第十一章_Table API和SQL（三）_基本API（五）_表和流的转换（二）_流转换成表

390

136

16分21秒

136_第十一章_Table API和SQL（四）_流处理中的表（一）_动态表和持续查询

440

137

25分10秒

137_第十一章_Table API和SQL（四）_流处理中的表（二）_流转换成动态表做动态查询

420

138

15分2秒

138_第十一章_Table API和SQL（四）_流处理中的表（三）_动态表编码成数据流

380

139

16分23秒

139_第十一章_Table API和SQL（五）_时间属性和窗口（一）_时间属性（一）_在DDL中定义

390

140

11分55秒

140_第十一章_Table API和SQL（五）_时间属性和窗口（一）_时间属性（二）_流转换成表时定义

360

141

22分46秒

141_第十一章_Table API和SQL（五）_时间属性和窗口（二）_窗口

320

142

21分5秒

142_第十一章_Table API和SQL（六）_聚合查询（一）_分组聚合

420

143

16分1秒

143_第十一章_Table API和SQL（六）_聚合查询（二）_窗口聚合

400

144

15分22秒

144_第十一章_Table API和SQL（六）_聚合查询（三）_开窗聚合

410

145

28分4秒

145_第十一章_Table API和SQL（六）_聚合查询（四）_TopN（一）_普通TopN

370

146

15分27秒

146_第十一章_Table API和SQL（六）_聚合查询（四）_TopN（二）_窗口TopN

450

147

14分58秒

147_第十一章_Table API和SQL（七）_联结查询

420

148

22分9秒

148_第十一章_Table API和SQL（八）_函数（一）_系统函数

390

149

9分46秒

149_第十一章_Table API和SQL（八）_函数（二）_UDF（一）_整体介绍和分类

410

150

9分6秒

150_第十一章_Table API和SQL（八）_函数（二）_UDF（二）_标量函数

410

151

16分40秒

151_第十一章_Table API和SQL（八）_函数（二）_UDF（三）_表函数

370

152

18分24秒

152_第十一章_Table API和SQL（八）_函数（二）_UDF（四）_聚合函数

350

153

25分19秒

153_第十一章_Table API和SQL（八）_函数（二）_UDF（五）_表聚合函数

300

154

9分2秒

154_第十一章_Table API和SQL（九）_SQL客户端

360

155

14分49秒

155_第十一章_Table API和SQL（十）_连接到外部系统（一）_常见的外部存储

370

156

14分11秒

156_第十一章_Table API和SQL（十）_连接到外部系统（二）_Hive

380

157

17分24秒

157_第十二章_Flink CEP（一）_基本概念和应用

380

158

17分40秒

158_第十二章_Flink CEP（二）_快速上手（一）_需求分析和定义模式

350

159

14分1秒

159_第十二章_Flink CEP（二）_快速上手（二）_检测处理代码实现和测试

370

160

13分58秒

160_第十二章_Flink CEP（三）_模式API（一）_个体模式（一）_量词

380

161

15分45秒

161_第十二章_Flink CEP（三）_模式API（一）_个体模式（二）_条件

420

162

16分31秒

162_第十二章_Flink CEP（三）_模式API（二）_组合模式

300

163

5分31秒

163_第十二章_Flink CEP（三）_模式API（三）_模式组

400

164

12分38秒

164_第十二章_Flink CEP（三）_模式API（四）_匹配后跳过策略

390

165

14分14秒

165_第十二章_Flink CEP（四）_模式的检测处理（一）_处理匹配事件

350

166

18分42秒

166_第十二章_Flink CEP（四）_模式的检测处理（二）_处理超时事件（一）_需求分析和准备工作

370

167

16分39秒

167_第十二章_Flink CEP（四）_模式的检测处理（二）_处理超时事件（二）_代码实现和测试

350

168

7分26秒

168_第十二章_Flink CEP（四）_模式的检测处理（三）_处理迟到数据

440

169

9分20秒

169_第十二章_Flink CEP（五）_CEP状态机实现（一）_思路分析和程序框架

390

170

16分32秒

170_第十二章_Flink CEP（五）_CEP状态机实现（二）_定义状态机

330

171

7分53秒

171_第十二章_Flink CEP（五）_CEP状态机实现（三）_实现处理逻辑及测试

380

088_第七章_处理函数（五）_Top N（二）_使用KeyedProcessFunction

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐