文章/答案/技术大牛

发布

首页视频137_第十一章_Table API和SQL（四）_流处理中的表（二）_流转换成动态表做动态查询

137_第十一章_Table API和SQL（四）_流处理中的表（二）_流转换成动态表做动态查询

2022-12-022022-12-02 16:02:17播放42

点赞0 收藏 0

2.尚硅谷大数据学科--核心框架/尚硅谷大数据技术之2022版Flink1.13（Java版）/视频/137_第十一章_Table API和SQL（四）_流处理中的表（二）_流转换成动态表做动态查询.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
在上一节中我们介绍了动态表和持续查询的概念，那这个概念整体来看还是比较抽象的，所以这一节我们要结合一个具体的例子，详细的讲解一下动态表转换的过程，我们要从原理进行深刻的理解。那整体来看的话，如果是一张动态表和流要进行相互转换，自然就联系起来。之前我们曾经做过data stream和table之间的相互转换，在代码当中其实非常简单，一开始我们介绍的简单事例就是这样去做的，我们先去创建一个数据流data stream，然后只要调用一个from data stream方法就可以得到一个table。那最后如果说我们把查询转换处理出来的结果表想要再转换成流打印输出的话，那只要再调一个to data stream to stream方法或者是to change stream方法，就可以把它再转换成一个数据了。那我们现在说的其实跟这个有点类似，但是又不完全一样，因为我们知道这是在代码当中显示的，把一个data stream Java的数据对象，然后转换成了table这样一个对象，我们是有数据类型、数据结构上的转换的。
01:15
而事实上，在flink table apiq底层的处理过程当中，即使我们没有用到。没有一开始把这样一个stream定义出来。直接就是读取外部系统，直接创建了一个连接器表这样的形式，那它本质也是一个动态表。那自然我们就想到，如果现在是流处理的话，外部系统的数据来的时候，那还是应该一个接一个的来，连续不断的到来啊，那接下来我们这里创建出来的这张动态表，相当于是要把一个持续不断的数据流，首先要转换成一个动态表。所以这个过程在。Flink table API的底层是总要去做的，即使我们不做显示的到table的转换，我们也需要考虑。
02:08
是怎么样能够把动态的数据流变成一个动态表的？所以接下来我们主要就考虑这个过程，那为了更好地说明这个转换的过程，我们还是用之前所举的这个例子，也就是说直接读取。在网站上的点击访问行为，每一次点击都是我们这里边的一个日志事件，写在日志里边，数据的类型被包装成了一个叫做event的类型，里边有三个字段，用户名、用户访问的URL，还有访问的时间戳。那么。如果说我们当前直接读取数据源，把所有的数据解析出来，然后定义对应的每一个字段都是我们这里表里的一个列的话，那么接下来得到的这个table，或者我们在章节里边所介绍的是叫做table，这个没关系，那这就是一个完整的动态表了。那这个读取的过程到底是怎么样的呢？其实我们知道当前的数据流来了之后，如果我们把它叫做stream的话，每一条数据来了之后，放在这个这张动态表里，其实就是一行数据。
03:23
所以我们对于这个动态表的操作，那就是。在末尾不停的去添加数据。所以当前的操作。就是每来一条数据就执行对动态表的一次插入，那我们现在得到的其实就是一个只有插入操作的更新日志流，利用这样一个更新日志流就可以构建出对应的table这样一个动态表，随着点击事件的不断到来，那么当前的这个动态表也会不停的向下增长。
04:00
这就是我们能够想到的一开始。数据流到动态表的转换过程。具体来看的话，当然就是当第一条数据Alice点击的一次访问操作这条数据到来之后，那我们就在当前的表里插入第一条数据。然后接下来第二条数据又来了，这又是一个插入操作，哎，那我们想到如果前面加上了当前的kind的话。行的类型的话，每一个其实都是一个加I。所以接下来第二条数据爆破的访问数据我们就追加在后边。当前的表就。行数变成二啊，那后面也是每一条数据的到来，都会对应着表里边一行数据的增加，插入我们的表，就随着当前的数据越多，那么表整个的大小就会越大，这就是当前。数据流到动态表的具体的转换过程。我们会有另外一个问题，那就是说那这张表在不停的增大，我们在内存当中，如果要一直把它存下来的话。
05:06
之后岂不是不断增长会撑爆内存吗？随着时间的推移，一定是可以把内存全占满的。事实上并不是这样，因为我们现在处理的所谓的table，我们只是把它画出来，看起来这是一个拥有全部数据的这样一张表，实际上在真正的流处理里边，我们处理的是什么呢？就是它的更新日志流，也就是说我们通过对应的每一个加I，然后这样的一个更新插入操作，就可以表示出当前这个动态表的变化转换增长的过程，那这样的话，我们其实根本没有必要保存这张表里的所有数据，只要不停的处理当前它的每一条更新日志就可以了。包括后边的各种表的转换查询，我们其实都可以基于每一条更新日志来进行处理。
06:01
那接下来我们可以再继续去考察基于当前的动态表去做的查询，那就是第二步，我们接下来要去写一个CQ应用到当前的动态表上。所以我们知道这个过程，因为表是动态的，所以这个查询也不可能一次就查完就停止，所以这个过程是持续查询的过程，而且持续查询也会生成得到一个结果表啊，那也就是从一个动态表经过查询转换得到了另外一个动态表。我们还是看之前的例子，我们之前定义了一个Q，比如说select user和count URL c from，我们当前的这张表user。所以这个过程其实我们就是要统计，按照用户去进行分组，统计每一个用户他当前对于页面的点击访问次数。那在这个过程当中，我们就会发现经过转换之后得到了一个比如说叫做URL table这样的一个结果表，那这个结果表里面应该只有两个列，两个字段，一个是user，这是一个string类型啊。那如果在。
07:11
对应着我们在MYSQL里面定义的话，那就是还有一个是CT，这是统计出来的访问次数，在我们这里是长整型，那对应在CQ里面就应该是in，这是我们已经知道的定义出来的东西。所以接下来我们通过这个event table的一个持续查询，应该要得到这样的一张表，有两个两个列，两个字段的这样一个动态表。那我们看一下得到的内容应该是什么样的呢？想到当前的user，如果说之前没有出现过的话，诶，来了一个新的用户的点击，那显然是要在最后的结果表里边插入一条数据的，这个是没有问题，比方说这里来了一个A，然后点击一次。但是我们会想到，如果接下来。B也点击了一次，又来了一个A的点击访问事件的话，那很明显我们的这个查询转换就不是在后边追加一个A2。
08:10
而是要把之前A1这个一直接改成二，所以这个过程我们就会发现它是有所谓的更新操作，既包括简单的插入操作。加I也包括更新操作，那更新操作怎么来表达呢？对于我们当前的一个流而言，我们知道。转换过来之后，我们并不会去完整的存当前这张表，所以我们只是存它的更新日志，所以对于这张表的一个更新操作而言，它的更新日志就应该是一行数据，一条数据的更新就。应该用两条数据表示。一个是。减U减掉之前的A1。
09:00
原来的数据，然后另外还有一条加U表示。增加一条更新之后的新数据，所以相当于是把我们一次查询修改的这个操作，Update操作拆成了两步，一步删掉原来的值，第二步增加一条新插入的值啊，所以这样的话就相当于把之前的数据做了一个更改啊，那我们知道这样的一个表，如果要想转换成stream的话，那就不能直接to stream，直接把这个对应的数据，所有的这个更新日志打印了，而是要。To，因为当前还包括它的不能直接打印数据，还得把当前做的操作也完整的打印出来。这样我们也就可以更加深刻的理解之前在代码当中为什么经过聚合处理之后有更新操作了之后就不能直接to了，而必须要出。
10:03
我们可以再从图上更加详细的看一看当前这个持续查询以及生成的动态表，这个结果表到底是怎么样的一个变化过程。我们已经知道之前的table，也就是我们初始的输入表。它是一个不断增长的。一张动态表，哎，那所以这里边我们如果放在流里的话，每一次都来一条新插入的数据。然后呢，经过中间做了一个持续查询转换，这里边我们因为有count URL这样一个聚合函数group啊，做了一个分组聚合，所以我们最后是得到了一张有更新操作的动态表，那这个更新操作我们会发现，首先第一条数据，Alice的访问数据来了之后。经过当前的一个聚合统计。原原始一开始如果输入表没有任何数据的时候，当然最后的结果表也是空的，然后第一条数据来了之后呢，那首先这里多了一个ALICE1。
11:05
然后接下来第二行数据，Bob的一个点击数据来了之后，那现在改变变成的是。在后边追加了一条数据BO1啊，那这个只是做了一个单独单纯的插入操作，那不涉及到更改，这个比较简单，而后边如果再来一条爱的。访问数据的话，那么接下来我们就不是简单的在后面做追加了，而是要把之前爱丽丝一这条数据修改成爱ice丝二，诶，这就是我们说的当前的这个爱丽丝的数据进行了一个更新操作。然后再往后看，如果又来了一个carry的访问数据的话，这个可以继续追加到后边。在这个。整个处理的过程当中，有单纯的往后的追加，也有做了更新的这样的一个查询转换。
12:00
会发现最后得到的结果表，动态表里边到底有没有更新操作，看起来好像主要是跟这个CQ的形式有关，如果我们这里边使用了分组聚合这样一个操作的话。看起来我们最后就会有更新操作，然后如果进一步要再转换成流的话，可能就会有点麻烦，就是我们说的必须要把当前的看，你到底是减U加U，这个要表示清楚，要不然的话只把数据输出的话，那就说不清了。那我们自然就想到一个问题，如果对于这样的一个查询，我们可以把它叫做更新查询，那如果说我们当前没有对应的。分组聚合这个操作的话。对应着在之前的代码当中，那就是只是简单的前面做了一个提取s user URL from表，那这样一个转换相当于就没有做任何的更改，我们就知道它就可以只是来一个数据就输出一个，来一个数据输出一个，那之前的动态表它是不停的插入数据来一个一个的来，那经过这个CQ转换之后的动态表当然也是一个一个的来，直接插在后边就可以了。
13:17
那对于这样的查询操作，这样的持续查询，我们就可以把它叫做追加查询。所以呃，后面我们可以提出这样一个更新查询和追加查询的概念，就是只有插入操作，对于我们结果动态表的操作，只有插入没有更新，这样的持续查询就被称为追加查询。那我们就知道了，对于更新查询得到的结果，最后我们是必须要to changelo STEM才能把它转换成流。而对于追加查询的。持续查询而言，我们可以直接调用to stream，把它转换成流，因为当前就是一个一个数据来的，有点像我们之前讲到的data stream API里边简单的map filter flat map，类似这样的一些操作，那不涉及到分组聚合。
14:13
当然了，对于追加查询，我们也可以像更新查询一样，调用to change log stream，那它对应的changelo，那就全部都是加I，它的就都是追加嘛，都是插入。这样看的话，好像我们就可以总结一个规律，那是不是如果用到了聚合。在之前的结果上有叠加，那么就会产生更新操作，如果说没有聚合操作的话，那是不是我们所有得到的就全部都是。追加查询呢，就直接可以to stream里边所有的这个结果表里边就只有insert操作呢。但事实上。判定到底是追加查询还是更新查询的标准。并不是说。有没有用到聚合，而是说就是说看这个结果表里面的数据，它到底有没有更新操作。
15:07
诶，那可能我们就想到，那既然是做了聚合，怎么可能它没有更新操作呢？真有这样的情况，比如说窗口聚合。比方说我们还是呃考虑开一个统计窗口，这里可以简单举一个例子，就是在之前的这个E的事件基础上，用户点击访问的事件，我们可以统计每一个小时之内所有用户的点击次数，类似类似于一个PV的统计，那所以在当前的统计结果里边，我们可以做这样的一个定义，就是首先。要根据用户去进行划分，看每一个用户点击了多少次，所以包含一个username啊，User用户的名名称，然后呢，同样有一个访问的次数，CT这个都是一样的啊，跟之前是一样的，只不过之前我们是持续不断的去聚合，看当前用户到底访问了多少次，来一个就叠加一次，来一个就叠加一次，而现在呢，我们是要开个窗口。
16:08
所以这个窗当前结果里边就还应该包含一个窗口的信息，比如说我们当前就以窗口的结束时间叫NT作为当前窗口的一个标志，那这样的话得到的结果就应该是只在当前一小时这样一个窗口内，每一个用户访问的次数统计。那整体来看的话，跟之前的分组聚合整体过程是差不多的。我们会想到，当原始的动态表不停的插入新的数据的时候，我们可以看一下。不停的插入新的数据的时候，那得到的这个result表里边也会不停的更新当前每一个用户他访问的次数，比如说我们当前这张表啊，那我们统计一小时，那可以看到当前的时间戳后边我们为了看到清晰，专门后边乘以了6万，那如果当前这个时间戳是毫秒数的话，6万。
17:09
当然就是60秒啊，那所以就是一分钟了，这样看的就非常的明显，我们的第三条数据，这就是在第25分钟的时候插入的啊，那第四条数据是55分钟，所以很明显前四条数据。当前就是在从零到第一个小时之内的，如果我们这里表示的是小时数的啊话，那就是从0.00分到01:00之内的四条数据，而后边呢，呃，后边我们看到这是第61分钟，90分钟，110分钟，那这个都应该是在。1.00到。2.00之间的所有的数据。呃，我们前面这个是不包含一点整的这个数据的啊，这样的话我们就可以看到当前可以划分两个窗口，一小时的时间窗口，我们接下来可以看一下，在这张表上边，这本来还是一个原始的输入的动态表，那每一条数据都是插入进来的，都是简单的用户的一个访问事件，接下来我们应用的这个CQ跟之前就有所不同了。
18:20
之前我们直接就是by user，然后做了一个count统计，现在呢，诶，那就需要不仅要group by user，因为我们还要开窗口进行窗口聚合，在fliq里边，窗口聚合可以用这种方式，就是group by user，然后后边再加上窗口的信息，窗口的信息呢是Windows start和window and，这是。Flink CQ里边进行窗口聚合的一个固定写法啊，那就是把窗口的起始点和结束点都作为当前分组的K传输进来，然后另外这里面front table的时候呢？哎，那就不光是要有当前的even table，还应该要指定当前的时间戳到底是什么啊，所以我们这里边时间戳是TS，另外还要有当前窗口的定义，那当前是一个滚动一小时滚动窗口，它的定义是。
19:17
Tbo，我们看到tbo，这很明显这就是滚动窗口的含义了，里边传入了当前的事件表，输入的事件表以及时间属性字段，另外还有一个当前滚动窗口的大小，INTERVAL1HOUR啊，那很明显这就是长度为一小时的滚动窗口。那关于窗口的使用和定义，我们会在后边章节里边再去做详细的解释，这里的话我们只要知道用这种方式定义了一个滚动一小时的滚动窗口就可以了。然后我们要提取的字段呢，就是前面说的user，还有window，我们叫as andt，就是窗口的结束时间，就是用这个window关键字提取出来的。另外还有count URL CT，所以我们最后得到的result结果表也是一张动态表，里边就只有三个列，User MT和CT。
20:12
啊，我们这里边的MT不是直接写的时间戳，这里是写成了我们更加熟悉的十分秒的这种形式啊，所以这个看就更更加明确一点，就是一点钟结束的这个窗口，两点钟结束的这个窗口。所以我们现在看到了正常，我按照我们的思考方式的话，那应该是流处理嘛，所以当前输入的table，它是一条数据一条数据来的。Alice丝第一条数据来了，访问数据来了，那我们这里应该有一个Alice andt是一小时第一个小时，然后CNT应该是一，然后接下来Bob第二条数据来了啊，那么追加在这里边，后面追加一条BOB1小时一，接下来Alice呢，又来了两条数据，所以我们应该是更新这张表里的爱ice丝一小时，把一改成二，改成三，所以最后是这样的一个结果。
21:09
一小时的时候，我们应该能够得到这样一个结果。在这里我们还有一个具体的实现了窗口聚合的代码示例，那我们这个会放在下一节讲解时间属性和窗口的时候，再统一的实现这段代码。那后面呢，我们还需要再介绍一个，就是所谓的查询限制，这主要是考虑到在实际应用当中，有些持续查询，它可能会因为计算代价太高而受到限制。那什么叫做代价太高呢？那有两种情况，一种就是我们所说的状态太大。我们我们知道使用持续查询做流处理的时候，比方说像前面我们讲到的这个窗口进行分组聚合，那在这个过程当中，我们可能需要把中间的那些状态都保存下来啊，这个其实跟窗本身我们做窗口的操作是一样的，我们前面如果说只是做一个增量聚合的话，要保存的可能只是当前user对应的一个count值。
22:14
只是一个计数器就可以把它保存下来，然后增量聚合，那有些场景下，可能我们是要把当前窗口内的所有数据都存下来的，诶，那这个如果说我们开这个窗口啊。假如说持续查询要要保存几周甚至几个月的数据的话，那整个这个要处理的数据总量可能非常非常大。所以在这个过程当中，如果状态是逐渐增长，不停增大的话，那是有可能会耗尽我们的。内存空间的，这样就有可能会导致查询失败。那另外还有一种情况就是更新计算的复杂度有可能会很高。的更新计算的复杂度，那指的就是说每来一条新的数据，我们到底要改什么？像前面我们如果只是一个非常简单的，如果我们只是一个非常简单的count计算的话，哎，那很很简单吧，就是找到对应的那个user，每来一个数据我就加一，每来一个就加一，啊这个不需要更改太多，但是我们想另外一个例子，假如说是一个rank函数。
23:18
我们要更新当前数据的排名的话，那一条数据的改变就有可能导致他之前之后的所有数据的排序排名发生变化，诶那比比如说我们这里边有一个另外的一个CQ，我们当前的这个CQ是select user和rank啊，后面是用到了一个所谓的开窗函数over，这个也也是放在后边，我们讲到窗口的时候会专门的去做讲解，那我们现在只是知道相当于我们就是基于某一个范围进行一个开窗。然后接下来呢，是要。我们要选取当前这个范围内的max ts啊，就是最大的时间戳，而且接下来还要计算一个排名。
24:06
所以接下来最大时间戳我们知道其实就是在一段范围内的最后一次点击的时间嘛，我们根据这个用户最后一次点击时间做一个重新排序的计算，每来一个数据就要对所有的排序进行重调，那这个过程很明显啊，用户的数据越多，更新的难度就越大，这个耗费的代价是非常非常大。这样的查询操作就不太适合作为连续查询在流处理里边进行执行啊，那所以我们在实际应用的过程当中，也需要去考虑这样的两种情况，就是状态，如果要是在不停的增长，可能增长到非常大，或者说更新计算，随着数据的增大会越来越麻烦，会非常复杂的话，我们往往就要谨慎的去使用持续查询。这是关于。
25:01
开始的时候，把一个真正意义上的数据流转换成动态表，然后进行持续查询的过程。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之2022版Flink1.13（Java版）

（137/171）

6分39秒

001_Flink课程简介

510

12分54秒

002_第一章_Flink简介（一）_Flink起源和设计理念

350

12分25秒

003_第一章_Flink简介（二）_Flink在企业的应用

400

8分41秒

004_第一章_Flink简介（三）_Flink的优势

440

18分2秒

005_第一章_Flink简介（四）_数据处理框架的演变

460

4分55秒

006_第一章_Flink简介（五）_流处理的应用场景

290

6分57秒

007_第一章_Flink简介（六）_Flink的分层API

350

10分5秒

008_第一章_Flink简介（七）_Flink和Spark的区别

350

11分58秒

009_第二章_Flink快速上手（一）_环境准备和创建项目

410

15分19秒

010_第二章_Flink快速上手（二）_批处理_Word Count（一）

420

8分31秒

011_第二章_Flink快速上手（二）_批处理_Word Count（二）

430

13分47秒

012_第二章_Flink快速上手（三）_流处理（一）_有界流处理Word Count（一）

400

6分42秒

013_第二章_Flink快速上手（三）_流处理（一）_有界流处理Word Count（二）

360

11分47秒

014_第二章_Flink快速上手（三）_流处理（二）无界流处理Word Count

410

18分16秒

015_第三章_Flink部署（一）_快速启动一个集群（一）_环境配置和基本介绍

360

8分41秒

016_第三章_Flink部署（一）_快速启动一个集群（二）_集群启动

440

12分31秒

017_第三章_Flink部署（一）_快速启动一个集群（三）_提交作业（一）_Web UI提交

360

11分3秒

018_第三章_Flink部署（一）_快速启动一个集群（三）_提交作业（二）_命令行提交

330

10分59秒

019_第三章_Flink部署（二）_部署模式

320

3分49秒

020_第三章_Flink部署（三）_独立模式的部署

380

18分50秒

021_第三章_Flink部署（四）_Yarn模式的部署

400

13分39秒

022_第四章_Flink运行时架构（一）_Flink系统架构

390

12分12秒

023_第四章_Flink运行时架构（二）_作业提交流程

370

10分46秒

024_第四章_Flink运行时架构（三）_一些重要概念（一）_数据流图

450

12分15秒

025_第四章_Flink运行时架构（三）_一些重要概念（二）_并行度

400

14分53秒

026_第四章_Flink运行时架构（三）_一些重要概念（三）_算子链

390

6分13秒

027_第四章_Flink运行时架构（三）_一些重要概念（四）_执行图

390

17分36秒

028_第四章_Flink运行时架构（三）_一些重要概念（五）_Task Slots

450

6分23秒

029_第四章_Flink运行时架构（四）_Flink的任务调度

380

5分40秒

030_第五章_DataStream API（基础篇）（一）_整体介绍

370

16分12秒

031_第五章_DataStream API（基础篇）（二）_执行环境

400

5分18秒

032_第五章_DataStream API（基础篇）（三）_源算子（一）_整体介绍

400

5分17秒

033_第五章_DataStream API（基础篇）（三）_源算子（二）_准备工作

460

17分14秒

034_第五章_DataStream API（基础篇）（三）_源算子（三）_读取有界流

370

4分4秒

035_第五章_DataStream API（基础篇）（三）_源算子（四）_读取Socket文本流

350

11分50秒

036_第五章_DataStream API（基础篇）（三）_源算子（五）_读取Kafka

400

14分50秒

037_第五章_DataStream API（基础篇）（三）_源算子（六）_自定义Source

470

6分32秒

038_第五章_DataStream API（基础篇）（三）_源算子（七）_自定义并行Source

380

10分21秒

039_第五章_DataStream API（基础篇）（三）_源算子（八）_Flink支持的数据类型（一）

400

12分59秒

040_第五章_DataStream API（基础篇）（三）_源算子（八）_Flink支持的数据类型（二）

360

13分14秒

041_第五章_DataStream API（基础篇）（四）_Transform（一）_Map

460

10分46秒

042_第五章_DataStream API（基础篇）（四）_Transform（二）_Filter

410

13分37秒

043_第五章_DataStream API（基础篇）（四）_Transform（三）_FlatMap

350

12分14秒

044_第五章_DataStream API（基础篇）（四）_Transform（五）_KeyBy

430

13分17秒

045_第五章_DataStream API（基础篇）（四）_Transform（六）_简单聚合

390

20分24秒

046_第五章_DataStream API（基础篇）（四）_Transform（七）_归约聚合

370

9分24秒

047_第五章_DataStream API（基础篇）（四）_Transform（八）_UDF（一）_函数类和匿名函数

420

14分40秒

048_第五章_DataStream API（基础篇）（四）_Transform（八）_UDF（二）_富函数类

470

18分2秒

049_第五章_DataStream API（基础篇）（四）_Transform（九）_物理分区（一）_随机和轮询分区

400

14分19秒

050_第五章_DataStream API（基础篇）（四）_Transform（十）_物理分区（二）_Rescale

320

8分37秒

051_第五章_DataStream API（基础篇）（四）_Transform（十）_物理分区（三）_广播、全局及自定义分区

350

11分48秒

052_第五章_DataStream API（基础篇）（五）_Sink（一）_连接到外部系统

430

15分23秒

053_第五章_DataStream API（基础篇）（五）_Sink（二）_输出到文件

320

13分0秒

054_第五章_DataStream API（基础篇）（五）_Sink（三）_输出到Kafka

440

13分56秒

055_第五章_DataStream API（基础篇）（五）_Sink（四）_输出到Redis

240

13分13秒

056_第五章_DataStream API（基础篇）（五）_Sink（五）_输出到Elasticsearch

390

14分28秒

057_第五章_DataStream API（基础篇）（五）_Sink（六）_输出到MySQL

400

5分4秒

058_第五章_DataStream API（基础篇）（五）_Sink（七）_自定义Sink输出

350

13分30秒

059_第六章_Flink中的时间和窗口（一）_时间语义

410

10分20秒

060_第六章_Flink中的时间和窗口（二）_水位线（一）_水位线的概念

410

17分17秒

061_第六章_Flink中的时间和窗口（二）_水位线（二）_水位线的原理和特性

370

14分25秒

062_第六章_Flink中的时间和窗口（二）_水位线（三）_水位线在代码中的生成（一）

370

8分48秒

063_第六章_Flink中的时间和窗口（二）_水位线（三）_水位线在代码中的生成（二）

390

11分3秒

064_第六章_Flink中的时间和窗口（二）_水位线（四）_自定义水位线的生成

470

6分58秒

065_第六章_Flink中的时间和窗口（二）_水位线（五）_水位线的传递

440

9分52秒

066_第六章_Flink中的时间和窗口（三）_窗口（一）_窗口的基本概念

350

20分50秒

067_第六章_Flink中的时间和窗口（三）_窗口（二）_窗口的分类

370

4分10秒

068_第六章_Flink中的时间和窗口（三）_窗口（三）_窗口API概览

340

12分27秒

069_第六章_Flink中的时间和窗口（三）_窗口（四）_窗口分配器

370

5分30秒

070_第六章_Flink中的时间和窗口（三）_窗口（五）_窗口函数整体介绍

440

5分33秒

071_第六章_Flink中的时间和窗口（三）_窗口（六）_窗口函数分类

430

9分7秒

072_第六章_Flink中的时间和窗口（三）_窗口（七）_增量聚合函数（一）_ReduceFunction

420

13分20秒

073_第六章_Flink中的时间和窗口（三）_窗口（七）_增量聚合函数（二）_AggregateFunction

420

19分42秒

074_第六章_Flink中的时间和窗口（三）_窗口（七）_增量聚合函数（三）_应用实例

410

18分31秒

075_第六章_Flink中的时间和窗口（三）_窗口（八）_全窗口函数

450

10分55秒

076_第六章_Flink中的时间和窗口（三）_窗口（九）_两种窗口函数结合

410

11分43秒

077_第六章_Flink中的时间和窗口（三）_窗口（十）_窗口函数综合应用实例

400

19分44秒

078_第六章_Flink中的时间和窗口（三）_窗口（十一）_窗口其它API

380

11分32秒

079_第六章_Flink中的时间和窗口（四）_处理迟到数据（一）_代码实现

430

12分42秒

080_第六章_Flink中的时间和窗口（四）_处理迟到数据（二）_测试

370

17分1秒

081_第七章_处理函数（一）_处理函数的概念和分类

460

14分16秒

082_第七章_处理函数（二）_ProcessFunction

420

12分2秒

083_第七章_处理函数（三）_KeyedProcessFunction（一）_处理时间定时器

460

11分32秒

084_第七章_处理函数（三）_KeyedProcessFunction（二）_事件时间定时器

340

5分23秒

085_第七章_处理函数（四）_ProcessWindowFunction

330

15分49秒

086_第七章_处理函数（五）_Top N（一）_使用ProcessAllWindowFunction（一）_基本思路

350

14分44秒

087_第七章_处理函数（五）_Top N（一）_使用ProcessAllWindowFunction（二）_代码实现和测试

370

22分11秒

088_第七章_处理函数（五）_Top N（二）_使用KeyedProcessFunction

290

16分2秒

089_第八章_多流转换（一）_分流

450

13分50秒

090_第八章_多流转换（二）_合流（一）_ 联合（Union）

380

12分56秒

091_第八章_多流转换（二）_合流（二）_ 连接（Connect）

330

23分18秒

092_第八章_多流转换（二）_合流（三）_ 应用实例（一）_程序架构和实现思路

380

15分1秒

093_第八章_多流转换（二）_合流（三）_ 应用实例（二）_具体代码实现

320

6分14秒

094_第八章_多流转换（二）_合流（四）_ 广播连接流

440

21分14秒

095_第八章_多流转换（三）_双流Join（一）_ 窗口联结

380

20分8秒

096_第八章_多流转换（三）_双流Join（二）_ 间隔联结

470

15分17秒

097_第八章_多流转换（三）_双流Join（三）_ 窗口同组联结

400

13分50秒

098_第九章_状态编程（一）_Flink中的状态（一）_ 状态的定义

420

12分59秒

099_第九章_状态编程（一）_Flink中的状态（二）_ 状态的管理

430

100

16分6秒

100_第九章_状态编程（一）_Flink中的状态（三）_ 状态的分类

410

101

19分38秒

101_第九章_状态编程（二）_按键分区状态（一）_ 基本概念和类型

410

102

13分56秒

102_第九章_状态编程（二）_按键分区状态（二）_ 代码中的使用（一）_基本方式和值状态

280

103

17分16秒

103_第九章_状态编程（二）_按键分区状态（二）_ 代码中的使用（二）_其它状态

440

104

24分34秒

104_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（一）_值状态

390

105

19分29秒

105_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（二）_列表状态

370

106

22分14秒

106_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（三）_映射状态

420

107

20分8秒

107_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（四）_聚合状态

340

108

17分18秒

108_第九章_状态编程（二）_按键分区状态（四）_ 状态生存时间

340

109

14分27秒

109_第九章_状态编程（三）_算子状态（一）_ 基本概念和类型

400

110

12分5秒

110_第九章_状态编程（三）_算子状态（二）_应用实例（一）_基本思路和框架

370

111

16分31秒

111_第九章_状态编程（三）_算子状态（二）_应用实例（二）_具体实现和测试

340

112

8分54秒

112_第九章_状态编程（四）_广播状态（一）_基本概念和用法

410

113

22分48秒

113_第九章_状态编程（四）_广播状态（二）_应用实例

380

114

9分52秒

114_第九章_状态编程（五）_状态持久化（一）_检查点

450

115

21分15秒

115_第九章_状态编程（五）_状态持久化（二）_状态后端

420

116

11分54秒

116_第十章_容错机制（一）_检查点（一）_检查点的保存原理（一）_周期性的保存

340

117

15分2秒

117_第十章_容错机制（一）_检查点（一）_检查点的保存原理（二）_保存的时间点

340

118

6分40秒

118_第十章_容错机制（一）_检查点（二）_从检查点恢复状态

320

119

15分0秒

119_第十章_容错机制（一）_检查点（三）_检查点算法（一）_分界线

390

120

22分22秒

120_第十章_容错机制（一）_检查点（三）_检查点算法（二）_分布式快照算法

360

121

19分19秒

121_第十章_容错机制（一）_检查点（四）_检查点配置

310

122

13分12秒

122_第十章_容错机制（一）_检查点（五）_保存点

300

123

10分50秒

123_第十章_容错机制（二）_状态一致性（一）_一致性的概念和级别

430

124

15分16秒

124_第十章_容错机制（二）_状态一致性（二）_端到端状态一致性（一）

290

125

15分54秒

125_第十章_容错机制（二）_状态一致性（二）_端到端状态一致性（二）

380

126

18分22秒

126_第十章_容错机制（二）_状态一致性（三）_端到端精确一次

310

127

13分26秒

127_第十一章_Table API和SQL（一）_整体介绍

350

128

19分18秒

128_第十一章_Table API和SQL（二）_快速上手

360

129

12分48秒

129_第十一章_Table API和SQL（三）_基本API（一）_程序架构

370

130

13分40秒

130_第十一章_Table API和SQL（三）_基本API（二）_表环境

410

131

16分31秒

131_第十一章_Table API和SQL（三）_基本API（三）_创建表

340

132

20分33秒

132_第十一章_Table API和SQL（三）_基本API（四）_表的查询和输出（一）

410

133

15分0秒

133_第十一章_Table API和SQL（三）_基本API（四）_表的查询和输出（二）

400

134

12分24秒

134_第十一章_Table API和SQL（三）_基本API（五）_表和流的转换（一）_表转换成流

350

135

13分25秒

135_第十一章_Table API和SQL（三）_基本API（五）_表和流的转换（二）_流转换成表

390

136

16分21秒

136_第十一章_Table API和SQL（四）_流处理中的表（一）_动态表和持续查询

440

137

25分10秒

137_第十一章_Table API和SQL（四）_流处理中的表（二）_流转换成动态表做动态查询

420

138

15分2秒

138_第十一章_Table API和SQL（四）_流处理中的表（三）_动态表编码成数据流

380

139

16分23秒

139_第十一章_Table API和SQL（五）_时间属性和窗口（一）_时间属性（一）_在DDL中定义

390

140

11分55秒

140_第十一章_Table API和SQL（五）_时间属性和窗口（一）_时间属性（二）_流转换成表时定义

360

141

22分46秒

141_第十一章_Table API和SQL（五）_时间属性和窗口（二）_窗口

320

142

21分5秒

142_第十一章_Table API和SQL（六）_聚合查询（一）_分组聚合

420

143

16分1秒

143_第十一章_Table API和SQL（六）_聚合查询（二）_窗口聚合

400

144

15分22秒

144_第十一章_Table API和SQL（六）_聚合查询（三）_开窗聚合

410

145

28分4秒

145_第十一章_Table API和SQL（六）_聚合查询（四）_TopN（一）_普通TopN

370

146

15分27秒

146_第十一章_Table API和SQL（六）_聚合查询（四）_TopN（二）_窗口TopN

450

147

14分58秒

147_第十一章_Table API和SQL（七）_联结查询

420

148

22分9秒

148_第十一章_Table API和SQL（八）_函数（一）_系统函数

390

149

9分46秒

149_第十一章_Table API和SQL（八）_函数（二）_UDF（一）_整体介绍和分类

410

150

9分6秒

150_第十一章_Table API和SQL（八）_函数（二）_UDF（二）_标量函数

410

151

16分40秒

151_第十一章_Table API和SQL（八）_函数（二）_UDF（三）_表函数

370

152

18分24秒

152_第十一章_Table API和SQL（八）_函数（二）_UDF（四）_聚合函数

350

153

25分19秒

153_第十一章_Table API和SQL（八）_函数（二）_UDF（五）_表聚合函数

300

154

9分2秒

154_第十一章_Table API和SQL（九）_SQL客户端

360

155

14分49秒

155_第十一章_Table API和SQL（十）_连接到外部系统（一）_常见的外部存储

370

156

14分11秒

156_第十一章_Table API和SQL（十）_连接到外部系统（二）_Hive

380

157

17分24秒

157_第十二章_Flink CEP（一）_基本概念和应用

380

158

17分40秒

158_第十二章_Flink CEP（二）_快速上手（一）_需求分析和定义模式

350

159

14分1秒

159_第十二章_Flink CEP（二）_快速上手（二）_检测处理代码实现和测试

370

160

13分58秒

160_第十二章_Flink CEP（三）_模式API（一）_个体模式（一）_量词

380

161

15分45秒

161_第十二章_Flink CEP（三）_模式API（一）_个体模式（二）_条件

420

162

16分31秒

162_第十二章_Flink CEP（三）_模式API（二）_组合模式

300

163

5分31秒

163_第十二章_Flink CEP（三）_模式API（三）_模式组

400

164

12分38秒

164_第十二章_Flink CEP（三）_模式API（四）_匹配后跳过策略

390

165

14分14秒

165_第十二章_Flink CEP（四）_模式的检测处理（一）_处理匹配事件

350

166

18分42秒

166_第十二章_Flink CEP（四）_模式的检测处理（二）_处理超时事件（一）_需求分析和准备工作

370

167

16分39秒

167_第十二章_Flink CEP（四）_模式的检测处理（二）_处理超时事件（二）_代码实现和测试

350

168

7分26秒

168_第十二章_Flink CEP（四）_模式的检测处理（三）_处理迟到数据

440

169

9分20秒

169_第十二章_Flink CEP（五）_CEP状态机实现（一）_思路分析和程序框架

390

170

16分32秒

170_第十二章_Flink CEP（五）_CEP状态机实现（二）_定义状态机

330

171

7分53秒

171_第十二章_Flink CEP（五）_CEP状态机实现（三）_实现处理逻辑及测试

380

137_第十一章_Table API和SQL（四）_流处理中的表（二）_流转换成动态表做动态查询

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐