文章/答案/技术大牛

发布

首页视频040.尚硅谷_Flink-时间语义

040.尚硅谷_Flink-时间语义

2022-12-022022-12-02 16:02:28播放30

点赞0 收藏 0

尚硅谷大数学科--选学技术丰富/尚硅谷Flink从入门到实战（scala版）/视频/040.尚硅谷_Flink-时间语义.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
接下来给大家讲flink里边的时间语义和watermark，然后我们首先看一下啊，主要给大家讲什么呢？先来说一说flink里边时间语义到底是什么意思，然后呢，哎，重点我们的重点会放在所谓的in态事件时间这个概念上，所以给大家讲一讲代码里边怎么设置，那另外呢，后面要引出一个非常重要的概念，就是flink里边的water mark的概念啊，有时候把它翻译成水位线，有时候翻译成这个水印，不管翻译成什么样吧，大家知道它是一个watermark，一个标记，对吧，类似于标记一样的东西，然后呢，后面我们再给大家讲一讲watermark的传递规则是什么样的，然后代码里面怎么样去引入啊，那具体设置的时候怎么样去设定，给大家详细的讲一讲啊，所以watermark是我们这节课的一个主要内容啊，那首先我们先来讲一下时间语义，那大家可能就会想到这个，呃，时间我们在做这个流处理的时候要开窗那。
01:00
时间非常重要对吧？一般情况下我们开的都是时间窗口啊，那时间到底是什么含义呢？大家其实会会想到这个太平常了，时间这还不好说吗？我们平常你看表的时候，这就是时间嘛，对计算机系统而言，那不就是系统时间吗？我们本身里边系统有一个时钟对吧？呃，执行这些代码的时候，就按这个时钟来来来判断来来处理嘛，我们平常也可以调用各种各样的这个方法，对吧？啊，System里边直接get当前的这个系统时间啊，或者说我我用这个date对吧，你有一个date来获取当前的这个系统时间都是完全可以的，这个是大家比较熟悉的时间的概念，就是在计算机系统里边的时间的概念，但是我们要想一想，哎，这个在分布式处理系统里边，我们考察的要做统计的这个时间，真的就是系统计算的当前的系统的时间吗？其实还真不一定，大家来看看这幅图，大家看到啊，这幅图里边就把这个数据从产生到进入我们整个的这个呃，传输的过程，对吧？啊，进入到消息队列，然后再进入弗link系统，具体到我们里边每一个算子任务进行计算的这个过程都给我们画出来了。
02:14
然后我们来顺一遍，大家就会想到，首先这个数据应该是先要发生对吧，先要产生出来，那比方说呃，我们如果统计用户的行为的话，用户做了一个点击操作，他点击的那一项，这是真正这个事件发生的时候啊，或者说我们如果要是收集这个，呃，比方说收集这个汽车啊，做这个呃，它的这个位移判断，我们要做这个智能控制的话，当前它的那个信号发射出来的那个数据，那个时间就是当时它生成的那个时间，然后接下来会怎么样呢？啊，我们知道要做各种各样的提取，对吧？有可能我们从日志里面去提取，就写到日志里边，然后去提取啊，然后呢啊，有可能会扔到这个消息队列里边啊，做一个缓冲啊，这里边经常常见的，前面我们就放一个卡夫卡对吧，然后就有了，这里边也是分布式的架构，所以就有可能有不同的这个数据传输的延迟，对吧，网络有传输延迟，然后分布式架构啊，也会有不同的这个分区里边数据可能。
03:15
也会产生乱序，然后接下来继续往后传消息队列，我们弗林可系统去读取，那就把它读到了当前处理程序里边来，然后接下来呢，啊，那在我们处理的过程当中，大家发现flink并不是铁板一块对吧？Flink是本身按照data flow按照数据流定义好的流式的处理系统，所以说它的一个一个的这个任务，先后发生的任务都是拆开的，我们知道它都可以去放到不同lo上去执行啊，然后这个时候呢，就会涉及到我们还会并行啊，所以前后的任务之间，它会把数据去做重新分区，去做传递。那大家就会想到了，你有些数据，假如说我在这儿啊，我们后面不是有那个KBY吗？分组对吧，然后再做这个window操作，那那假如说我当前的这个分区KBY之后还在当前的这个task manager上，还在当前这个lo里边，它是不是传递的时间就相对来讲会少一点，对吧？呃，就会节省一点时间，那如果他跨了pass manager的话，或者说简单一点，跨了slo的话，呃，整体来讲，它花费的这个网络传输的时间就会更长一点，所以这就又导致了我前面发生的时间，即使是发生的比较早，是不是到后面处理的时候也有可能会滞后啊。
04:34
所以说这里面就带来了一个问题，在分布式系统，而且是在这种比较复杂的处理系统里边啊，前后这个层级比较多，对吧，到最后我们处理的过程当中，就会出现数据的乱序，就会出现我们处理时候的这个数据的顺序跟啊，当时它发生时候，这个事件发生时候的那个顺序不一样。
05:00
那就更不要说我当前处理时候的系统时间跟它发生时候的时间，那就那就不一样的更大了，对吧？啊，那那有可能这个，呃，这已经延迟了很久才才传递过来了，呃，因为路上这个有网络传输嘛，有延续的各种各样的这个，呃处理的这个操作嘛，都会导致延迟，所以我们会发现其实在分布式处理系统里边，特别是大数据的这种框架里边。这些时间是不一样的，首先我们定义有一个叫做even的time even time指的就是事件或者说数据发生的时间，事件创建的时间，就真正意义上它产生的那个时间，对吧？啊，就真正意义上的那个时间。然后另外还有一个什么呢？弗link如果要处理它可能还会关心，以至于在卡夫卡里面的时间，这个我不关心对吧？我关心的就是进入弗link系统的时间对吧？从外部进入到弗link s算子这里面来的时候，这个时间叫做in interesting态in interestingtion是所谓的那个，呃，消化摄入对吧？有时候管这个翻译叫做摄入时间，这是另外一个时间概念。那最后呢，还有一个就是每一个算子在进行操作的时候。
06:13
当前的系统时间都不一样，对吧，因为你进入flink系统之后，也会有网络传输啊，也会有不同的这个数据重分区，呃，做这个调整之后，他们的这个耗费的时间不一样啊，所以最后还有一个当前算子进行计算的处理时间，执行时间啊，这个东西叫做processing。有时候我们翻译就是这个叫视线时间，这个叫射入时间，最后这个叫呃，处理时间，这就是flink里边定义出来的不同的时间语义。啊，那我们接下来看一看，既然有不同的时间语义了，那哪个时间语义更重要，我们应该用哪个时间语义呢？啊，接下来我们看一个生活当中具体的例子啊，就是我们看看哪种时间语义更重要，在这个例子是一个电影的例子，大家可能也也看过，或者说大家至少听说过啊，星球大战对吧？啊，星球大战是拍了一系列电影的，到目前为止应该已经有这个七部了，对吧，那那这七部呢？呃，这就是有一些这个一开始比较呃叫好卖座的这个电影，或者说IP，它的一个可以说是通病，为什么呢？就是第一次你看他第一部这个电影拍摄的时候是1977年这部电影啊，叫好对吧？然后如果说这个电影很受欢迎，很很卖座，那接下来他就会拍续集啊，那所以后面大家看到他接着80年83年拍了两部续集。
07:39
那关键是有时候这个这个电影呢，一个大的IP，它不仅仅是拍续集就完了，有时候他还会翻回头来再去拍前传啊，所以说接下来你看过了十几年之后，九九年又拍了一部幽灵的威胁，这个其实从时间线上来说啊，就是从这个星球大战故事的时间线上来说，它其实是最初的一个前传，它应该排在所有这个星球大战系列电影的第一部，它其实应该是星球大战一。
08:08
对吧，然后接后接下来呢，又基于他又拍了两部这个剧集，那其实呢，这几部都是在我们前面的这个，呃，七七七十年代80年代拍的三部电影的之前，就是故事线上，应该是他在他之前对吧？啊，然后在后边一五年的时候又拍了一部整体的，呃，这个后面的这个续集，对吧，拍了一部星球大战七，所以大家会发现，如果说你要按照电影的拍摄时间，或者说上映时间，我们自己去看的这个时间去考虑的话，那其实时间线应该是什么呢？啊，应该是就是第一步是这个新希望对吧？啊，然后后边是帝国反击战，就是七七年，80年83年，按照这个时间线来看啊，所以如果说大家想这就相当于什么呢？这就相当于处理时间嘛，我们真正看到这部电影，我们去处理他的这个信息的时候，我们摄入之后啊，去信处理他信息的时候，其实是按照这个顺序来看的。
09:09
但是事实上呢，呃，你如果要是说想捋一遍星球大战的故事的话，故事情节那其实应该是什么？应该是九九年，这是一对吧，呃，应该是123，然后前面这是456，最后是七，所以这是真正的事件发生事件对吧，这相当于事件事件啊，所以我们看这个九九年这一步的时候，这就相当于什么呢？一部，呃，这这个这就相当于一个迟到了，延迟了20多年的这个第一步，对吧？它早就应该发生，早早在这个新希望之前就应该发生，但是呢啊，它是到九九年的时候才拍摄出来，我们才看到了，才处理它啊，所以这就是这个不同的时间语义，那那大家就看到了，那到底我们应该用哪种呢？看场景，如果说我们考虑的是啊，电影的这个从业人员对吧，我们关心的是这个电影票房啊，关心的是这个电影业呃带来的一些呃反响啊，或者说我们带来的是呃，你当时观影的时候的一些具体的感受啊。
10:09
那可能我们主要考虑的就是处理时间processing态对吧？啊，考虑的就是它真正上映的时候，那如果说我们更关注的是这个故事情节的话，当时就关注这个星球大战讲的什么事，那大家想是不是我们应该关注的就是这个事件事件啊，啊，所以这就涉及到到底是什么样的场合，那大家想一想，在计算机系统里边，我们处理的数据大部分更关心哪种场合呢？啊，与之对应的那就是我们到底是关心当前这个电影上映对吧？我我具体处理时候的这个时间，还是更关心事件当时发生时候的时间，像我们前面说统计15秒之内的一个呃，温度的最小值，你到底是关心我运行的时候，哎，这这15秒之内的最小值，还是关心当时传感器收集数据的时候，它15秒内的最小值呢？啊，这我们就可以得到结论，就是我们一般是会更关心事件事件对吧？啊，更关心它当时发生的时候，这个故事到底是怎么样，那后面我们再给大家举一个计算机系统里边的例子啊，简单给大家说一说啊，这个就可能会大家体会会更真切一些啊，那这个例子呢，是一个在线手游的例子啊，那就是比方说我们玩这个在线手游是个休闲游戏啊，类似于消消乐之类的一个游戏啊呃，那这个游戏里边大家知道这种休闲游戏一般情况呢，我们玩的时候不需要联网啊，就是你直接。
11:37
随时都可以空闲时间拿出来玩一下，对吧？啊，但是呢，有往往它这种游戏都会设置一些特殊的挑战，比方说哎，我现在要求五分钟之内啊，或者说我这个，呃，这个两分钟之内过上五关就给你发放一些奖励啊，那这样的话，这个奖励大家想它是不是就必须要联网才能获取啊，所以接下来我们想一下这个场景啊，现在我们玩这个消消乐啊，大家这个上学或者上班的路上，平常我们大城市里边啊，都要这个坐公交，坐地铁，这个路上比较漫长，昏昏欲睡，那有时候无聊的时候呢，啊，就拿一个休闲游戏来打发时间，对吧，那我们就在路上抓紧过关啊，这我们玩的很溜啊，就连续过关，大家看到这里边上面的这个数据，这就相当于是我们真实的这个数据连续过关，呃，大家看这个从22分开始，在23分20秒之前，相当于我这都已经过了八关了，对吧？啊，已经过了八关，有八个数据产生了。
12:37
啊，这是相当于我自己的时间线，但是会有一个什么问题呢？就是我路上坐地铁的时候，或者定进这个电梯的时候，大家发现上面这个没信号了，对吧？没信号的话，就就会导致我当前这个数据是不是没有办法发送出去，发到服务器那边呀？啊，所以就会导致服务器那边接收到的数据呢？哎，服务器那边看到的数据应该是什么样的啊，就是前边08:22，哎左右这个时候我收到了三你过三关的这个数据，然后中间呢，隔了好久好久，然后后边得等到你出了地铁之后，有了信号之后，这个数据才会发过来，对吧。
13:19
好啊，那所以呃，这就这就有一个问题，就是说我们到底应该怎么算这个这种情形呢？到底应该给给不给你奖励呢？那就是你要看我们当前到底是按照processing time来看，还是按照even time来看，如果按照处理时间，服务器的处理时间来看的话，我的两分钟就是这么这么长时间，对吧？啊，或者说一分钟啊，这里面截的应该看起来是一分钟对吧，到23 23分为止，我的一分钟就是这么长，那你只过了三关啊，我不能给你奖励，但是从我们用户的角度来看的话，那应该是什么样呢？我的一分钟其实这里边已经过了好多关了，对吧，没有过八关，这里边至少也过了六关了，那你应该给我奖励啊，啊，其实我们服务器是可以这么做的，为什么呢？我可以按照这个事件发生的时间来考虑这个一分钟，那这个一分钟是不是就相当于是这个绿框even time这样的一个时长啊。
14:16
你从这个角度来讲的话，那就应该给用户发放奖励对吧？啊所以啊，那在这种场景下，大家可能会想到，呃，那到底应该怎么做呢？呃，你从用户体验的角度来讲，当然应该是按照用户真正产生这个时间，他过关的这个时间来给他发放奖励啊，要不然的话，你这个用户，呃，我我这个本来玩的很溜，稍微一下子这个没有没有没有这个信号对吧，没发出去这个数据，然后你就说我拿不到奖励啊，那这个这破游戏下回不玩了对吧？啊，这个是很容易影响用户体验的啊，当然这个例子并不是特别的，就是那么的要求强烈，对吧，如果说你不给他奖励好像也没什么啊，你就找这个有有信号的地方吧，但是大家会发现，从逻辑上来讲的话，我们用事件时间一问time其实会更合理一点，因为还有什么可能呢？哎，你用户那边和我们这个系统时间有可能不匹配呀，对吧，你这里边这个路上本来这个网络传输的延迟可能又会比较高啊，那假如说这个它刚好卡在那个时。
15:17
盘点上过的关，我们这边收到的时候，你判定它是没过这个其实就有点不合理了啊，所以这其实我们更关心的就是事件时间，那事件时间怎么去提取呢？啊，这大家知道，当然就是用这个1EVEN time，我们是要从数据里边去提取的，对吧？因为你不能用当前这个处理的时候，机器告诉我时间是什么，那我就只能从数据里边去提了，那这个数据一般情况啊，大家知道我们的数据都是从日志里面来的嘛，打日志的时候，写日志的时候，是不是总会带上一个时间戳啊啊所以大家看一般情况我们一条日志啊，就是呃，几年几月几日啊，几几点几分几秒，然后哎，这是一个什么什么样类型的一个日志啊，然后怎么样有一条信息，对吧？或者说有一些别的数据，那我们通过分析它前面的这个时间戳，是不是就可以提取出当前数据真正发生的时间啊。
16:14
啊，所以接下来我们就可以用这个作为事件时间来进行考察了，对吧，就是我判断这个时间，你如果是在这个一分钟之内完成的这这几个过关数据的话，我就这么给你考察算进去啊，那所以在有一些场景下，从逻辑上来讲，可能我们就不应该用processing time，而应该用事件事件，那有同学可能就想，那是不是processing time就没什么用呢？呃，其实也不是啊，在有一些场景下，呃，其实process time还是很有用的，大家想想是什么场景呢？啊，因为这个你如果要用even time，大家想你按这个来算的话，那是不是？假如说啊，我这里边是设置了一个窗口，我要做这个统计去做处理的话，那是不是这个用户那边的数据，他的那个时间没到这个点，我这儿这个窗口就不能关啊，我觉得一直等对不对，那所以这种情况下，其实这个延迟可能会比较高，我们这里边的实时性就会就会受到损损害就会降低。那如。
17:14
如果说有一些场景，我要求你就是必须要最快速度的给我出结果，对吧？啊，在这种场景下，然后那自然你就得有有这个权衡了，你就得有代价了，代价就是我对这个结果的正确性要求不高，对吧？啊，你有些这个数据来晚了，来晚了丢就丢了，对吧，我认为他就没有过这个关，没关系，如果在这种场景下，对实时性的要求更高，非常非常高，诶那我们可以怎么办，就直接用process对吧，就机器处理，处理到哪个点，这个窗口就管，就就完全不看它那个数据对吧，你延迟到的这个数据不管了，直接就就就丢掉了啊这个是完全可以的，这就是不同时间语义它的应用场景。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷Flink从入门到实战（scala版）

（40/137）

10分49秒

001.尚硅谷_Flink-Flink简介

510

19分45秒

002.尚硅谷_Flink-Flink应用场景

480

11分3秒

003.尚硅谷_Flink-流式处理的提出

380

15分16秒

004.尚硅谷_Flink-流式处理的演变

350

16分33秒

005.尚硅谷_Flink-Flink的特点

340

23分57秒

006.尚硅谷_Flink-批处理wordcount

520

20分13秒

007.尚硅谷_Flink-流处理wordcount

380

19分14秒

008.尚硅谷_Flink-流处理wordcount扩展测试和说明

410

26分46秒

009.尚硅谷_Flink-Flink集群部署

470

22分34秒

010.尚硅谷_Flink-提交Job

400

7分30秒

011.尚硅谷_Flink-命令行提交Job

350

12分50秒

012.尚硅谷_Flink-其它方式集群部署

360

8分35秒

013.尚硅谷_Flink-运行时架构_运行时组件

390

13分22秒

014.尚硅谷_Flink-运行时架构_作业提交流程

430

16分27秒

015.尚硅谷_Flink-运行时架构_任务调度原理（一）_并行度和slot

360

17分22秒

016.尚硅谷_Flink-运行时架构_任务调度原理（二）_slot共享

470

6分15秒

017.尚硅谷_Flink-运行时架构_任务调度原理（三）_slot共享示例

300

25分35秒

018.尚硅谷_Flink-运行时架构_任务调度原理（四）_执行图和任务链

310

12分20秒

019.尚硅谷_Flink-运行时架构_任务调度原理（五）_自定义任务调度规则

350

16分18秒

020.尚硅谷_Flink-流处理API_Source（一）_从集合和文件读取数据

380

21分32秒

021.尚硅谷_Flink-流处理API_Source（二）_从Kafka读取数据

430

24分49秒

022.尚硅谷_Flink-流处理API_Source（三）_自定义Source

410

6分49秒

023.尚硅谷_Flink-流处理API_Transform（一）_简单转换算子

320

19分15秒

024.尚硅谷_Flink-流处理API_Transform（二）_简单分组聚合

380

11分20秒

025.尚硅谷_Flink-流处理API_Transform（三）_reduce聚合

320

12分23秒

026.尚硅谷_Flink-流处理API_Transform（四）_分流操作

350

19分54秒

027.尚硅谷_Flink-流处理API_Transform（五）_合流操作

290

9分39秒

028.尚硅谷_Flink-流处理API_Flink支持的数据类型

420

19分40秒

029.尚硅谷_Flink-流处理API_函数类和富函数类

280

18分54秒

030.尚硅谷_Flink-流处理API_Sink（一）_文件

410

10分44秒

031.尚硅谷_Flink-流处理API_Sink（二）_Kafka

430

18分29秒

032.尚硅谷_Flink-流处理API_Sink（三）_Redis

360

16分42秒

033.尚硅谷_Flink-流处理API_Sink（四）_ElasticSearch

350

17分47秒

034.尚硅谷_Flink-流处理API_Sink（五）_MySQL

480

7分21秒

035.尚硅谷_Flink-流处理API_Window API_窗口概念

360

10分12秒

036.尚硅谷_Flink-流处理API_Window API_窗口类型

330

27分16秒

037.尚硅谷_Flink-流处理API_Window API_窗口分配器

450

20分59秒

038.尚硅谷_Flink-流处理API_Window API_窗口函数及其它可选API

410

15分5秒

039.尚硅谷_Flink-流处理API_Window API_窗口计算测试

270

17分56秒

040.尚硅谷_Flink-时间语义

300

4分32秒

041.尚硅谷_Flink-时间语义的设置

350

19分5秒

042.尚硅谷_Flink-Watermark概念

370

15分56秒

043.尚硅谷_Flink-Watermark原理和特点

320

8分7秒

044.尚硅谷_Flink-Watermark传递

260

16分32秒

045.尚硅谷_Flink-Watermark代码中引入

290

7分8秒

046.尚硅谷_Flink-自定义Watermark生成机制

290

16分10秒

047.尚硅谷_Flink-事件时间语义下的窗口测试

360

9分20秒

048.尚硅谷_Flink-窗口起始点的确定

360

8分7秒

049.尚硅谷_Flink-状态管理（一）_状态的概念

400

15分13秒

050.尚硅谷_Flink-状态管理（二）_算子状态和键控状态

290

27分24秒

051.尚硅谷_Flink-状态管理（三）_状态在代码中的定义和使用

340

17分14秒

052.尚硅谷_Flink-状态编程示例（一）

380

17分29秒

053.尚硅谷_Flink-状态编程示例（二）

410

23分23秒

054.尚硅谷_Flink-ProcessFuntion_基本概念和使用

360

32分49秒

055.尚硅谷_Flink-ProcessFuntion_定时器应用示例

320

9分44秒

056.尚硅谷_Flink-ProcessFuntion_侧输出流应用示例

360

15分35秒

057.尚硅谷_Flink-状态后端

390

13分30秒

058.尚硅谷_Flink-容错机制_检查点概念和原理

280

25分45秒

059.尚硅谷_Flink-容错机制_检查点算法

380

26分28秒

060.尚硅谷_Flink-容错机制_checkpoint配置

350

8分20秒

061.尚硅谷_Flink-容错机制_重启策略配置

440

7分31秒

062.尚硅谷_Flink-保存点

460

10分45秒

063.尚硅谷_Flink-状态一致性_基本概念

400

8分42秒

064.尚硅谷_Flink-状态一致性_Flink端到端状态一致性的保证

390

23分34秒

065.尚硅谷_Flink-状态一致性_幂等写入和事务写入

410

18分19秒

066.尚硅谷_Flink-状态一致性_Flink与Kafka连接的状态一致性

400

22分2秒

067.尚硅谷_Flink-Table API和Flink SQL_基本概念和示例程序

400

9分21秒

068.尚硅谷_Flink-Table API和Flink SQL_基本程序结构

340

15分42秒

069.尚硅谷_Flink-Table API和Flink SQL_表执行环境

360

19分13秒

070.尚硅谷_Flink-Table API和Flink SQL_表的概念和从文件读取数据

410

9分28秒

071.尚硅谷_Flink-Table API和Flink SQL_从Kafka读取数据

340

11分3秒

072.尚硅谷_Flink-Table API和Flink SQL_表的查询转换

390

8分24秒

073.尚硅谷_Flink-Table API和Flink SQL_DataStream和表的转换

400

25分13秒

074.尚硅谷_Flink-Table API和Flink SQL_输出到文件

320

10分50秒

075.尚硅谷_Flink-Table API和Flink SQL_更新模式

310

17分40秒

076.尚硅谷_Flink-Table API和Flink SQL_Kafka管道测试

380

18分17秒

077.尚硅谷_Flink-Table API和Flink SQL_输出到ES

340

8分8秒

078.尚硅谷_Flink-Table API和Flink SQL_输出到MySQL

390

11分33秒

079.尚硅谷_Flink-Table API和Flink SQL_表转换成流

290

7分6秒

080.尚硅谷_Flink-Table API和Flink SQL_流处理和SQL查询的不同

340

12分23秒

081.尚硅谷_Flink-Table API和Flink SQL_动态表和持续查询

430

12分49秒

082.尚硅谷_Flink-Table API和Flink SQL_持续查询示例具体过程

410

20分15秒

083.尚硅谷_Flink-Table API和Flink SQL_时间特性（一）_处理时间

340

14分15秒

084.尚硅谷_Flink-Table API和Flink SQL_时间特性（二）_事件时间

330

13分10秒

085.尚硅谷_Flink-Table API和Flink SQL_窗口（一）_分组窗口

440

18分42秒

086.尚硅谷_Flink-Table API和Flink SQL_窗口（二）_分组窗口测试

400

11分57秒

087.尚硅谷_Flink-Table API和Flink SQL_窗口（三）_Over窗口

380

13分1秒

088.尚硅谷_Flink-Table API和Flink SQL_窗口（四）_Over窗口测试

340

11分3秒

089.尚硅谷_Flink-Table API和Flink SQL_函数（一）_系统内置函数

310

14分38秒

090.尚硅谷_Flink-Table API和Flink SQL_函数（二）_UDF函数_标量函数

430

17分18秒

091.尚硅谷_Flink-Table API和Flink SQL_函数（三）_UDF函数_表函数

350

26分57秒

092.尚硅谷_Flink-Table API和Flink SQL_函数（四）_UDF函数_聚合函数

410

27分55秒

093.尚硅谷_Flink-Table API和Flink SQL_函数（五）_UDF函数_表聚合函数

370

8分11秒

094.尚硅谷_Flink项目-电商用户行为分析_批处理和流处理以及项目选型

350

15分26秒

095.尚硅谷_Flink项目-电商用户行为分析_用户行为分析应用场景

370

9分11秒

096.尚硅谷_Flink项目-电商用户行为分析_模块设计和数据分析

440

21分2秒

097.尚硅谷_Flink项目-电商用户行为分析_模块需求分析_实时热门商品统计（一）

350

9分6秒

098.尚硅谷_Flink项目-电商用户行为分析_模块需求分析_实时热门商品统计（二）

400

10分2秒

099.尚硅谷_Flink项目-电商用户行为分析_模块需求分析_其它需求

400

100

10分20秒

100.尚硅谷_Flink项目-电商用户行为分析_项目框架搭建

380

101

27分53秒

101.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（一）_窗口聚合

360

102

27分13秒

102.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（二）_排序统计输出

390

103

20分50秒

103.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（三）_从Kafka消费数据测试

450

104

10分2秒

104.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（四）_批量消费Kafka数据测试

480

105

28分42秒

105.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（五）_Table API和SQL实现

350

106

26分5秒

106.尚硅谷_Flink项目-电商用户行为分析_实时热门页面流量统计（一）_开窗聚合统计

250

107

9分46秒

107.尚硅谷_Flink项目-电商用户行为分析_实时热门页面流量统计（二）_统计结果排序输出

350

108

21分3秒

108.尚硅谷_Flink项目-电商用户行为分析_实时热门页面流量统计（三）_乱序数据的处理

420

109

21分40秒

109.尚硅谷_Flink项目-电商用户行为分析_实时热门页面流量统计（四）_保证状态更新结果正确

390

110

20分38秒

110.尚硅谷_Flink项目-电商用户行为分析_PV统计（一）_基本实现

430

111

19分21秒

111.尚硅谷_Flink项目-电商用户行为分析_PV统计（二）_数据并行的优化

320

112

15分27秒

112.尚硅谷_Flink项目-电商用户行为分析_UV统计（一）_基本实现

430

113

30分47秒

113.尚硅谷_Flink项目-电商用户行为分析_UV统计（二）_布隆过滤器去重思路和程序架构

350

114

9分11秒

114.尚硅谷_Flink项目-电商用户行为分析_UV统计（三）_布隆过滤器简单实现

340

115

23分31秒

115.尚硅谷_Flink项目-电商用户行为分析_UV统计（四）_UV去重的布隆过滤器实现

300

116

17分2秒

116.尚硅谷_Flink项目-电商用户行为分析_APP市场推广统计（一）_自定义数据源

480

117

20分43秒

117.尚硅谷_Flink项目-电商用户行为分析_APP市场推广统计（二）_开窗聚合统计输出

320

118

19分18秒

118.尚硅谷_Flink项目-电商用户行为分析_广告点击量统计分析（一）_基本需求实现

310

119

14分27秒

119.尚硅谷_Flink项目-电商用户行为分析_广告点击量统计分析（二）_刷单行为过滤思路和整体框架

380

120

23分19秒

120.尚硅谷_Flink项目-电商用户行为分析_广告点击量统计分析（三）_刷单行为过滤代码实现

360

121

18分16秒

121.尚硅谷_Flink项目-电商用户行为分析_恶意登录检测（一）_实现思路和代码框架

400

122

18分20秒

122.尚硅谷_Flink项目-电商用户行为分析_恶意登录检测（二）_具体代码实现

350

123

18分18秒

123.尚硅谷_Flink项目-电商用户行为分析_恶意登录检测（三）_代码改进

350

124

30分32秒

124.尚硅谷_Flink项目-电商用户行为分析_恶意登录检测（四）_CEP代码实现

330

125

12分22秒

125.尚硅谷_Flink项目-电商用户行为分析_CEP简介（一）_CEP介绍及Pattern API整体概念

390

126

12分40秒

126.尚硅谷_Flink项目-电商用户行为分析_CEP简介（二）_个体模式

300

127

10分22秒

127.尚硅谷_Flink项目-电商用户行为分析_CEP简介（三）_模式序列

390

128

9分49秒

128.尚硅谷_Flink项目-电商用户行为分析_CEP简介（四）_模式的检测和事件处理

380

129

19分49秒

129.尚硅谷_Flink项目-电商用户行为分析_订单超时检测（一）_实现思路和程序架构

340

130

17分28秒

130.尚硅谷_Flink项目-电商用户行为分析_订单超时检测（二）_CEP具体代码实现

440

131

6分41秒

131.尚硅谷_Flink项目-电商用户行为分析_订单超时检测（三）_流式输入数据测试

390

132

32分19秒

132.尚硅谷_Flink项目-电商用户行为分析_订单超时检测（四）_ProcessFunction代码实现

380

133

13分48秒

133.尚硅谷_Flink项目-电商用户行为分析_双流实时对账（一）_需求分析和整体架构

350

134

22分23秒

134.尚硅谷_Flink项目-电商用户行为分析_双流实时对账（二）_合流代码实现

380

135

12分55秒

135.尚硅谷_Flink项目-电商用户行为分析_Join API（一）_Window Join

380

136

9分46秒

136.尚硅谷_Flink项目-电商用户行为分析_Join API（二）_Interval Join

240

137

9分21秒

137.尚硅谷_Flink项目-电商用户行为分析_双流实时对账（三）_Join代码实现

330

040.尚硅谷_Flink-时间语义

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐