文章/答案/技术大牛

发布

首页视频050.尚硅谷_Flink-状态管理（二）_算子状态和键控状态

050.尚硅谷_Flink-状态管理（二）_算子状态和键控状态

2022-12-022022-12-02 16:02:28播放29

点赞0 收藏 0

尚硅谷大数学科--选学技术丰富/尚硅谷Flink从入门到实战（scala版）/视频/050.尚硅谷_Flink-状态管理（二）_算子状态和键控状态.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
好，那我们已经知道flink里边状态是什么了，那接下来呢，我们就来分分类，看看这个状态的具体表现形式是什么样的啊，那其实对于flink而言啊，状态大家注意状态这个看起来像是flink自己存着的一个数据，对吧？哎，那这个数据它到底是谁存着的呢？它就是某一个任务存着的，保存着的，所以说每一个状态它必须是跟特定的任务或者说特定的算子关联在一起的，就是我们在代码里边定义的那每一步操作对吧？它在里边有自己的一个状态，状态始终是跟它关联在一起啊，那我们如果要是说在使用的过程当中啊，你如果代码里边想要用到运行的过程当中，想要用到这个状态的话，哎，那大家想这个是不是flink，得知道你当前的这个状态，到底在我的这个内存管理机制里边，它的位置在哪里，然后它的类型是什么，对吧，我得明确的能够找到。
01:00
啊，然后也知道它的类型，应用我的这个底层的状态管理机制，把它做这个序列化，反序列化对吧？做读取写入啊，这样就可以用这个了，所以说在我们做这个状态使用的时候呢，必须算子需要先去在啊环境里面，相当于先要注册一下这个状态啊这怎么说这个注册状态呢？呃，后面我们在代码里边给大家看一眼就知道了，其实就是要相当于把这个状态定义出来，获取一下，在运营师环境里边获取一下这个状态的控制句柄，对吧，具体来讲就是给一个这个状态具体给一个名，然后呢，呃，就是在运行运行时上下文里边对吧？呃，给一个具体的名儿，然后呢，给它的具体的数据类型也要定义出来，这样弗link就能准确的找到，而且知道该怎么做了，对吧，指导类型的话，就知道内存里边怎么操作了嘛，啊那具体来分的话，Flink里边有两种类型的状态，一种叫做operator state算子状态，另外。
02:00
这种叫做k set，就是我们所说的分组的监控的状态，从字面上理解，呃，这个一看这种分配，这就是什么k set肯定就是KBY之后，对吧？啊，我们在那个已经有了键的定义之后啊，已经分组之后的那个流里边，你要再去定义状态的话，那应该就是一个k state了啊，那如果说我们是一般化的，你没有分组直接去定义状态的话，那就是operator state对吧？啊，所以这里边大家看算子状态啊，这个operator state它的这个状态的作用范围。大家可以认为是类似于那个变量的作用域对吧？哈，是是什么样的一个作用范围呢？啊，有同学说你作用域嘛，那不就是它自己定义的那个我们在代码里边对吧？一个代码块你定义在哪里，它它它就是作用在哪里呢？注意啊，现在这个状态可不一样，我们状态在代码里边的定义，那可是一个我们现在运行的时候是一个分布式架构，对吧？那你当时定义的时候，其实只是代码里边对它的一个说明而已，具体我们任务执行的过程当中，它是一个分布式执行的，哎，所以说接下来我们同一个任务，如果啊，有好几个这个并行子任务的话，那你会想到那是不是具体我们当前的这个状态，每一个并行的这个子任务里边都会有这么一块啊，就是有有这么一块内存去去存这个东西啊，对吧，它们互相之间这个其实是互相无法访问的，对吧。
03:27
呃，就除非是后面我们讲到有一种特殊的状态叫广播状态，对吧，你把这个所有的都统一成一样的啊，那正常情况下他们互相之间是不同的啊，那这里面就还会有一个问题，之前我们说过，在每一个并行的这个算子任务里边，假如说我们不做这个分分组啊，不做K败的话，那是不是相当于就是所有的数据，当前这个分区里边所有的数据来了之后，我当前任务访问都是同一块内存啊啊，所以现在啊，算子任务就是这样的，它的限限定范围是什么呢？就是当前的并行的这个算子任务，也就是说当前所有的数据来了之后，都能访问到同样的状态。
04:09
而这个k states呢，它指的就是说针对每一个K来做访问和维护，当前它的访问范围呢，就只是当前K，你就算是在同一个分区里边，之前我们不是说同一个分区有可能有不同的K吗？对吧？你即使在同一个分区里边，大家也可以认为按照K又相当于把这个内存做了一个划分，做了一个隔离啊，就相当于还是不同的K访问不同的状态，对吧？只访问自己的就OK了，好，那自然大家就能想到，实际应用的过程当中，我们要做开窗，要做聚合，都得先K，对吧？然后你接下来你要考虑的状态，那往往也都是跟分组相关，你你都是分了组之后讨论的，你不会讨论所有的对吧？啊，那所以我们也是一般应用的就是k state，这个更常用一点，后面我我们也是主要以介绍它为主啊好，那我们具体来讲的话，算子状态大家看这个图应该就会很明确了，我们这里边有两个并行的子任务啊，就是都。
05:09
都是TASK1对吧，这里边是它并行任务一，并行任务二啊，这样把它并行列在这里，然后数据呢，分别进入这两个并行的子任务，大家就会看到了每一个任务，如果我们当前这个当前这个算子啊，定义了一个状态的话，比方说这里边是一个reduce操作对吧？啊，那肯定就得有状态了，或者说我们一个命明白操作，你你这个状态是什么？就是我们要保存之前所有数据的最小值嘛，那这个最小值是谁的最小值呢？大家注意啊，当前就是只是当前所有我这一个分区，当前这个并行子任务接收到的所有任务的一个所有数据的一个最小值，因为大家看这里边所有数据，它都能够访问这个同样的状态，对吧？它这里边只是访问这这同一份状态而已，所以呢，状态对于我们同一个子任务而言，里边的所有数据而言是共享的。
06:05
而这里边他的这一份状态呢，跟另外一个并行的子任务而言，这个是隔离开的，对吧，因为他都跨了slot了嘛，甚至是跨了task manager了，你当然这两这两个它是不能直接去访问的啊呃，你你要做访问肯定是要做这个序列化对吧，要要做其他的这些传输了，有网络传输才能才能去访问的，所以大家要注意啊，算子状态是这样的一个作用域，那另外呢，呃，这里边再给大家说一下算子状态具体来定义，还有不同的，就是具体来讲还有不同的算子状态的这个类型啊，那首先大家看到啊，一个最基本的或者说最常见的算子状态类型是什么呢？就是list state列表状态，它的含义就是说把我们这里边所有的状态保存成一组数据的列表，对吧，就是所有的状态没关系，你都来了之后都往里放吧，我就是把它存成了一个列表而已啊，所以后边大家会想到啊，你要是想要去做调整的时候也就简单对吧？呃，你这个保存。
07:05
这时候怎么样呢？把列表再拼起来保存不就完了吗？呃，就是像我们后面讲那个要保存checkpoint，你要做容错容错管理的时候，那就把不同的那个这个片段拼起来就完事了啊，那后面你如果要是想要做这个恢复，假如定行度又调整了，原先是两部分，现在变成三三部分了，那后面是不是我还要再把那个list的再拆开，对吧？相当于你定义这样一个list的，呃，分配操作就完了，所以大家看这里面这个状态为什么要定义成一个列表呢？就是方便后续的我们这个调整管理，但是大家看到你这里边其实就没有那种更加灵活更加呃复杂的那种操作，对吧？它只有列表，那你说我想做一个map操作可以吗？我定义成键值对可以吗？啊，这里边没有，你就只能在列表里面自己再去定义了，对吧？啊，这个就就那么复杂了，它本身是不支持的啊，那除了这个列列表状态还有什么呢？啊，还有的其实也差不多，还有一种状态叫做联合列表状态，它基本上跟这个列表状态一模一样，它主要。
08:05
差别在哪呢？就在于故障恢复的时候怎么恢复啊，就是列表状态这边我们要是故障恢复的时候，我们说是直接把那个哎保存的时候拼起来对吧？呃，然后这个最后我们要去恢复的时候再把它打散啊就就就完了，如果说这个联合列表状态是什么呢？哎，它不是这样的，它在做这个故障恢复的时候，是把我们之前每一个呃，这个并行算子任务的这个这个状态相当于都保持了一份，对吧？然后接下来呢，把这个状态它是要动态的做一个重新调整联合列表状态嘛，就是最后再调整的时候，把这个状态所有的状态合起来，就相当于都要复制一份，然后我再调整，有点有点这个意思啊啊，这个用的比较少，大家大概就知道就可以了啊，那后面还有一个状态是广播状态，这广播状态的话就更好理解了，那就是说如果说当前我们这个有多个并行子任务，然后这个每个并行子任务我们这里边保持的。
09:05
这份状态里边的内容要求它都完全一样啊，那这种状态这是什么状态呢？这就是所谓的这里所谓的这个广播状态了啊，这种广播状态就是呃，它只应用在这个比较特殊的特定的这种场景，就是说我们当前命行子任务里边要用到的这个数，它是完全一样的，对吧？啊就比方说这主主要用在什么场景呢？可能这是类似于一个配置项，对吧？啊，那这个配置项大家可能就会想到，那你这个配置项何必要这么做呢？我直接从这个外部这个配置文件里边去读也是一样的呀，啊，对吧？啊，这个就是看具体情况啊，就是有哪种情况呢？就是假如说我们当前的这个配置项，它又是一个动态，比方说从一个流里边读取出来的动态配置数据，然后我们还想把它结合在当前的这个，呃，就是存盘，呃，状态保存这个机制，要把它结合进来，就是你故障恢复的时候，还要把动态的这个这个当前的这个。
10:05
呃，配置项也得也得恢复出来对吧，就假如说有这种特别需求的时候，这个可能是需要去用到广播状态的，一般情况我们肯定用不到对吧，因为你配置项都是固定的嘛，我们其实就是直接你从配置文件读，难道这个不简单吗？非常简单，因为它固定读进来就完事了，也不需要去去做保存对吧，都已经在文字文件里面写好了，只有在这种比较就是特定的场景下才会用到广播状态。啊，那另外还有一种就是监控状态了啊，控状态我们说说它其实就是K之后，大家看前面K基于哈希扣的重分区了，对吧？然后在后边的这个操作里边，假如说是我们K之后做的这个，呃呃，做了一个reduce啊呃，那接下来这里边我们做了一个这个聚合操作，那他的这个状态是要找谁的呢？注意我们之前K之后并没有考虑他的，他那个状态会把不同的那个三合并起来对吧？那都是当前ID，当前的这个传感器，只是找自己传感器温度最小的那个值啊，那所以这个过程其实是对每一个K都保存了一个自己的状态，所以大家看到我当前这个task啊，并行这个子任务，那经过K外之后这个哈西克重分区，可能这个，呃，这个粉色的，或者说这个蓝色的这个数据它来了之后，不同的K啊，都是在这个分区里边的，那这怎么办呢？针对每一个K都要保存一份自己独有。
11:32
的状态对吧？啊，那这个相当于是给它有一个隔离的这个内存空间了啊啊，那所以说这里边就是说我们相当于是为每一个K维护了一个状态实例，然后呢啊，具有相同键的所有数据可以共享这个状态，访问这个状态不同K的数据呢，即使在同一个slot里边，同一个task里边，分区里边，对吧？呃，并行任务里边也不能访问啊，所以说这个就隔离的会比较啊比较好，我们在做实际操作的时候呢，你一般做做聚合，做开窗，你都要先KY嘛，那接下来你当然就是按照这个我们把它划分清楚，你直接这个按照当前K去定义状态不就完了吗？啊所以一般用到的状态都是K的state啊，那后面我们就以这个为主要内容给大家做讲解啊，那k state底层它可以有，就是具体来讲又有什么样的一些具体的类型定义呢？主要有这么几种，哎，大家看这个比呃，Operator state。
12:32
就就丰富多了啊，因为确实operator state用的也比较少，我们这里边用的啊，你看可以直接定义直状态，哎，直状态这个就很好理解，Value state嘛，就是什么呢？我就要保存一个数，然后你那边还要给我说保存成什么列表，对吧，太麻烦了，我就要保存一个数而已啊，所以这里边我就可以直接保存一个value state，就把一个数存进来。完全可以的，那另外还有什么呢？当然还有列表状态，对吧？跟那个operator state一样，把一组数保存成一个列表，那接下来我这个读取和这个做checkpoint保存的时候，它就都是一个列表，然后另外还有所谓的map，它就是一个映射状态，就前面我们说的，假如说我想保存键值对怎么办呢？哎，没问题，我定义一个map set里边，它的这个保存形式就是一个K一个value，一个K一个value啊，那那这样的话就就完全没问题了，是吧？就看起来就我们想要用到的这个数据结构，一些集合类型，该用到的也都有了。另外它还有一种更加方便，或者说呃，更加呃，就是用途更广的一种状态，叫做聚合状态，这个状态叫什么呢？它就叫做reducing state和aggregating state，这两种状态又是什么意思呢？之前我们不是讲过增量聚合函数的时候有reduce function和aggregate function吗？啊，对吧，那那那个其实是。
13:54
Flink API底层common里边给我们提供的一个聚合函数，那这里边的这个reducing state和aggreating state，它的含义就是什么呢？就是相当于把数据直接保存，可以保存一个什么呢？保存一个聚合状态啊，当然了，你也可以就是说把它保存成一个列表对吧？啊，那往往我们最后其实就是只是把它保存成了一个状态而已，所以之前我们这个比方说直状态你要保存的时候啊，就是存一个数进来对吧？来了一个新数，存一个数，列表状态呢，来了一个新数，追加到这个列表后面，呃，加上一个数对吧？啊，那这个映射状态map state，如果说你来了数之我判断那个K，如果有的话更新对吧，没有的话KY6对放进去，哎，那这个聚合状态就特殊一点，它是来了一个数之后呢，就相当于直接调用了一下我们的那个reduce function或者ggrereate function，直接在之前聚合的基础上直接做聚合，直接叠加了，然后。
14:54
最后我就只保持一个聚合结果就完了啊，所以大家也会想到，那我们之前你做的那些reduce操作对吧？呃，包括我们那个萨呃命max，它底层是什么呢？底层其实就是这样的一个状态，对吧，一个聚合状态。
15:12
好。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷Flink从入门到实战（scala版）

（50/137）

10分49秒

001.尚硅谷_Flink-Flink简介

510

19分45秒

002.尚硅谷_Flink-Flink应用场景

480

11分3秒

003.尚硅谷_Flink-流式处理的提出

380

15分16秒

004.尚硅谷_Flink-流式处理的演变

350

16分33秒

005.尚硅谷_Flink-Flink的特点

340

23分57秒

006.尚硅谷_Flink-批处理wordcount

520

20分13秒

007.尚硅谷_Flink-流处理wordcount

380

19分14秒

008.尚硅谷_Flink-流处理wordcount扩展测试和说明

410

26分46秒

009.尚硅谷_Flink-Flink集群部署

470

22分34秒

010.尚硅谷_Flink-提交Job

400

7分30秒

011.尚硅谷_Flink-命令行提交Job

350

12分50秒

012.尚硅谷_Flink-其它方式集群部署

360

8分35秒

013.尚硅谷_Flink-运行时架构_运行时组件

390

13分22秒

014.尚硅谷_Flink-运行时架构_作业提交流程

430

16分27秒

015.尚硅谷_Flink-运行时架构_任务调度原理（一）_并行度和slot

360

17分22秒

016.尚硅谷_Flink-运行时架构_任务调度原理（二）_slot共享

470

6分15秒

017.尚硅谷_Flink-运行时架构_任务调度原理（三）_slot共享示例

300

25分35秒

018.尚硅谷_Flink-运行时架构_任务调度原理（四）_执行图和任务链

310

12分20秒

019.尚硅谷_Flink-运行时架构_任务调度原理（五）_自定义任务调度规则

350

16分18秒

020.尚硅谷_Flink-流处理API_Source（一）_从集合和文件读取数据

380

21分32秒

021.尚硅谷_Flink-流处理API_Source（二）_从Kafka读取数据

430

24分49秒

022.尚硅谷_Flink-流处理API_Source（三）_自定义Source

410

6分49秒

023.尚硅谷_Flink-流处理API_Transform（一）_简单转换算子

320

19分15秒

024.尚硅谷_Flink-流处理API_Transform（二）_简单分组聚合

380

11分20秒

025.尚硅谷_Flink-流处理API_Transform（三）_reduce聚合

320

12分23秒

026.尚硅谷_Flink-流处理API_Transform（四）_分流操作

350

19分54秒

027.尚硅谷_Flink-流处理API_Transform（五）_合流操作

290

9分39秒

028.尚硅谷_Flink-流处理API_Flink支持的数据类型

420

19分40秒

029.尚硅谷_Flink-流处理API_函数类和富函数类

280

18分54秒

030.尚硅谷_Flink-流处理API_Sink（一）_文件

410

10分44秒

031.尚硅谷_Flink-流处理API_Sink（二）_Kafka

430

18分29秒

032.尚硅谷_Flink-流处理API_Sink（三）_Redis

360

16分42秒

033.尚硅谷_Flink-流处理API_Sink（四）_ElasticSearch

350

17分47秒

034.尚硅谷_Flink-流处理API_Sink（五）_MySQL

480

7分21秒

035.尚硅谷_Flink-流处理API_Window API_窗口概念

360

10分12秒

036.尚硅谷_Flink-流处理API_Window API_窗口类型

330

27分16秒

037.尚硅谷_Flink-流处理API_Window API_窗口分配器

450

20分59秒

038.尚硅谷_Flink-流处理API_Window API_窗口函数及其它可选API

410

15分5秒

039.尚硅谷_Flink-流处理API_Window API_窗口计算测试

270

17分56秒

040.尚硅谷_Flink-时间语义

300

4分32秒

041.尚硅谷_Flink-时间语义的设置

350

19分5秒

042.尚硅谷_Flink-Watermark概念

370

15分56秒

043.尚硅谷_Flink-Watermark原理和特点

320

8分7秒

044.尚硅谷_Flink-Watermark传递

260

16分32秒

045.尚硅谷_Flink-Watermark代码中引入

290

7分8秒

046.尚硅谷_Flink-自定义Watermark生成机制

290

16分10秒

047.尚硅谷_Flink-事件时间语义下的窗口测试

360

9分20秒

048.尚硅谷_Flink-窗口起始点的确定

360

8分7秒

049.尚硅谷_Flink-状态管理（一）_状态的概念

400

15分13秒

050.尚硅谷_Flink-状态管理（二）_算子状态和键控状态

290

27分24秒

051.尚硅谷_Flink-状态管理（三）_状态在代码中的定义和使用

340

17分14秒

052.尚硅谷_Flink-状态编程示例（一）

380

17分29秒

053.尚硅谷_Flink-状态编程示例（二）

410

23分23秒

054.尚硅谷_Flink-ProcessFuntion_基本概念和使用

360

32分49秒

055.尚硅谷_Flink-ProcessFuntion_定时器应用示例

320

9分44秒

056.尚硅谷_Flink-ProcessFuntion_侧输出流应用示例

360

15分35秒

057.尚硅谷_Flink-状态后端

390

13分30秒

058.尚硅谷_Flink-容错机制_检查点概念和原理

280

25分45秒

059.尚硅谷_Flink-容错机制_检查点算法

380

26分28秒

060.尚硅谷_Flink-容错机制_checkpoint配置

350

8分20秒

061.尚硅谷_Flink-容错机制_重启策略配置

440

7分31秒

062.尚硅谷_Flink-保存点

460

10分45秒

063.尚硅谷_Flink-状态一致性_基本概念

400

8分42秒

064.尚硅谷_Flink-状态一致性_Flink端到端状态一致性的保证

390

23分34秒

065.尚硅谷_Flink-状态一致性_幂等写入和事务写入

410

18分19秒

066.尚硅谷_Flink-状态一致性_Flink与Kafka连接的状态一致性

400

22分2秒

067.尚硅谷_Flink-Table API和Flink SQL_基本概念和示例程序

400

9分21秒

068.尚硅谷_Flink-Table API和Flink SQL_基本程序结构

340

15分42秒

069.尚硅谷_Flink-Table API和Flink SQL_表执行环境

360

19分13秒

070.尚硅谷_Flink-Table API和Flink SQL_表的概念和从文件读取数据

410

9分28秒

071.尚硅谷_Flink-Table API和Flink SQL_从Kafka读取数据

340

11分3秒

072.尚硅谷_Flink-Table API和Flink SQL_表的查询转换

390

8分24秒

073.尚硅谷_Flink-Table API和Flink SQL_DataStream和表的转换

400

25分13秒

074.尚硅谷_Flink-Table API和Flink SQL_输出到文件

320

10分50秒

075.尚硅谷_Flink-Table API和Flink SQL_更新模式

310

17分40秒

076.尚硅谷_Flink-Table API和Flink SQL_Kafka管道测试

380

18分17秒

077.尚硅谷_Flink-Table API和Flink SQL_输出到ES

340

8分8秒

078.尚硅谷_Flink-Table API和Flink SQL_输出到MySQL

390

11分33秒

079.尚硅谷_Flink-Table API和Flink SQL_表转换成流

290

7分6秒

080.尚硅谷_Flink-Table API和Flink SQL_流处理和SQL查询的不同

340

12分23秒

081.尚硅谷_Flink-Table API和Flink SQL_动态表和持续查询

430

12分49秒

082.尚硅谷_Flink-Table API和Flink SQL_持续查询示例具体过程

410

20分15秒

083.尚硅谷_Flink-Table API和Flink SQL_时间特性（一）_处理时间

340

14分15秒

084.尚硅谷_Flink-Table API和Flink SQL_时间特性（二）_事件时间

330

13分10秒

085.尚硅谷_Flink-Table API和Flink SQL_窗口（一）_分组窗口

440

18分42秒

086.尚硅谷_Flink-Table API和Flink SQL_窗口（二）_分组窗口测试

400

11分57秒

087.尚硅谷_Flink-Table API和Flink SQL_窗口（三）_Over窗口

380

13分1秒

088.尚硅谷_Flink-Table API和Flink SQL_窗口（四）_Over窗口测试

340

11分3秒

089.尚硅谷_Flink-Table API和Flink SQL_函数（一）_系统内置函数

310

14分38秒

090.尚硅谷_Flink-Table API和Flink SQL_函数（二）_UDF函数_标量函数

430

17分18秒

091.尚硅谷_Flink-Table API和Flink SQL_函数（三）_UDF函数_表函数

350

26分57秒

092.尚硅谷_Flink-Table API和Flink SQL_函数（四）_UDF函数_聚合函数

410

27分55秒

093.尚硅谷_Flink-Table API和Flink SQL_函数（五）_UDF函数_表聚合函数

370

8分11秒

094.尚硅谷_Flink项目-电商用户行为分析_批处理和流处理以及项目选型

350

15分26秒

095.尚硅谷_Flink项目-电商用户行为分析_用户行为分析应用场景

370

9分11秒

096.尚硅谷_Flink项目-电商用户行为分析_模块设计和数据分析

440

21分2秒

097.尚硅谷_Flink项目-电商用户行为分析_模块需求分析_实时热门商品统计（一）

350

9分6秒

098.尚硅谷_Flink项目-电商用户行为分析_模块需求分析_实时热门商品统计（二）

400

10分2秒

099.尚硅谷_Flink项目-电商用户行为分析_模块需求分析_其它需求

400

100

10分20秒

100.尚硅谷_Flink项目-电商用户行为分析_项目框架搭建

380

101

27分53秒

101.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（一）_窗口聚合

360

102

27分13秒

102.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（二）_排序统计输出

390

103

20分50秒

103.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（三）_从Kafka消费数据测试

450

104

10分2秒

104.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（四）_批量消费Kafka数据测试

480

105

28分42秒

105.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（五）_Table API和SQL实现

350

106

26分5秒

106.尚硅谷_Flink项目-电商用户行为分析_实时热门页面流量统计（一）_开窗聚合统计

250

107

9分46秒

107.尚硅谷_Flink项目-电商用户行为分析_实时热门页面流量统计（二）_统计结果排序输出

350

108

21分3秒

108.尚硅谷_Flink项目-电商用户行为分析_实时热门页面流量统计（三）_乱序数据的处理

420

109

21分40秒

109.尚硅谷_Flink项目-电商用户行为分析_实时热门页面流量统计（四）_保证状态更新结果正确

390

110

20分38秒

110.尚硅谷_Flink项目-电商用户行为分析_PV统计（一）_基本实现

430

111

19分21秒

111.尚硅谷_Flink项目-电商用户行为分析_PV统计（二）_数据并行的优化

320

112

15分27秒

112.尚硅谷_Flink项目-电商用户行为分析_UV统计（一）_基本实现

430

113

30分47秒

113.尚硅谷_Flink项目-电商用户行为分析_UV统计（二）_布隆过滤器去重思路和程序架构

350

114

9分11秒

114.尚硅谷_Flink项目-电商用户行为分析_UV统计（三）_布隆过滤器简单实现

340

115

23分31秒

115.尚硅谷_Flink项目-电商用户行为分析_UV统计（四）_UV去重的布隆过滤器实现

300

116

17分2秒

116.尚硅谷_Flink项目-电商用户行为分析_APP市场推广统计（一）_自定义数据源

480

117

20分43秒

117.尚硅谷_Flink项目-电商用户行为分析_APP市场推广统计（二）_开窗聚合统计输出

320

118

19分18秒

118.尚硅谷_Flink项目-电商用户行为分析_广告点击量统计分析（一）_基本需求实现

310

119

14分27秒

119.尚硅谷_Flink项目-电商用户行为分析_广告点击量统计分析（二）_刷单行为过滤思路和整体框架

380

120

23分19秒

120.尚硅谷_Flink项目-电商用户行为分析_广告点击量统计分析（三）_刷单行为过滤代码实现

360

121

18分16秒

121.尚硅谷_Flink项目-电商用户行为分析_恶意登录检测（一）_实现思路和代码框架

400

122

18分20秒

122.尚硅谷_Flink项目-电商用户行为分析_恶意登录检测（二）_具体代码实现

350

123

18分18秒

123.尚硅谷_Flink项目-电商用户行为分析_恶意登录检测（三）_代码改进

350

124

30分32秒

124.尚硅谷_Flink项目-电商用户行为分析_恶意登录检测（四）_CEP代码实现

330

125

12分22秒

125.尚硅谷_Flink项目-电商用户行为分析_CEP简介（一）_CEP介绍及Pattern API整体概念

390

126

12分40秒

126.尚硅谷_Flink项目-电商用户行为分析_CEP简介（二）_个体模式

300

127

10分22秒

127.尚硅谷_Flink项目-电商用户行为分析_CEP简介（三）_模式序列

390

128

9分49秒

128.尚硅谷_Flink项目-电商用户行为分析_CEP简介（四）_模式的检测和事件处理

380

129

19分49秒

129.尚硅谷_Flink项目-电商用户行为分析_订单超时检测（一）_实现思路和程序架构

340

130

17分28秒

130.尚硅谷_Flink项目-电商用户行为分析_订单超时检测（二）_CEP具体代码实现

440

131

6分41秒

131.尚硅谷_Flink项目-电商用户行为分析_订单超时检测（三）_流式输入数据测试

390

132

32分19秒

132.尚硅谷_Flink项目-电商用户行为分析_订单超时检测（四）_ProcessFunction代码实现

380

133

13分48秒

133.尚硅谷_Flink项目-电商用户行为分析_双流实时对账（一）_需求分析和整体架构

350

134

22分23秒

134.尚硅谷_Flink项目-电商用户行为分析_双流实时对账（二）_合流代码实现

380

135

12分55秒

135.尚硅谷_Flink项目-电商用户行为分析_Join API（一）_Window Join

380

136

9分46秒

136.尚硅谷_Flink项目-电商用户行为分析_Join API（二）_Interval Join

240

137

9分21秒

137.尚硅谷_Flink项目-电商用户行为分析_双流实时对账（三）_Join代码实现

330

050.尚硅谷_Flink-状态管理（二）_算子状态和键控状态

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐