文章/答案/技术大牛

发布

首页视频086_第七章_处理函数（五）_Top N（一）_使用ProcessAllWindowFunction（一）_基本思路

086_第七章_处理函数（五）_Top N（一）_使用ProcessAllWindowFunction（一）_基本思路

2022-12-022022-12-02 16:02:17播放35

点赞0 收藏 0

2.尚硅谷大数据学科--核心框架/尚硅谷大数据技术之2022版Flink1.13（Java版）/视频/086_第七章_处理函数（五）_Top N（一）_使用ProcessAllWindowFunction（一）_基本思路.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
我们来看一个实际当中非常常见的应用案例，那就是top n啊，这个top n其实在电商网站里边，各个网站里边都经常使用，比如说现在我们的需求就是统计一段时间内的热门URL啊，这个说是热门URL，其实就是热门页面嘛，看哪个页面被访问的次数最多，比方说我们现在具体需求就是统计最近十秒钟之内。最热门的两个URL链接两个页面，然后每五秒钟更新一次。通过这个需求描述，这应该用什么东西来实现呢？这个需求很简单，那我就是统计这段时间内URL被点击的次数嘛，而且这里说的是统计最近十秒钟内的，那大家想这是不是应该是一个窗口啊？哎，我就开一个十秒钟窗口不就可以了吗？然后每五秒钟要更新一次，什么意思？也就是说我应该是每五秒钟就会输出。
01:01
过去十秒钟之内的最热门的两个页面的访问的次数，哎，所以大家看，如果画出这个窗口的话，那就是十秒钟一个窗口，然后隔五秒之后又一个窗口出现了。统计一个，又隔五秒之后，又一个窗口出现了，统计一次，大家看，这不就是一个典型的。滑动窗口吗？长度为十秒滑动不长为五秒的滑动窗口啊，所以通过当前的这个分析啊，一眼就能看出来用什么API去解决这个问题啊，那这里边我们这个统计十秒钟内，然后五秒钟更新一次，这个显然不是一个实际需求，我们这里是方便做测试，你如果要是实际的话，统计一天统计一个小时，我们这数据量可能要求都很大啊，你测试会非常的麻烦，所以我们这里边就还是以十秒钟为例讲解一下。其实前面我们该做的这个事情也已经做了一部分，比如说还记得我们统计过一个URL view count啊，我们包装了这样的一个po类，然后做了一个这个URL count的example，当时我们做的操作其实就是统计一段时间内十秒钟窗口，当然这个是个滚动窗口啊，统计这个滚动窗口十秒钟内的。
02:17
每个URL的访问量，现在是不是也要统计每个URL的访问量啊，你要统计热门URL嘛，那是不是要按照它的访问量排序啊。哎，所以现在我们的核心需求其实是要统计出每个URL的访问量。然后还要把它收集起来做一个排序。这个问题就稍微有点麻烦了啊，前面的这个访问量很简单，我们前面这个代码都已经搞定了，那如果说还要收集起来排序的话，接下来该怎么做呢？啊，那为了理解的更加透彻，我们直接新建一个代码，然后把前做过的这个再来重复一遍吧。
03:00
Open example。好，我们这个给大家完整的做一个书写啊，Main方法throws exception。然后下边首先要创建一个执行环境，Execution environment at。叫做烟V。我们直接把全局的并行度设成一，方便控制台打印输出啊，测试的时候方便一点，然后接下来，哎，那当然就是提取数据了，读取数据，这里边就还用那个click sourcece吧，ADD the source啊，你一个click source经典的测试数据源，然后后边呢，ADD了数据之后，直接ign time stamp and watermarks，直接把对应的automark strategy写进来，但这里边可以用bounded out of orderness乱序，也可以直接用升序，对不对，因为呃，我们这个click s直接就是声序列过来的嘛，啊，所以那为了一般话的话，我们还是一个这个乱序吧，这边给一个duration啊，因为即使是定义了乱句，我也可以直接给一个zero。
04:06
然后表示当前没有延迟啊，这跟升序是一模一样的啊，你知道所谓的没有延迟就是减一，相当于是一毫秒，然后接下来breath time sta a signer，然后我们这里边你有一个the lizable，呃，Time sta signer，大家看到这里边是object没有自动给我们补全它，因为我们这儿没有给这个对应的泛型，给了之后那就可以自动补全了啊，那接下来我们这里返回的当然是element r time3先把这个先分出来嘛。好，这里完成之后，就是我们一开始输入的stream。好，最下边的env execute我们先写出来去执行，那中间就是物理转换的过程了，我们知道一开始想要做的肯定是先去把这个URL分组，然后统计它们分别的个数，哎，所以这里边其实就是第一步嘛。
05:02
第一步，我们是按照URL分组。统计窗口内，我们是按这个时间窗口来统计的啊，窗口内每个URL的访问量。这就跟之前做的一样了啊，我们这个就是stream r，先按照URL分组，那当然是K了，用贝塔的URL做一个分组。走之后开窗，我们当前要的是一个滑动窗口，所以是tbling time Windows of2个参数，一个time second10。另一个TIMES5。就是我们定义的滑动窗口对吧。哦，这里写错了啊，我们应该写那个滑动啊。之前我们用的是滚动，现在我们用的是滑动，然后接下来当然就是要去做聚合了，我们之前已经非常熟悉啊，这个聚合的过程其实就是来一个加一，来一个加一嘛，然后最后的结果我们包装成一个URL view count啊，带着时间窗口的对应的那些信息，然后方便我们后面做排序嘛，因为大家想你最后出来的数据它是一连串啊，诶它本身这个数据不分窗口的，那你如果要是不带窗口信息的话，后边我收集它怎么知道。
06:24
哪些数据属于哪个窗口，大家知道，不同窗口的数据你是不能混在一起排序的，对吧？哎，所以你不能统一的把它做排序啊，还是要把这个按照窗口去做一个分组的，所以接下来我们这里边就还是aggregate前面一个增量聚合函数，前面都已经实现了URL view count agg，这这里已经有的话，干脆我们直接用吧，直接可以调URL count count view example里边直线的这一个过程其实非常简单，就是拟一个长整型的累加器，来一个加一，来一个加一啊，太简单了。然后下边的这个URL view count result呢，也非常简单，就是统计出来的那个结果，把它拿出来，然后呃，包装这个我们当前窗口的start and，把它放到这个view count里边不就完了吗？URL。
07:17
Will result，好，这样的话我们就搞定了这一步。目前我们做完了聚合之后，这个我们叫URL count stream，给一个给一个可读性更强的一个名字。啊，然后为了让大家看的清楚一点，我们在这儿啊打印一下ul stream。这个就是UIL。那现在的关键就在于第二步。第二步我们要。位于同一窗口统计出的。访问量并行收集和排序，还要输出TOP2。
08:05
那这里面的问题就在于接下来这个怎么收集呢？诶，那你就还是再去开窗吧，再开一个十秒钟长度，然后每隔五秒去滑动一次的这个窗口，然后到点的时候，里边收集到的就应该是同样的这个数据，诶，但是大家注意啊。一开始的时候啊，这个event里边我们当前是有数据的时间戳的，每一个数据对应是有时间戳的，那现在如果我们要基于这个窗口做了统计之后，它的输出结果里边这个时间戳又应该是什么呢？这里边其实就涉及到这样一个问题了，对吧，就是我们当前输出的东西到底是什么。到底我们应该怎么样去处理这个输出的东西，举个例子吧，我们这里边的这个数据，数据来了之后啊，比方说这里边一个是home访问了一下主页，我就拿H来表示啊，一个是访问了一下，比方说购物车，一个访问了一下product具体的商品页面啊，然后我们再来一个home。
09:07
再来一个cut。哎，大家会想到这样，如果要去统计的话，我们进来前面这个读取转换啊，分配时间，说这些算子我们不说了啊，我们就直接到这个窗口这里来吧，到了window算子这里。Window算子这里，假如说我一个窗口里边有这么些数据的话，最后输出的是什么呢？他们来的时候是一个一个来的，比方说现在我这个零到十秒的窗口。来的时候一个一个来都收集到了里边，然后依次去做叠加，大家注意叠加统计的时候是按照K来统计的，所以我们保存起来，最后要输出的是什么呢？是不是要针对每个K有一个输出啊？而且这里面窗口计算过程当中是没有输出的，这里面没有任何输出。只是有那个水位线在不停的往前推进，它会传递到下面去，但是窗口只有到了结束时间的时候才会触发计算输出到下游，所以它是到了水位线涨到现在没有延迟啊，所以涨到十秒的时候，那么这个时候触发当前窗口的计算输出对应的结果，所以是水位线到了十秒，这里会突然一下输出H它有两个，C有两个。
10:27
P有一个啊，当然我们输出的结果应该是都包装成UR view count了，呃，最里边核心的这个数据主要就是他俩，然后后面还带着起始点是零，结束点是十，起始点是零，结束点是十。包装好的这样的数据，他们应该理论上是同时输出的。但是自然我们想到不可能同时输出啊，既然是流嘛，呃，一个任务数据往下游输出的时候，肯定还是有顺序一个一个输出的，所以呢，它就是快速的啊，我把这个化成三角吧。
11:00
快速的跟在后边连续的做了一波输出，它是这个样子，然后输出之后呢，现在的每一个URL里边有几几条数据啊，肯定只有一条数据，对不对，我们都已经聚合起来了呀。肯定就只有当前URL的一个统计数字嘛。那我们现在应该要做什么事呢？其实是要把当前这个窗口里边输出的这些数据收集起来，要做一个排序。那我是不是直接在这儿啊，比方说我来一个process。用一个process方式收集所有的数据，把所有数据都扔到里边来，那接下来是不是整个这条流里边啊，窗口聚合的所有结果，所有数据。都会放到这个process里边来。这个就稍微有点麻烦了啊，如果这个时候啊，所有数据放到process里边来的话，那就不止一个窗口突出的结果会扔进来了，下一个窗口十啊，下一个窗口应该是五到。
12:03
15秒，因为我们是滑动窗口嘛。这个窗口里边可能也会有一组数据。他是不是也会流进来啊。啊，大家要注意啊，窗口都已经聚合完毕了，现在我们是不是得到的就是一个流，就是一个data stream呀。啊，它只不过就是这里边你连着输出了几条数据，数据可能有疏有密而已，它还是一条流。它是一个普通的data stream，所以这些数据直接传递到后边的时候，这边process是搞不清楚它到底属于哪个窗口的。你只能是看到，诶，可能是同时诶，EEE突然来了好几条数据，然后呢，稍微隔了一会儿，然后eee又来好几条数据，他可能会有这样的一个情况出现。所以大家会发现啊，在这种场景下，后边如果想要让他明确收集到所有的数据排序，这个很麻烦，为什么呢？呃，关键就在于前面我们提到的啊。
13:01
过了这个窗口window操作之后，它输出的这个数据的这个架势是同时输出好几个，哎，然后隔一段时间，像我们这个五秒钟一次的话，就是隔五秒钟，然后又EEE输出好几个，但它还是流，所以它是有先后顺序的，那所以这里就涉及到一个问题，我们在下游想要去做排序的话。你怎么排呢？你是来了一个数据就排吗？这肯定不对啊，你你来了一个数据，他点击了三次，它就一定是排第一吗？后面还会有数据的呀，啊，那大家就会想到，那我就来两个数据再排，那你TOP2他们俩就一定是TOP2吗？也不是啊，后面还会来对不对，然后来了之后呢，就他们之间可能有间隙，然后呢，可能中间又隔一段时间又会来别的数据，那这个大家可能就觉觉得这个就很乱了，我们现在中间这个距离还有点儿远，就是隔了五秒钟，那假如说我们隔一秒就输出一次的话，甚至有可能这个数据前后的乱序都会导致不同窗口输出的这个结果都有可能会打乱，那假如真的出现这种情况，那我们后面又该怎么做呢？
14:09
我难道把它收集起来之后统一排序吗？显然不对啊，这不同的窗口里面的数据是不应该统一去排序的。那到底应该怎么做，这就是我们想要去考虑的一个问题，那其实有一个最简单的想法，我干脆就把所有数据，你就不要先去开窗，按照URL去统计，然后统计出了它的这个值，就直接把它输出了，因为大家知道一旦要是KBY之后去开窗，那就当前窗口内统计的只有一个URL的数据。啊，最后是不同URL数据是分别输出的，那我们现在呢，我干脆就把所有数据都汇集到一起，所有的URL都放在一，统计的时候还是得分开的，对吧，你不能混在一起嘛，那就变成PV了嘛。啊那我现在呢，是要把所有的数据放在一起，然后又要把URL分开，分别统计它们的个数，统计完了之后，我就可以直接给他做一个排序了嘛。
15:08
啊，这个大家自然也就想到能能有对应的这样的一个行为去处理它，那中间我们可以用一个比方说哈希map这样的一些数据结构啊，那这个就比较简单一些，哈希map k就是当前的URL，这就相当于是我们KBY了嘛，只不过是在哈希map里边KBY了，用K来表示URL后边的值，跟上一个它对应的count值。啊，那最后我们就可以把所有的，就当前这个窗口要触发的时候，我可以把保存好的所有的数据拿出来，然后按从大到小的顺序放到一个这个release里边去做一个排序，这个其实是大家最容易理解，最容易想到的一种实现。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之2022版Flink1.13（Java版）

（86/171）

6分39秒

001_Flink课程简介

510

12分54秒

002_第一章_Flink简介（一）_Flink起源和设计理念

350

12分25秒

003_第一章_Flink简介（二）_Flink在企业的应用

400

8分41秒

004_第一章_Flink简介（三）_Flink的优势

440

18分2秒

005_第一章_Flink简介（四）_数据处理框架的演变

460

4分55秒

006_第一章_Flink简介（五）_流处理的应用场景

290

6分57秒

007_第一章_Flink简介（六）_Flink的分层API

350

10分5秒

008_第一章_Flink简介（七）_Flink和Spark的区别

350

11分58秒

009_第二章_Flink快速上手（一）_环境准备和创建项目

410

15分19秒

010_第二章_Flink快速上手（二）_批处理_Word Count（一）

420

8分31秒

011_第二章_Flink快速上手（二）_批处理_Word Count（二）

430

13分47秒

012_第二章_Flink快速上手（三）_流处理（一）_有界流处理Word Count（一）

400

6分42秒

013_第二章_Flink快速上手（三）_流处理（一）_有界流处理Word Count（二）

360

11分47秒

014_第二章_Flink快速上手（三）_流处理（二）无界流处理Word Count

410

18分16秒

015_第三章_Flink部署（一）_快速启动一个集群（一）_环境配置和基本介绍

360

8分41秒

016_第三章_Flink部署（一）_快速启动一个集群（二）_集群启动

440

12分31秒

017_第三章_Flink部署（一）_快速启动一个集群（三）_提交作业（一）_Web UI提交

360

11分3秒

018_第三章_Flink部署（一）_快速启动一个集群（三）_提交作业（二）_命令行提交

330

10分59秒

019_第三章_Flink部署（二）_部署模式

320

3分49秒

020_第三章_Flink部署（三）_独立模式的部署

380

18分50秒

021_第三章_Flink部署（四）_Yarn模式的部署

400

13分39秒

022_第四章_Flink运行时架构（一）_Flink系统架构

390

12分12秒

023_第四章_Flink运行时架构（二）_作业提交流程

370

10分46秒

024_第四章_Flink运行时架构（三）_一些重要概念（一）_数据流图

450

12分15秒

025_第四章_Flink运行时架构（三）_一些重要概念（二）_并行度

400

14分53秒

026_第四章_Flink运行时架构（三）_一些重要概念（三）_算子链

390

6分13秒

027_第四章_Flink运行时架构（三）_一些重要概念（四）_执行图

390

17分36秒

028_第四章_Flink运行时架构（三）_一些重要概念（五）_Task Slots

450

6分23秒

029_第四章_Flink运行时架构（四）_Flink的任务调度

380

5分40秒

030_第五章_DataStream API（基础篇）（一）_整体介绍

370

16分12秒

031_第五章_DataStream API（基础篇）（二）_执行环境

400

5分18秒

032_第五章_DataStream API（基础篇）（三）_源算子（一）_整体介绍

400

5分17秒

033_第五章_DataStream API（基础篇）（三）_源算子（二）_准备工作

460

17分14秒

034_第五章_DataStream API（基础篇）（三）_源算子（三）_读取有界流

370

4分4秒

035_第五章_DataStream API（基础篇）（三）_源算子（四）_读取Socket文本流

350

11分50秒

036_第五章_DataStream API（基础篇）（三）_源算子（五）_读取Kafka

400

14分50秒

037_第五章_DataStream API（基础篇）（三）_源算子（六）_自定义Source

470

6分32秒

038_第五章_DataStream API（基础篇）（三）_源算子（七）_自定义并行Source

380

10分21秒

039_第五章_DataStream API（基础篇）（三）_源算子（八）_Flink支持的数据类型（一）

400

12分59秒

040_第五章_DataStream API（基础篇）（三）_源算子（八）_Flink支持的数据类型（二）

360

13分14秒

041_第五章_DataStream API（基础篇）（四）_Transform（一）_Map

460

10分46秒

042_第五章_DataStream API（基础篇）（四）_Transform（二）_Filter

410

13分37秒

043_第五章_DataStream API（基础篇）（四）_Transform（三）_FlatMap

350

12分14秒

044_第五章_DataStream API（基础篇）（四）_Transform（五）_KeyBy

430

13分17秒

045_第五章_DataStream API（基础篇）（四）_Transform（六）_简单聚合

390

20分24秒

046_第五章_DataStream API（基础篇）（四）_Transform（七）_归约聚合

370

9分24秒

047_第五章_DataStream API（基础篇）（四）_Transform（八）_UDF（一）_函数类和匿名函数

420

14分40秒

048_第五章_DataStream API（基础篇）（四）_Transform（八）_UDF（二）_富函数类

470

18分2秒

049_第五章_DataStream API（基础篇）（四）_Transform（九）_物理分区（一）_随机和轮询分区

400

14分19秒

050_第五章_DataStream API（基础篇）（四）_Transform（十）_物理分区（二）_Rescale

320

8分37秒

051_第五章_DataStream API（基础篇）（四）_Transform（十）_物理分区（三）_广播、全局及自定义分区

350

11分48秒

052_第五章_DataStream API（基础篇）（五）_Sink（一）_连接到外部系统

430

15分23秒

053_第五章_DataStream API（基础篇）（五）_Sink（二）_输出到文件

320

13分0秒

054_第五章_DataStream API（基础篇）（五）_Sink（三）_输出到Kafka

440

13分56秒

055_第五章_DataStream API（基础篇）（五）_Sink（四）_输出到Redis

240

13分13秒

056_第五章_DataStream API（基础篇）（五）_Sink（五）_输出到Elasticsearch

390

14分28秒

057_第五章_DataStream API（基础篇）（五）_Sink（六）_输出到MySQL

400

5分4秒

058_第五章_DataStream API（基础篇）（五）_Sink（七）_自定义Sink输出

350

13分30秒

059_第六章_Flink中的时间和窗口（一）_时间语义

410

10分20秒

060_第六章_Flink中的时间和窗口（二）_水位线（一）_水位线的概念

410

17分17秒

061_第六章_Flink中的时间和窗口（二）_水位线（二）_水位线的原理和特性

370

14分25秒

062_第六章_Flink中的时间和窗口（二）_水位线（三）_水位线在代码中的生成（一）

370

8分48秒

063_第六章_Flink中的时间和窗口（二）_水位线（三）_水位线在代码中的生成（二）

390

11分3秒

064_第六章_Flink中的时间和窗口（二）_水位线（四）_自定义水位线的生成

470

6分58秒

065_第六章_Flink中的时间和窗口（二）_水位线（五）_水位线的传递

440

9分52秒

066_第六章_Flink中的时间和窗口（三）_窗口（一）_窗口的基本概念

350

20分50秒

067_第六章_Flink中的时间和窗口（三）_窗口（二）_窗口的分类

370

4分10秒

068_第六章_Flink中的时间和窗口（三）_窗口（三）_窗口API概览

340

12分27秒

069_第六章_Flink中的时间和窗口（三）_窗口（四）_窗口分配器

370

5分30秒

070_第六章_Flink中的时间和窗口（三）_窗口（五）_窗口函数整体介绍

440

5分33秒

071_第六章_Flink中的时间和窗口（三）_窗口（六）_窗口函数分类

430

9分7秒

072_第六章_Flink中的时间和窗口（三）_窗口（七）_增量聚合函数（一）_ReduceFunction

420

13分20秒

073_第六章_Flink中的时间和窗口（三）_窗口（七）_增量聚合函数（二）_AggregateFunction

420

19分42秒

074_第六章_Flink中的时间和窗口（三）_窗口（七）_增量聚合函数（三）_应用实例

410

18分31秒

075_第六章_Flink中的时间和窗口（三）_窗口（八）_全窗口函数

450

10分55秒

076_第六章_Flink中的时间和窗口（三）_窗口（九）_两种窗口函数结合

410

11分43秒

077_第六章_Flink中的时间和窗口（三）_窗口（十）_窗口函数综合应用实例

400

19分44秒

078_第六章_Flink中的时间和窗口（三）_窗口（十一）_窗口其它API

380

11分32秒

079_第六章_Flink中的时间和窗口（四）_处理迟到数据（一）_代码实现

430

12分42秒

080_第六章_Flink中的时间和窗口（四）_处理迟到数据（二）_测试

370

17分1秒

081_第七章_处理函数（一）_处理函数的概念和分类

460

14分16秒

082_第七章_处理函数（二）_ProcessFunction

420

12分2秒

083_第七章_处理函数（三）_KeyedProcessFunction（一）_处理时间定时器

460

11分32秒

084_第七章_处理函数（三）_KeyedProcessFunction（二）_事件时间定时器

340

5分23秒

085_第七章_处理函数（四）_ProcessWindowFunction

330

15分49秒

086_第七章_处理函数（五）_Top N（一）_使用ProcessAllWindowFunction（一）_基本思路

350

14分44秒

087_第七章_处理函数（五）_Top N（一）_使用ProcessAllWindowFunction（二）_代码实现和测试

370

22分11秒

088_第七章_处理函数（五）_Top N（二）_使用KeyedProcessFunction

290

16分2秒

089_第八章_多流转换（一）_分流

450

13分50秒

090_第八章_多流转换（二）_合流（一）_ 联合（Union）

380

12分56秒

091_第八章_多流转换（二）_合流（二）_ 连接（Connect）

330

23分18秒

092_第八章_多流转换（二）_合流（三）_ 应用实例（一）_程序架构和实现思路

380

15分1秒

093_第八章_多流转换（二）_合流（三）_ 应用实例（二）_具体代码实现

320

6分14秒

094_第八章_多流转换（二）_合流（四）_ 广播连接流

440

21分14秒

095_第八章_多流转换（三）_双流Join（一）_ 窗口联结

380

20分8秒

096_第八章_多流转换（三）_双流Join（二）_ 间隔联结

470

15分17秒

097_第八章_多流转换（三）_双流Join（三）_ 窗口同组联结

400

13分50秒

098_第九章_状态编程（一）_Flink中的状态（一）_ 状态的定义

420

12分59秒

099_第九章_状态编程（一）_Flink中的状态（二）_ 状态的管理

430

100

16分6秒

100_第九章_状态编程（一）_Flink中的状态（三）_ 状态的分类

410

101

19分38秒

101_第九章_状态编程（二）_按键分区状态（一）_ 基本概念和类型

410

102

13分56秒

102_第九章_状态编程（二）_按键分区状态（二）_ 代码中的使用（一）_基本方式和值状态

280

103

17分16秒

103_第九章_状态编程（二）_按键分区状态（二）_ 代码中的使用（二）_其它状态

440

104

24分34秒

104_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（一）_值状态

390

105

19分29秒

105_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（二）_列表状态

370

106

22分14秒

106_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（三）_映射状态

420

107

20分8秒

107_第九章_状态编程（二）_按键分区状态（三）_ 应用实例（四）_聚合状态

340

108

17分18秒

108_第九章_状态编程（二）_按键分区状态（四）_ 状态生存时间

340

109

14分27秒

109_第九章_状态编程（三）_算子状态（一）_ 基本概念和类型

400

110

12分5秒

110_第九章_状态编程（三）_算子状态（二）_应用实例（一）_基本思路和框架

370

111

16分31秒

111_第九章_状态编程（三）_算子状态（二）_应用实例（二）_具体实现和测试

340

112

8分54秒

112_第九章_状态编程（四）_广播状态（一）_基本概念和用法

410

113

22分48秒

113_第九章_状态编程（四）_广播状态（二）_应用实例

380

114

9分52秒

114_第九章_状态编程（五）_状态持久化（一）_检查点

450

115

21分15秒

115_第九章_状态编程（五）_状态持久化（二）_状态后端

420

116

11分54秒

116_第十章_容错机制（一）_检查点（一）_检查点的保存原理（一）_周期性的保存

340

117

15分2秒

117_第十章_容错机制（一）_检查点（一）_检查点的保存原理（二）_保存的时间点

340

118

6分40秒

118_第十章_容错机制（一）_检查点（二）_从检查点恢复状态

320

119

15分0秒

119_第十章_容错机制（一）_检查点（三）_检查点算法（一）_分界线

390

120

22分22秒

120_第十章_容错机制（一）_检查点（三）_检查点算法（二）_分布式快照算法

360

121

19分19秒

121_第十章_容错机制（一）_检查点（四）_检查点配置

310

122

13分12秒

122_第十章_容错机制（一）_检查点（五）_保存点

300

123

10分50秒

123_第十章_容错机制（二）_状态一致性（一）_一致性的概念和级别

430

124

15分16秒

124_第十章_容错机制（二）_状态一致性（二）_端到端状态一致性（一）

290

125

15分54秒

125_第十章_容错机制（二）_状态一致性（二）_端到端状态一致性（二）

380

126

18分22秒

126_第十章_容错机制（二）_状态一致性（三）_端到端精确一次

310

127

13分26秒

127_第十一章_Table API和SQL（一）_整体介绍

350

128

19分18秒

128_第十一章_Table API和SQL（二）_快速上手

360

129

12分48秒

129_第十一章_Table API和SQL（三）_基本API（一）_程序架构

370

130

13分40秒

130_第十一章_Table API和SQL（三）_基本API（二）_表环境

410

131

16分31秒

131_第十一章_Table API和SQL（三）_基本API（三）_创建表

340

132

20分33秒

132_第十一章_Table API和SQL（三）_基本API（四）_表的查询和输出（一）

410

133

15分0秒

133_第十一章_Table API和SQL（三）_基本API（四）_表的查询和输出（二）

400

134

12分24秒

134_第十一章_Table API和SQL（三）_基本API（五）_表和流的转换（一）_表转换成流

350

135

13分25秒

135_第十一章_Table API和SQL（三）_基本API（五）_表和流的转换（二）_流转换成表

390

136

16分21秒

136_第十一章_Table API和SQL（四）_流处理中的表（一）_动态表和持续查询

440

137

25分10秒

137_第十一章_Table API和SQL（四）_流处理中的表（二）_流转换成动态表做动态查询

420

138

15分2秒

138_第十一章_Table API和SQL（四）_流处理中的表（三）_动态表编码成数据流

380

139

16分23秒

139_第十一章_Table API和SQL（五）_时间属性和窗口（一）_时间属性（一）_在DDL中定义

390

140

11分55秒

140_第十一章_Table API和SQL（五）_时间属性和窗口（一）_时间属性（二）_流转换成表时定义

360

141

22分46秒

141_第十一章_Table API和SQL（五）_时间属性和窗口（二）_窗口

320

142

21分5秒

142_第十一章_Table API和SQL（六）_聚合查询（一）_分组聚合

420

143

16分1秒

143_第十一章_Table API和SQL（六）_聚合查询（二）_窗口聚合

400

144

15分22秒

144_第十一章_Table API和SQL（六）_聚合查询（三）_开窗聚合

410

145

28分4秒

145_第十一章_Table API和SQL（六）_聚合查询（四）_TopN（一）_普通TopN

370

146

15分27秒

146_第十一章_Table API和SQL（六）_聚合查询（四）_TopN（二）_窗口TopN

450

147

14分58秒

147_第十一章_Table API和SQL（七）_联结查询

420

148

22分9秒

148_第十一章_Table API和SQL（八）_函数（一）_系统函数

390

149

9分46秒

149_第十一章_Table API和SQL（八）_函数（二）_UDF（一）_整体介绍和分类

410

150

9分6秒

150_第十一章_Table API和SQL（八）_函数（二）_UDF（二）_标量函数

410

151

16分40秒

151_第十一章_Table API和SQL（八）_函数（二）_UDF（三）_表函数

370

152

18分24秒

152_第十一章_Table API和SQL（八）_函数（二）_UDF（四）_聚合函数

350

153

25分19秒

153_第十一章_Table API和SQL（八）_函数（二）_UDF（五）_表聚合函数

300

154

9分2秒

154_第十一章_Table API和SQL（九）_SQL客户端

360

155

14分49秒

155_第十一章_Table API和SQL（十）_连接到外部系统（一）_常见的外部存储

370

156

14分11秒

156_第十一章_Table API和SQL（十）_连接到外部系统（二）_Hive

380

157

17分24秒

157_第十二章_Flink CEP（一）_基本概念和应用

380

158

17分40秒

158_第十二章_Flink CEP（二）_快速上手（一）_需求分析和定义模式

350

159

14分1秒

159_第十二章_Flink CEP（二）_快速上手（二）_检测处理代码实现和测试

370

160

13分58秒

160_第十二章_Flink CEP（三）_模式API（一）_个体模式（一）_量词

380

161

15分45秒

161_第十二章_Flink CEP（三）_模式API（一）_个体模式（二）_条件

420

162

16分31秒

162_第十二章_Flink CEP（三）_模式API（二）_组合模式

300

163

5分31秒

163_第十二章_Flink CEP（三）_模式API（三）_模式组

400

164

12分38秒

164_第十二章_Flink CEP（三）_模式API（四）_匹配后跳过策略

390

165

14分14秒

165_第十二章_Flink CEP（四）_模式的检测处理（一）_处理匹配事件

350

166

18分42秒

166_第十二章_Flink CEP（四）_模式的检测处理（二）_处理超时事件（一）_需求分析和准备工作

370

167

16分39秒

167_第十二章_Flink CEP（四）_模式的检测处理（二）_处理超时事件（二）_代码实现和测试

350

168

7分26秒

168_第十二章_Flink CEP（四）_模式的检测处理（三）_处理迟到数据

440

169

9分20秒

169_第十二章_Flink CEP（五）_CEP状态机实现（一）_思路分析和程序框架

390

170

16分32秒

170_第十二章_Flink CEP（五）_CEP状态机实现（二）_定义状态机

330

171

7分53秒

171_第十二章_Flink CEP（五）_CEP状态机实现（三）_实现处理逻辑及测试

380

086_第七章_处理函数（五）_Top N（一）_使用ProcessAllWindowFunction（一）_基本思路

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐