文章/答案/技术大牛

发布

首页视频097.尚硅谷_Flink项目-电商用户行为分析_模块需求分析_实时热门商品统计（一）

097.尚硅谷_Flink项目-电商用户行为分析_模块需求分析_实时热门商品统计（一）

2022-12-022022-12-02 16:02:28播放35

点赞0 收藏 0

尚硅谷大数学科--选学技术丰富/尚硅谷Flink从入门到实战（scala版）/视频/097.尚硅谷_Flink项目-电商用户行为分析_模块需求分析_实时热门商品统计（一）.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
接下来我们就针对每一个模块，每一个具体的需求来做一个详细的讲解，我们主要是以第一个需求，也就是实时热门商品统计，主要以它为例，我们详细的拆开，后面的话我们会做一个简单的描述啊，那首先我们来看一下这个，呃，需求到底是怎么样去想要做到什么样的事情呢？哎，看一下这个需求的基本描述啊，我们主要就是统计实时的热门商品，那统计多长时间内的热门呢？是近期的，不是所有的热门，对吧，不是比方说我们这个项目上线这个几年了，我从几年之前开始统计热门的商品，那大家知道这个就没有时效性了吗？我们这个要求时效性，所以只统计最近一个小时之内的热门商品啊，当然这个主要是受限于数据啊，我们的数据没有那么多啊，如果说正常来讲的话，可能我们会统计一天甚至一周对吧，甚至一个月，可能是统计这么长度时间范围，那个数据量就会大一点啊，然后我们要求呢。
01:00
它还要非常频繁的更新，大家看到要求是每五分钟更新一次，所以说现在我们这个要求是什么呢？就是我总是要统计最近一个小时之内的，呃，就是所有商品里边热门的商品，对吧？而且呢，每隔五分钟我就要统计一下过去一个小时之内，最近一小时之内的热门商品，呃，那意思就是说，假如说我们九点钟有一个窗口，对吧，那他统计的应该是什么呢？应该是八点到九点，大家想想是不是这样，八点到九点之内的这一个小时之内的所有商品统计一个热门度对吧？排行，然后统计我们统计top几啊，把它取出来，然后呢，五分钟之后再更新，所以是下一个就是8.05~9.05，又是一个统计的区间，对吧？哎，所以大家看到我们的输出就应该是什么时候呢，九点输出一次九点。
02:00
百05输出一次，下一个就应该是09:10 09:15对吧，五分钟输出一次，大家想想这是什么呢？这不就是我们说的滑动窗口嘛，对吧？哎，所以基于这个需求，我们一下就想到了要构建一个滑动窗口来解决这个这个问题，我们构建多长的滑动窗口，一个小时滑动不长五分钟啊，就是这样的一个思路，然后另外就是说我们数据里边你怎么样来统计这个热门度呢？对吧？一个商品的热门度是什么含义呢？哎，我们数据里边不是有那个PV行为吗？我们就用用户对于商品的浏览次数来表示当前商品的热门度，但这个就看产品需求定义了，对吧？啊，就是产品那边，他如果定义说你现在是拿这个下单量订单量啊，或者说我是以这个成交成交额来看这个热门度的话，那你就得需要用这种数据来来提取来去判断了，我们现在就直接用浏览次数就是用户。
03:00
有的那个行行为是PV的，我们提取出来，然后作为当前商品热门度的一个统计啊，啊，那所以当然我们就是要过滤这个行为了啊，整体思路其实还是非常简单的，接下来大家来看一看具体实现的过程，好，那我们首先会想到一上来之后应该是一个big stream，对吧？呃，就是所有的数据都来了，呃，每一个用户对于每一个商品的这个点击行为，PV行为应该都在里边啊那大家会想到，首先我们应该先做一个过滤，对吧？先来一个filter，这里边没有写出来，但是我们能想到啊，先filter一下，所有是PV的行为拿出来，然后接下来我们得做一个什么操作呢？啊，大家想我们接下来是要统计每个商品被浏览的次数，对不对，所以我们接下来统计次数的时候，就像word count一样，你得按照那个word去做分组，然后才能统计啊，那现在我们要统计的这个word类似于word是什么呢？是商。
04:00
分品对吧？呃，商品被点了多少次，被浏览了多少次，所以接下来我们要做一个分区，做一个分组啊，大家可以认为就是做一个分组，做一个KBY操作得到一个k stream，嗯，大家想一想，现在这个k stream每一组每个这个分区里边啊，每个分组里边它的K是什么呢？我们现在是以商品作为一个统计次数的标准，对吧？呃，这个商品被点了多少次？有同学可能想，哎，我这个那个既然是要做分组嘛，那肯定是user ID啊，用user ID分组嘛，但是大家注意啊，你如果按user ID分组，然后再统计当前组内的个数的话，那就变成了每一个用户点了多少次商品，对吧？不管哪个商品，看他点了多少次，这看起来就更像一个这个用户画像，你要做做某种统计的这种操作了，而我们现在不是，我们现在是针对商品，看一个商品被点了多少次。所以当前。
05:00
那我们的分组标志是应该是item ID对吧？商品ID做分组，然后接下来当然就是开时间窗了，呃，这个时间窗我们开一个滑动窗口，不同的窗口之间会有重叠对吧？呃，分居之后啊，我们做这个key by操作之后啊，得到的是一个kid stream，然后再开窗之后得到的是一个window the stream啊大家记记得我们那个time window对吧？点window.time window，然后接下来就是聚合了，聚合得到的当然就是每一个窗口内。诶，我输出当前每一个商品，统计出来它有多少个对吧？哎，大家看到这里边我们我们输出的这个又变成了一个data stream，那这个data stream里边的数据结构应该是什么样子的呢？它应该是，哎，我应该是每一个窗口，大家看我这外面的框是颜色是不一样的啊，比方说这个红色框，就表示前面第一个红色框，红色窗口里边输出的结果，那这个框里边有蓝色的这个分组，有橙色的这个分组，他们分别，这就相当于是每个商品嘛，分别都会统计出一个个数，然后输出一个结果，对吧？哎，大家知道做K外之后，每个组里边他们都是并行不悖的，各自各自处理各自的，对吧？你到一个窗口这个时间节点输出的时候，我们会同时输出好几个，呃，不同ID啊，就是不同K对应的他们的那个统计结果，所以大家看就是这个时间点。
06:28
其实前面我们这两个数据应该几乎都是同时输出对吧？哎，这俩几乎都是同时出来的，然后后边诶，到了这个绿色窗口关窗的时间节点，这俩几乎又是同时出来，然后后边到了这个紫色的这个节点，几乎又是同时出来，所以接下来诶，那大家就会想到了，我直接输出这个就完了吗？其实还不行，我们接下来是要针对每一个窗口里边的这些每个商品是不是还要做一个排序啊，哎，所以这里边接下来你还得针对当前这一个窗口输出的数据来做一个排序，再做一个最后的结果输出，所以后面还涉及到这个问题啊，那我们先一步一步看啊，先把前面这个步步骤给大家再详细的再说明一下，那首先我们做的是这个KBY对吧，当前我们也已经知道了要做。
07:19
分组的这个K是item ID按照商品来分组，那接下来得到的就是，诶大家看就是商品一，比方说10.01有一个有一个点击对吧，零四有一个点击，零五有一个点击，这是他们这一组，然后商品二呢，哎，同样也有它的一组点击数据，接下来接下来就是开窗了，对吧？设置一个时间窗口，那当然我们的要求是滑动嘛，一小时的窗口长度，后边是五分钟的滑动步长，就按这个来定义就可以把它设置出来，这个大家要注意，我们这里边注意两点，一个是左闭前闭后开对吧，左闭右开啊那那这里边要求的就是假如我来了一个10:05的数据的话，那它应该是属于什么呢？
08:06
应该是属于10.05~11.05这个窗口，对吧？呃，而不是属于，呃，就是就是那个10.05之前的窗口啊，那当然了，它同时大家发现了，它其实也应该属于十点到11点的窗口，对吧？呃，因为我们当前的窗口长度是一小时，所有这些数据都应该属于它啊，只不过它是不属于，就是10.05要关闭的那个窗口，它不属于啊，所以大家会发现现在我们的这个数据啊，同一个数据应该是会被分发到不同的窗口里边去，对吧？哎，那这里给大家一个思考题，大家想一想，现在同一份数据应该被分发到多少个窗口里边去做统计呢？所以大家能够想到，我们这里边其实应该是一个数据属同时属于12个窗口，对吧？啊，就直接用这个窗口长度60分钟除以五分钟的滑动步长，60除以五就是它同时属于的窗口个数。然后接下来我们。
09:06
有了这个，呃，开窗之后，那我们还记得啊，首先你要定义窗口分配器，这还窗口操作没定义完的，后边还得有一个窗口函数，对吧，你得定义每一个窗口到点的时候到底要做什么计算，那现在呢，我们其实就是要做一个聚合嘛，要做的这个聚合操作用什么来做呢？诶，这就涉及到了一个问题，大家回忆一下，之前我们看这个图啊，大家看最后拿到的这个数据，有同学可能想了，哎，那一开始你不是说我们定义的那个类型就从文件里边提取出来对吧？包装好了之后，呃，那个已经做过ETL了，包装好了之后就叫做user behavior啊那那可以啊，你这里边呃定义了这个呃窗口对吧，开窗然后去聚合，聚合出来不就是一个count值嘛，那我输出就输出一个长整形就完了嘛，对吧？呃，这这里边我这个呃长有有几个数我就输出几对吧，这个完全没问题啊，你就按照这个这个数字统计不就完了吗？但是大家注意，我这里边输出了这个结果，这里边你如果只输出一个数的话，我是不是连到底它这个对应的ID是谁都不知道啊，哎，所以你这里边不能那么简单粗暴对吧，直接就就做这样一个count啊，那有同学可能就想了，呃，那那这样，那你稍微的做一个调整对吧，你就像我们之前的那个，呃，Word count1。
10:27
样，你map成一个二元组嘛，你像之前我们是一个word一个一个一对吧，你像这里边也是一样，你这里边就来一个那个item ID，然后来一个一，来一个item ID来一个一，你后边根据这个一个ID一个一个它的count值这个二元组把它做一个统计，这个不就完了吗？诶这个也是一个，呃，就是很好的想法，对吧？就像我们当时做那个word count一样，这个输出就会非常的直白，但这里边又有一个问题，大家想这里边就是我这里边直接在在这输出的时候啊，这里边我怎么知道它到底是属于哪个窗口呢？哎，主要有这样一个问题对吧？哎，有同学那就想啊，你这里边既然是隔五分钟才输出一次，那五分钟到点的时候，这里输出的当然就是当前这个窗口里边统计出来的，呃，一堆一堆这个count值了，你就把这个收集起来做一个排序，然后取它的前几名不就完事了吗？哎。
11:27
动作当然也是可以的，但这个前提是什么呢？前提是我得知道，就是我这里边处理的这是这是一条完整的流，对吧？我得知道哪些我现在处理完了之后，接下来在处理的时候，你就不要跟之前的一起排队了，对不对？诶大家想一想，我要排的并不是到目前为止所有数据里边的前几名，我要排的其实就是当前这一个窗口，这里边的几个数据排一个队而已，那你这里边还得指定我当前到底是属于哪个窗口才行，对不对，要不然的话，我后面怎么去排排这个队呢？没法去排了呀。哎，所以这里边就涉及到一个问题，我最后输出的这个数据类型呢，应该还要再包进来一个信息，包进来一个窗口的信息，Window的信息，对不对？所以大家发现我现在最后其实是想要这三个信息包在一起，就是有一个当前的item ID有一。
12:27
个它统计出来的那个count的数量，然后呢，还得有当前统计的这个窗口的一个信息，对吧？那窗口的信息我们可以，呃，大家可能说窗口呢，用什么来表示呢？你用它那个结束时间来表示不就完了吗？对吧？几点钟现在要要关要统计的这个窗口，我用那个window and大家还记得吗？哎，就是之前我们不是在那个CQL里边啊，Table API里边就有一个window window end的那个属性可以直接提出来吗？同样现在我们也可以拿这个属性出来作为窗口的一个代表，所以接下来我们其实想输出的数据结构是这样一个类型，三个属性的这样一个一个数据类型，对吧？哎，那我这里边可以先把它做一个定义啊，啊，就是我把它包成另外的一个样例类，我管它叫做item will count啊，就是每一个商品我去呃，被浏览的那个当前窗口内被浏览的次数的一个统计，对吧，这里边三个字段，一个item ID。
13:27
然后一个window and，另外还有一个countt数量，最后我其实想要拿到的是这个对吧？哎，那这里边就有一个问题了，我们窗口要做聚合，拿到这么一个东西，你怎么样去做聚合呢？哎，有同学说这sum就完了吗？直接sum不就得到了吗？之前我们做那个word countt的时候确实是二元组，对吧？哎，直接some得到的还是二元组，直接就得到最后的结果了，或者我们直接用reduce reduce也可以很方便得到结果，对吧？但是发现大家会发现一个问题，就是这里边是不是输入的类型和输出的类型必须是一样的呀，对吧？诶，你sum之前是二元组，输出还是二元组，你reduce我们之之前用那个呃，传感器的例子啊，输入之前是聚合之前是s reading，那你reduce聚合完之后还是sensor reading对吧？
14:20
哎，这个过程其实它的这个数据类型是不能改的，另外还有一个非常重要的问题，就是我们在做这这个过程当中，没有办法拿到窗口的信息，对吧？大家还记得我们在聚合的过程当中，你你只有一个中间的状态，另外还有一个就是当前所有数据，呃，就是新最新来的那个数据，对吧？只能拿到这些信息，那我们的这个窗口信息到哪去拿呢？诶大家就回忆起来了，之前我们说过除了增量聚合函数之外，是不是还有一个全窗口函数可以得到当前窗口里边更多的信息啊，哎，所以接下来我们就想到了，诶，那是不是得用一个全窗口函数呢？但是我们又觉得全窗口函数它这个计算起来这个实时性不好，对吧？哎，它它并不是来一个处理一个，他是把数据全攒齐了，做批处理了，尽管他能拿到的东西更多，我们就想能不能结合起来这两者呢，把它的优势结合在一。
15:20
一起去用呢，诶可以这里边给大家来介绍一下aggregate的一种特殊的用法，或者说是最为一般化的一种用法啊，这里面就是怎么去用这个aate呢，之前给大家说过这个，呃，窗口聚合的时候，你可以直接点sum对吧？呃，可以直接点mean mean by max max by，另外还可以直接调点reduce啊，直接调这个aggregate.food这几个我们说里边默认传的应该都是一个。啊，就是aggregate里边传的就是就是一个aggregate function嘛，就是一个增量聚合函数，Reduce的话，里边要传的一个就是reduce function，这是我们之前给大家说过的啊，就直接可以这么去用，直接做一个增量聚合，但是现在呢，它还可以传第二个参数。
16:08
这两个参数分别是什么呢？前边这个是还是我们想要的那个aggregate function增量聚合函数对吧？哎，我这个简写了啊，而后边这个就是我们说的那个全窗口函数window function，哎，那这两个如果放在一起之后，它的效果是什么样的呢？它的效果其实还是每来一条数据之后，调用前面的这个增量聚和函数函数去做增量聚合，来一个处理一个，来一个处理一个，然后最后如果我们要去窗口输出的时候怎么办呢？窗口输出的时候再去调一下我们这里的这个全窗口函数window function，然后在这个函数里边，我可以获取到之前已经聚合好的那个状态，另外还能够拿到窗口相关的一些信息，额外的一些信息也能够做包装处理，所以最后的效果就是我可以在这里。
17:09
前面这个aggregate function里边做增量聚合来一个处理一个，而在后边的这个全窗口函数里边呢，拿到之前的聚合结果在哎，结合窗口里边的信息包装成一个想要的书书数据类型啊，所以这里边就用到了这样一个方式啊啊，然后接下来我们来看一下就是具体的这个操作啊，这里边大家看一下前面我们自己定义的这个count hg，这就是自己要实现的一个LG方式了啊，那大家看这里边这个在data stream API里边这个调用就非常的舒服啊，就是只要重写它这个接口里边的所有方法就可以了，那大家看这里边的这个方法是不是跟我们之前讲到的table，呃，就是table API里边自定义的。Tableable aggregate方式或者是aggregate方式非常像啊，啊对吧，大家看这个非常的像啊，所以基本上tableable API里面的那个就是借鉴了这里边的这种实现方式啊，同样也是先去创建一个accumulator，那accumulator是什么？不就是当前的那个聚合状态吗？啊，所以这里边我们做一个这样的一个聚合啊，定义一个状态，然后呢，它有一个方法叫做ADD，哎，这个也是必须去重写的一个方法，这个ADD的方法，那就是每来一条数据之后，你定义当前的这个状态怎么改变，对吧？哎，大家看到这个就直接操作这个状态改变，有点像我们之前看到的那个accumulate，对吧？只不过那个accumulate并不是重写的，而是写死的，你必须去叫那个名，对吧？啊，现在这个的话，你就是重写这个爱的方法就可以了，另外还有一个获取最后结果的方法，这个叫做get result对吧？呃，就是直接把我们当前想要打拿到的那个数据直接拿到，那这里边怎么样去拿到当前的这个结果呢？
18:56
我们要要输出什么结果呢？就输出当前的这个状态就行了，对吧？因为这里边你包装不成我们想要的那个样例类，那个item view count，而是怎么样呢？而是把这个状态只要交给后边的window function，然后由它去包装就完事了，所以这里边呃，有时候我们可以说前面的这一步操作，这叫一个预聚合，对吧？就是每来一条数据先做一个预聚合，聚合出一个结果，最后给到window function里边，那window function其实它拿到的就是调了我们aggregate function里边的get result方法，对吧，拿到了它的这个结果啊，那那当然这里边实现的就是这个aggre function接口了，然后我们再看看那window function里边干什么呢？啊，这个window function它实现的是啊scalela里边的这个treat这个接口，Window function这个接口，对吧，然后这里边它主要的要实现的一个方法是apply方法，大家还记得那个全窗口函数，呃，那个window function吗？对吧，里边就是。
19:56
现一个apply方法，这里边就能够拿到当前的K，拿到当前的window对吧？另外还能拿到聚合的结果对吧？Aggregate result就是我们前面预聚合已经传过来的那个数啊，大家看这里面是个特able类型，为什么是个可迭代类型呢？因为本来这是个全窗口函数对吧？它本来预计拿的不是聚合结果，本来是要干什么呢？本来是要把所有的数都放在这儿的，就是我们说所有数据都收集齐了才调用这里的这个window function嘛，呃，所以这这个interable类型本来是要放我们的全量数据的，只不过这里没有全量数据了，就一个结果放在这儿完事，对吧？所以大家看，接下来其实就是把item ID拿出来，把count值拿出来，另外利用这个window再拿一个它的and，对吧？调用window.get and这个方法，拿出来包装成样例类输出就完事了，大家看输出的时候又用到了一个collector的collect方法，对吧，又做了一个这样。
20:56
这样的一个输出，这就是我们最后窗口输出的结果。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷Flink从入门到实战（scala版）

（97/137）

10分49秒

001.尚硅谷_Flink-Flink简介

510

19分45秒

002.尚硅谷_Flink-Flink应用场景

480

11分3秒

003.尚硅谷_Flink-流式处理的提出

380

15分16秒

004.尚硅谷_Flink-流式处理的演变

350

16分33秒

005.尚硅谷_Flink-Flink的特点

340

23分57秒

006.尚硅谷_Flink-批处理wordcount

520

20分13秒

007.尚硅谷_Flink-流处理wordcount

380

19分14秒

008.尚硅谷_Flink-流处理wordcount扩展测试和说明

410

26分46秒

009.尚硅谷_Flink-Flink集群部署

470

22分34秒

010.尚硅谷_Flink-提交Job

400

7分30秒

011.尚硅谷_Flink-命令行提交Job

350

12分50秒

012.尚硅谷_Flink-其它方式集群部署

360

8分35秒

013.尚硅谷_Flink-运行时架构_运行时组件

390

13分22秒

014.尚硅谷_Flink-运行时架构_作业提交流程

430

16分27秒

015.尚硅谷_Flink-运行时架构_任务调度原理（一）_并行度和slot

360

17分22秒

016.尚硅谷_Flink-运行时架构_任务调度原理（二）_slot共享

470

6分15秒

017.尚硅谷_Flink-运行时架构_任务调度原理（三）_slot共享示例

300

25分35秒

018.尚硅谷_Flink-运行时架构_任务调度原理（四）_执行图和任务链

310

12分20秒

019.尚硅谷_Flink-运行时架构_任务调度原理（五）_自定义任务调度规则

350

16分18秒

020.尚硅谷_Flink-流处理API_Source（一）_从集合和文件读取数据

380

21分32秒

021.尚硅谷_Flink-流处理API_Source（二）_从Kafka读取数据

430

24分49秒

022.尚硅谷_Flink-流处理API_Source（三）_自定义Source

410

6分49秒

023.尚硅谷_Flink-流处理API_Transform（一）_简单转换算子

320

19分15秒

024.尚硅谷_Flink-流处理API_Transform（二）_简单分组聚合

380

11分20秒

025.尚硅谷_Flink-流处理API_Transform（三）_reduce聚合

320

12分23秒

026.尚硅谷_Flink-流处理API_Transform（四）_分流操作

350

19分54秒

027.尚硅谷_Flink-流处理API_Transform（五）_合流操作

290

9分39秒

028.尚硅谷_Flink-流处理API_Flink支持的数据类型

420

19分40秒

029.尚硅谷_Flink-流处理API_函数类和富函数类

280

18分54秒

030.尚硅谷_Flink-流处理API_Sink（一）_文件

410

10分44秒

031.尚硅谷_Flink-流处理API_Sink（二）_Kafka

430

18分29秒

032.尚硅谷_Flink-流处理API_Sink（三）_Redis

360

16分42秒

033.尚硅谷_Flink-流处理API_Sink（四）_ElasticSearch

350

17分47秒

034.尚硅谷_Flink-流处理API_Sink（五）_MySQL

480

7分21秒

035.尚硅谷_Flink-流处理API_Window API_窗口概念

360

10分12秒

036.尚硅谷_Flink-流处理API_Window API_窗口类型

330

27分16秒

037.尚硅谷_Flink-流处理API_Window API_窗口分配器

450

20分59秒

038.尚硅谷_Flink-流处理API_Window API_窗口函数及其它可选API

410

15分5秒

039.尚硅谷_Flink-流处理API_Window API_窗口计算测试

270

17分56秒

040.尚硅谷_Flink-时间语义

300

4分32秒

041.尚硅谷_Flink-时间语义的设置

350

19分5秒

042.尚硅谷_Flink-Watermark概念

370

15分56秒

043.尚硅谷_Flink-Watermark原理和特点

320

8分7秒

044.尚硅谷_Flink-Watermark传递

260

16分32秒

045.尚硅谷_Flink-Watermark代码中引入

290

7分8秒

046.尚硅谷_Flink-自定义Watermark生成机制

290

16分10秒

047.尚硅谷_Flink-事件时间语义下的窗口测试

360

9分20秒

048.尚硅谷_Flink-窗口起始点的确定

360

8分7秒

049.尚硅谷_Flink-状态管理（一）_状态的概念

400

15分13秒

050.尚硅谷_Flink-状态管理（二）_算子状态和键控状态

290

27分24秒

051.尚硅谷_Flink-状态管理（三）_状态在代码中的定义和使用

340

17分14秒

052.尚硅谷_Flink-状态编程示例（一）

380

17分29秒

053.尚硅谷_Flink-状态编程示例（二）

410

23分23秒

054.尚硅谷_Flink-ProcessFuntion_基本概念和使用

360

32分49秒

055.尚硅谷_Flink-ProcessFuntion_定时器应用示例

320

9分44秒

056.尚硅谷_Flink-ProcessFuntion_侧输出流应用示例

360

15分35秒

057.尚硅谷_Flink-状态后端

390

13分30秒

058.尚硅谷_Flink-容错机制_检查点概念和原理

280

25分45秒

059.尚硅谷_Flink-容错机制_检查点算法

380

26分28秒

060.尚硅谷_Flink-容错机制_checkpoint配置

350

8分20秒

061.尚硅谷_Flink-容错机制_重启策略配置

440

7分31秒

062.尚硅谷_Flink-保存点

460

10分45秒

063.尚硅谷_Flink-状态一致性_基本概念

400

8分42秒

064.尚硅谷_Flink-状态一致性_Flink端到端状态一致性的保证

390

23分34秒

065.尚硅谷_Flink-状态一致性_幂等写入和事务写入

410

18分19秒

066.尚硅谷_Flink-状态一致性_Flink与Kafka连接的状态一致性

400

22分2秒

067.尚硅谷_Flink-Table API和Flink SQL_基本概念和示例程序

400

9分21秒

068.尚硅谷_Flink-Table API和Flink SQL_基本程序结构

340

15分42秒

069.尚硅谷_Flink-Table API和Flink SQL_表执行环境

360

19分13秒

070.尚硅谷_Flink-Table API和Flink SQL_表的概念和从文件读取数据

410

9分28秒

071.尚硅谷_Flink-Table API和Flink SQL_从Kafka读取数据

340

11分3秒

072.尚硅谷_Flink-Table API和Flink SQL_表的查询转换

390

8分24秒

073.尚硅谷_Flink-Table API和Flink SQL_DataStream和表的转换

400

25分13秒

074.尚硅谷_Flink-Table API和Flink SQL_输出到文件

320

10分50秒

075.尚硅谷_Flink-Table API和Flink SQL_更新模式

310

17分40秒

076.尚硅谷_Flink-Table API和Flink SQL_Kafka管道测试

380

18分17秒

077.尚硅谷_Flink-Table API和Flink SQL_输出到ES

340

8分8秒

078.尚硅谷_Flink-Table API和Flink SQL_输出到MySQL

390

11分33秒

079.尚硅谷_Flink-Table API和Flink SQL_表转换成流

290

7分6秒

080.尚硅谷_Flink-Table API和Flink SQL_流处理和SQL查询的不同

340

12分23秒

081.尚硅谷_Flink-Table API和Flink SQL_动态表和持续查询

430

12分49秒

082.尚硅谷_Flink-Table API和Flink SQL_持续查询示例具体过程

410

20分15秒

083.尚硅谷_Flink-Table API和Flink SQL_时间特性（一）_处理时间

340

14分15秒

084.尚硅谷_Flink-Table API和Flink SQL_时间特性（二）_事件时间

330

13分10秒

085.尚硅谷_Flink-Table API和Flink SQL_窗口（一）_分组窗口

440

18分42秒

086.尚硅谷_Flink-Table API和Flink SQL_窗口（二）_分组窗口测试

400

11分57秒

087.尚硅谷_Flink-Table API和Flink SQL_窗口（三）_Over窗口

380

13分1秒

088.尚硅谷_Flink-Table API和Flink SQL_窗口（四）_Over窗口测试

340

11分3秒

089.尚硅谷_Flink-Table API和Flink SQL_函数（一）_系统内置函数

310

14分38秒

090.尚硅谷_Flink-Table API和Flink SQL_函数（二）_UDF函数_标量函数

430

17分18秒

091.尚硅谷_Flink-Table API和Flink SQL_函数（三）_UDF函数_表函数

350

26分57秒

092.尚硅谷_Flink-Table API和Flink SQL_函数（四）_UDF函数_聚合函数

410

27分55秒

093.尚硅谷_Flink-Table API和Flink SQL_函数（五）_UDF函数_表聚合函数

370

8分11秒

094.尚硅谷_Flink项目-电商用户行为分析_批处理和流处理以及项目选型

350

15分26秒

095.尚硅谷_Flink项目-电商用户行为分析_用户行为分析应用场景

370

9分11秒

096.尚硅谷_Flink项目-电商用户行为分析_模块设计和数据分析

440

21分2秒

097.尚硅谷_Flink项目-电商用户行为分析_模块需求分析_实时热门商品统计（一）

350

9分6秒

098.尚硅谷_Flink项目-电商用户行为分析_模块需求分析_实时热门商品统计（二）

400

10分2秒

099.尚硅谷_Flink项目-电商用户行为分析_模块需求分析_其它需求

400

100

10分20秒

100.尚硅谷_Flink项目-电商用户行为分析_项目框架搭建

380

101

27分53秒

101.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（一）_窗口聚合

360

102

27分13秒

102.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（二）_排序统计输出

390

103

20分50秒

103.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（三）_从Kafka消费数据测试

450

104

10分2秒

104.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（四）_批量消费Kafka数据测试

480

105

28分42秒

105.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（五）_Table API和SQL实现

350

106

26分5秒

106.尚硅谷_Flink项目-电商用户行为分析_实时热门页面流量统计（一）_开窗聚合统计

250

107

9分46秒

107.尚硅谷_Flink项目-电商用户行为分析_实时热门页面流量统计（二）_统计结果排序输出

350

108

21分3秒

108.尚硅谷_Flink项目-电商用户行为分析_实时热门页面流量统计（三）_乱序数据的处理

420

109

21分40秒

109.尚硅谷_Flink项目-电商用户行为分析_实时热门页面流量统计（四）_保证状态更新结果正确

390

110

20分38秒

110.尚硅谷_Flink项目-电商用户行为分析_PV统计（一）_基本实现

430

111

19分21秒

111.尚硅谷_Flink项目-电商用户行为分析_PV统计（二）_数据并行的优化

320

112

15分27秒

112.尚硅谷_Flink项目-电商用户行为分析_UV统计（一）_基本实现

430

113

30分47秒

113.尚硅谷_Flink项目-电商用户行为分析_UV统计（二）_布隆过滤器去重思路和程序架构

350

114

9分11秒

114.尚硅谷_Flink项目-电商用户行为分析_UV统计（三）_布隆过滤器简单实现

340

115

23分31秒

115.尚硅谷_Flink项目-电商用户行为分析_UV统计（四）_UV去重的布隆过滤器实现

300

116

17分2秒

116.尚硅谷_Flink项目-电商用户行为分析_APP市场推广统计（一）_自定义数据源

480

117

20分43秒

117.尚硅谷_Flink项目-电商用户行为分析_APP市场推广统计（二）_开窗聚合统计输出

320

118

19分18秒

118.尚硅谷_Flink项目-电商用户行为分析_广告点击量统计分析（一）_基本需求实现

310

119

14分27秒

119.尚硅谷_Flink项目-电商用户行为分析_广告点击量统计分析（二）_刷单行为过滤思路和整体框架

380

120

23分19秒

120.尚硅谷_Flink项目-电商用户行为分析_广告点击量统计分析（三）_刷单行为过滤代码实现

360

121

18分16秒

121.尚硅谷_Flink项目-电商用户行为分析_恶意登录检测（一）_实现思路和代码框架

400

122

18分20秒

122.尚硅谷_Flink项目-电商用户行为分析_恶意登录检测（二）_具体代码实现

350

123

18分18秒

123.尚硅谷_Flink项目-电商用户行为分析_恶意登录检测（三）_代码改进

350

124

30分32秒

124.尚硅谷_Flink项目-电商用户行为分析_恶意登录检测（四）_CEP代码实现

330

125

12分22秒

125.尚硅谷_Flink项目-电商用户行为分析_CEP简介（一）_CEP介绍及Pattern API整体概念

390

126

12分40秒

126.尚硅谷_Flink项目-电商用户行为分析_CEP简介（二）_个体模式

300

127

10分22秒

127.尚硅谷_Flink项目-电商用户行为分析_CEP简介（三）_模式序列

390

128

9分49秒

128.尚硅谷_Flink项目-电商用户行为分析_CEP简介（四）_模式的检测和事件处理

380

129

19分49秒

129.尚硅谷_Flink项目-电商用户行为分析_订单超时检测（一）_实现思路和程序架构

340

130

17分28秒

130.尚硅谷_Flink项目-电商用户行为分析_订单超时检测（二）_CEP具体代码实现

440

131

6分41秒

131.尚硅谷_Flink项目-电商用户行为分析_订单超时检测（三）_流式输入数据测试

390

132

32分19秒

132.尚硅谷_Flink项目-电商用户行为分析_订单超时检测（四）_ProcessFunction代码实现

380

133

13分48秒

133.尚硅谷_Flink项目-电商用户行为分析_双流实时对账（一）_需求分析和整体架构

350

134

22分23秒

134.尚硅谷_Flink项目-电商用户行为分析_双流实时对账（二）_合流代码实现

380

135

12分55秒

135.尚硅谷_Flink项目-电商用户行为分析_Join API（一）_Window Join

380

136

9分46秒

136.尚硅谷_Flink项目-电商用户行为分析_Join API（二）_Interval Join

240

137

9分21秒

137.尚硅谷_Flink项目-电商用户行为分析_双流实时对账（三）_Join代码实现

330

097.尚硅谷_Flink项目-电商用户行为分析_模块需求分析_实时热门商品统计（一）

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐