00:00
好,UNION7个流,那product states,然后呢,我们还按顺序,第一个呢,应该是click display.union。对吧,七个零,这是第一个啊,嗯,第二个,那product states,第二个呢,应该是呃,收藏吧,收藏加购物车啊购物车。订单。支付。退单。然后是。评价。对吧,属下七个啊,这是一个,然后呢,这三个这三个对吧,七个硫没有问题啊,注意不要不要写重了啊,不要写重了对吧,也不能有一个硫用了两次,有的硫没用上,那就不对了啊二加V得到一个什么呢?Units。好,然后呢,提取时间螺,这个都是呃,太简单的东西了,对吧,然后呢,Whatmark strange。
01:00
啊,那我们也考虑到乱序啊,因为后面要开窗对吧。Product啊好,这边呢,我们duration of second,假如说呢,给个两秒钟的一个延迟就够了啊,然后继续。Element点。Gets。对吧,时间戳取出来,那这样的话我们就得到了一个product with watermark。啊,把这个wordmark提取出来了,接下来呢,分组开窗聚合,那这个呢,都太简单了,点key by啊,那用product当中get什么SD了。Get SQ ID,我们今天说了按他一个人就够了,然后呢,开窗window。他们里面的。
02:02
Off,然后呢,十秒钟对吧,是time second。十秒。继续做聚合,聚合呢还是reduce reduce里边呢,还是写两个一个呢,是有一个reduce方式,然后同时再加一个window function。好输出数据,那当然还是product space。对吧,啊看window好,呃,那这个里边应该怎么去写啊,还是跟之前一样,对吧,Y61Y62滚动窗口,你直接返回Y61也可以,或者说你有一个新的也可以啊,其他常规的,但更重要的是。哪两个就是关于。订单的个数,这个指标大家想一下应该怎么做?就是其他的我们都知道那些那些数量对吧,我们就直接用什么。直接累加就好了,Y61的加Y62的,Y61的加Y62的就好了,对吧?但是问题就在于,对于里边有那个订单个数,就咱们有三个这个哈希赛这个东西应该怎么办?
03:14
想一下我们应该怎么办啊?这个数据里边有一个哈西said,这个数据也有一个哈希said,它俩的哈set里边的奥ID是不是可能相同啊?我们是不是应该把两个哈希set也给它做一次合并?对吧,我们可以把两个哈塞做一次合并,然后最后呢,合并完之后,把哈西的值我们可以取出来啊,不是值取出来,把它的长度取出来,负值,而且长度取出来,我们是不是可以在这里面做更好一点,可以不必要在这做了,在这做你看啊一二哎,做了一个二,然后呢,二三又变成三,一直在改,没必要,对不对,我们是不是可以在这个地方做。
04:03
想一下能不能理解,能不能跟上。其他的什么CT,我们是不是直接做累加就好了。对吧,但这个地方我们是不是应该把两个high side给它拼接起来啊,对吧,那这个我就不写了,太多了,因为之前都写过了啊呃,那分组开上去和来到这边来啊,我就直接把这个拿过来了。到这。对吧,把它拿过来从文档当中粘一下。然后有的东西呢,我们要改一改,比方说这个叫SPACE1对吧,这个呢,我们取名叫SPACE2 space2好,那有的东西呢,我们需要干掉,比方说这个这个数据呢,我们就没必要在这写,对吧,没必要两条数据合并,因为是增量聚合,两条数据合并的时候,我就非得做这个事,那这个呢,没必要对吧?呃,那同样的它也是没必要的。我们最后去做这个事就好了,对吧,还有一个支付。
05:00
对吧,我们最后把这个合并,合并好之后呢,在这边去处理这个事情,其他的指标很简单,就是两个尾加click加click对吧,Display加display,然后呢,金额也照样做回加对吧?好接下来呢,是这个这个里边我们去写第一个取出数据。数据呢比较简单,直接从input当中点点next,因为我们之前说了只有一条数据对吧,叫product,然后呢将数据写出。将数据写出,那还是用out点?Connect products还是把它自己写出去,然后在这里边补充字段,那补充的字段呢,有五个。对吧,两个窗口时间,三个订单的个数好。这边我们来写一下,那取出窗口。时间啊,就是温,嗯,直接这样一步到位吧。
06:03
Product states点啊,或者说设置直接叫设置啊,就直接一步到位了,product.set ST。还有一个string类型,那就是data time YouTube店。要一个string对吧?好,这里面有一个data,那你有一个date啊,然后呢是window.get stop CR d啊,然后这个地方呢是e dt,然后呢,Get and。对吧,那设置窗口时间这个就搞定了,然后呢,设置。订单数量啊,设置订单的一个数量。对吧,那这个呢,也很简单,我们就直接product states.set假如说all city all city,对吧,All city呢,就是说从product当中点。我们的什么?
07:00
All的ID side点。我们要他的一个size。对吧,要他这个size,但是这个地方呢,有一个问题,他告诉我们这个地方怎么办。对吧,我们可以来看这个比较简单,我们可以加一个0L。对吧,可以用这种方式来做啊,对吧。加个0R就好了,对吧,当然了,这边也可以简单的写法,直接做一个强转,直接做一个强转是不是也可以对吧?好,然后呢,还有还有两个啊product点呃,呸。Paid all the city,然后呢,也是一样的,做一个强窄浪类型对吧,呃,这个地方呢,是product点。Get paid的outside点。把它放进来,然后还有一个protect.set还有一个是退单的一个次数,对吧,退单次数还是一样的,跟这个一样,写一个浪费型。
08:05
点get我们拿到退单的这个集合。两个相同的凹的ids ID不在同一个窗口中,会不会有问题?嗯,那你想一下会不会出现这种情况。对吧,你可以想一下会不会出现这种情况。这是聚合后的一个点。
09:02
他会不会出现这种情况,会不会到两。不,他会不会不在同一个窗口,你想这个问题啊,你去想一下就行了。他有没有可能出现在不同的窗口里面?
我来说两句