00:00
呃,我们把这个内容呢,做一个打印测试在这啊。V6点。F。好在这边Env.XQ的。呃,那这个呢,我们想要测试它来自于这个。All的detail对吧?啊,所以呢,我们要开的东西也就明确了,首先这个预处理表。打开对吧,因为集群当中东西我都没关啊,都是开的。现在也没用到这个什么微表对吧,所以呢,就不用管了。第一个all price,然后呢,All the detail,这个下单主题数据要有的,对吧,因为当前我们这个数据就是从下单主题数据里面去拿的,对吧?好,那在接下来呢,把它打开。
01:04
打开之后我们起码要造两次数据才可以,对吧,才能看到这个效果啊。好,那这边呃,我把这个时间还是改回来啊,因为之前呢,我们只是为了测那个时间,这样的话我们都是30号啊,都是30号数据会好看一点回来啊。启动。这两个里边我没有写打印对吧?啊,因为是flink circle其实也可以写对吧,加一个流的打印版也行啊。没有打印啊,所以呢,这三个类就算你这边做完了,它也不会有结果啊,因为前面两个诶这边有问题看一下啊。呃。我看一下什么问题啊。这边说失败了啊,就是这边我说一下,就是你们有时候有同学呢,在给我看错的时候总给我接这个。这个没有用,你知道吧,就是他飘红了,他这个东西告诉你什么,他说任务执行失败,那你说这个报异常有什么用吗?一点用都没有对吧,所以你得往下找,找它具体的这个异常对吧,这个也没用。
02:14
Recover恢复失败,对吧,不能恢复了,因为它会在里边默认会重启,它自动会重启,对吧,那不能恢复了,也没用好,那再往下看一下,他说运营日,Record has value mark maker。Is the time。Said。他说我们这个。Or did you forget to call a sign。他说我们没有提取时间戳吗?诶我看一下啊。我是没提取时间戳,然后没有用吗。我看一下,我看一下。对,那这样的话,就是我们里边混着用的,这边有一个K。他,他说我们时间都提早了。
03:02
对,他把我们时间桌在K拍之后给丢了。对吧,他说我们没有做这个事儿,因为后面呢,我们是这个实验时间开窗啊,实验时间开窗对吧。好,那我们来看一下啊。嗯。这边提取了没有问题,然后这个流没有写错吧,对吧?TB然后呢,是监控流,每一步都是这样去写的,对吧,然后呢,我们在这儿用了一个处理时间,他就把我们那个给干掉了。或者说这我们换谁呀,我们换那个。呃,事件时间的窗口也可以啊,不是事件时间的出发器也可以,那这样吧,这个无所谓啊,那我就直接把这个东西怎么样考成X。看X掉啊,看X我给他拿到,呃,招聘后面。拿到这儿。拿到这个位置可以吧。但是这个呢,我们要改一个。改一个它啊,然后呢,这边改掉,这对于我们这个需求来说,其实无所谓,等会儿我们来说为什么啊,当然呢,在这边要加一个TS了。
04:10
TS,而这个TS用的就是它。这个是杰森对吧?啊,那这就不用这样写了,我们就直接用element点。Get t啊把这个改一下,因为我们这里面又用了这个在中间穿插了用了一个这个处理时间。对吧,用了一个处理时间啊,这个问题导致的,如果说这你不用处理时间,你直接用这个事件时间没有问题啊好呃,那在这儿提取跟前面提取呢,其实一样的。因为我们这个中间只是多做了一个什么去重,也就是说你有1233条数据,且三条数据里边的事件时间一定是怎么样。一样的创建时间一定是一样的,所以我从一个里面提取跟从三个里面提取得到的结果是不是一样的,对吧,对于我们这个需求而言是一样的啊,对吧?啊,这是混着用了,所以导致这个问题,那我们先用它,最后呢提取再开窗没有问题了啊,那我们重新启动一下啊。
05:18
诶挺好的,我之前还都是在后面提取的啊。就是在前面提取,然后再用处理,时间还不行,挺好挺好啊,还多学了一点东西对吧啊,犯错使人成长看啊。我之前还没想到有这个问题啊,因为正常来说他俩可以可以都用,但是呢,好像你先提取了再用处理时间,再去用失电时间有问题啊,因为我之前都是按照这种方式去写的,就是现在这种方式。好,那这个是第一次输入数据来,我看这个就没有报错了吧,没有问题对吧?好,那但是呢,我们有一个十秒的窗口,那我们肯定要造两次数据才可以,对不对,要造两次啊,来第二次,但是我们造出去打印的数据绝大部分都是那值啊。
06:13
对吧,绝大部分都是浪值,那这个没办法呀。因为维度信息没有补充,它肯定都是那值对吧。好走完了,走完之后呢,我们来这边来看一下啊。有了对吧,呃,那这里边呢,很多都是纳值对吧,那确实就应该是纳值。确实就应该是当值。但这个并不是看。看见没,All the count?11。OUTCOME11个。按照SQID11个对吧?呃,这里边有没有去重掉啊,好像没有对吧,都是不一样的,应该就是独立的11个并没有去重对吧?呃,这里边你要找那种说数据能不能看到去重效果,这个就比较难找。
07:05
这个就比较难找啊,这个你要是感兴趣,你自己找一下,我就不找了,对吧,这就是said把它放在一块,他做的一个去啊不对,神经病啊,这里边怎么可能能找得到,这已经是一个S了。对吧,就算有重复的,是不是也已经干掉了呀?还找能找到都有鬼了,如果在这找到了。说明。Jdk set集合出大问题了,出大事了。对吧,找不到找不到对脉动回来了,能找到都有鬼了啊对,能找到都有鬼了啊,这里面肯定找不到对吧啊,所以他他是多少个,前面这个auto count就多少个对吧?他这里边有SKID,有这个SK number啊不是SKU name对吧?呃,其他的呃金额倒有,你看这个是零对吧?没有关联上啊,那有没有这个。哎,你看这个参与的活动减免了5000块钱,这这这么便宜吗?这什么东西啊。
08:02
啊,IPHONE12啊,原价两万多减减免5000,差不多买了好几部对吧,一部减免个2000块钱啊,好几部减免了个5000块钱差不多啊比较合理对吧?好,这是我们看到的一个结果数据,那你想想看啊,所以如果没有做这个聚合,那么你看。这么多条数据对吧,它是九条,你要关联维表九次。现在呢,我关联为表,一次搞定。对吧,本来这一条数据是不是九条聚合的,至少九条吧,是不是至少九条聚合到一起的,是不是没问题啊,对吧,至少是九条数据,如果你不做聚合,直接关联为表,那么你这条数据本来关联一次,你你之前呢要关联九次,所以我们说了在这个之后。去。聚合之后去管理位表是不是提高效率啊,对吧。
我来说两句