00:00
好,那接下来呢,就应该到我们的DWS层了,因为刚才我们已经把整个的DWM层呢做了一个回顾,对吧,现在呢,就到DWS层啊呃,那在DWS层当中呢,我们首先来看一下我们要学习的内容,其实在DWM层我们就已经知道了,DWM层有四张宽表,我们要去做,对吧?第一个是访客主题。就是按的。按照mid这一套来的,对吧,访客,因为大家在离线收当当中有访客有用户对吧,用户呢是按U的ID来的,这个呢,是按照这个访客m midd来的啊这一套,然后第二个商品主题宽表,那其实看到商品这个东西大家也都知道了,这个呢确实是最难的。最复杂的就是这张表了。啊,最复杂的就是这个商品主题宽表。它呢就涉及到呃,七个流叫做叫做连接对吧,然后接下来呢,是这个。
01:04
地区主题和关键词主题啊,关键词呢,就是我们搜索的这个关键字,我们可以把它做成一个词语,我们稍微来看一下啊,就是类似于这样子的,做成一个这样的一个词云,对吧,把这个高频的搜索关键词呢,给它写出来是这个意思啊好,那最后呢,主要的区别在于前面两个需求,我们还是用data STEM API来做啊,那后面两个需求呢,我们换flink circle,因为主要在于公司当中,他很有可能用fli circle,也有可能用这个data stream,都有可能。啊,它都是有可能的,对吧,所以呢,咱们就分开两个来做。啊,分两个来做啊,呃,但是呢,并不是说上面两个只能用data stream,下面两个只能用circle,不是这个意思,可以互换。可以交换,这个没关系,对吧,是这样的一种情况啊好,那这个呢,我们就了解了,弗Li so克呢,你主要注意一下这里边两个东西,一个是关于link搜当中事件时间的提取,第二个就是开窗,像这个滑动窗口,滚动窗口,绘画窗口,它是开窗的一个。
02:19
方式你要会对吧,啊就搞定了行,那接下来呢,我们还是展开,我们接下要看一下设计思路,之前我们都已经看到在DWM层,现在呢,我们主要做的就是这样的东西了,之前我们在DWM层当中,我们也看过这张图,对吧,之前让大家看到,首先这个是指标。这个竖着看是指标对吧,也就是说我们的需求,它属于ABS,最终的ABS要做的事情。呃,那这样横向看。对吧,横向看那就是纬度。就是我们的维度。
03:01
啊,那换句话说呢,它就是我们的DWS。对吧,所以呢,我们有这个四个维度,诶商访客,商品,地区关键词这么四个主题。对吧,啊好,那我们之前看到的呢,再多看一层,就是多看什么呢?那我们为了完成某个DWS层当中的某一个指标。对吧,某一个具体的ADS指标的时候,我们要对这个指标来看一下,他需不需要对DWD层的数据做加工。对吧,他要不要对DWD层的数据做加工,如果需要,那么这个数据呢,就是我们的DWM层。对吧,所以最终呢,我们看到DWM层呢,有这么四张表。啊,之前呢,我们是看到这的,对吧,现在呢,最后一步就不用看了,因为DWM层我们已经准备好了,我们就直接看到谁啊。
04:01
DWS就够了,对吧,所以呢,这里边来自于这啊这些个表。对吧,而且你要注意一下啊,每一个由于我们这个来自于DWM层,他两个主题不一样,它的主题也不一样,对吧,每个人的主题可能都不一样,所以明显的这个需求呢,我们要同时消费多个主题的数据,把多个主题的数据放到一起做加工,对不对。能体会到这个点吗?这个应该没问题吧,啊大家呢,就是把弹幕扣一扣,免得就是容易犯困,对吧,你扣一扣弹幕回回一对吧,看一看弹幕,这个时候呢,也不容易犯困,我知道周一上午嘛,确实大家比较容易犯困。比较容易犯困啊,所以大家都扣一口这个。会是问题,有时候问的问题比较简单,主要是希望大家自己能够去抠一抠,对吧,又有斜杠出来了,对,可以搞搞怪对吧,这样的话人比较容易清醒。
05:09
啊。是不是对吧啊,不要总是在那趴着听课,然后就睡着了对吧,手也不动啊什么的。最好就是听一听啊,然后呢,动一动手,动一动手啊好,那接下来呢,我们要具体的一个表一个表去分析了,对吧,里边要用到的指标啊这些东西行,那我们把这个呢。
我来说两句