00:01
好,我们开始接下来我们进入到这个两张啊,周期型快照实时表啊,这个地方啊,周期型快照时表呢,其实说白了就是我们每日全量表啊,对吧?啊,那所以说这个相对来说是比较简单的啊,我们先看加购物车吧,那先看加购时表啊,对于加购物车啊,这个事实来说,咱们前面分析过了啊,我们不会太关心哎,他这个每天的这个加减的操作,我们关心的更多的是用户的购物车当中到底有什么商品。对不对,然后根据这个事实,我们再去推做一些相关的这个推推送啊等等这些啊,那所以说在这呢,我们,呃这块呢,咱们就做了一个这种周期性快照实时表,并没有保存所有的明细操作啊,并没有并并没有保存啊好,那这时候我们来看一下这个加购物车实时表当中啊,它里边的一行数据应该指来的是什么。啊来。分析一下吧。搭购物车实时表当中,它里边的一行数据存储的应该是什么呀?
01:05
他说的应该是啥呀。他存的是一次加购物车操作吗?不是它应该是什么呀。但是应该是一个用户。购物车当中的一个商品,这是不是就是它诶,它的这个一行数据所指代的东西啊,这个要搞清楚啊,这个不是最明晰的操作啊,再重复一下,呃,加购物车视表当中,是啊,我们一个用户啊,注意一个用户购物车当中的一个SKU啊,你看这是就是呃,一个用户购物车里边的一个啊SKU啊啊是这样的啊这块呢,我们大家搞清楚就可以了。啊行,再就是在这儿我们提到的这个加购物车实时表啊,它的这个例子。好,那接下来呢,把这个数据咱们建表语句粘出来,看一下它里边的这个具体字段啊。哎,CTRL,诶V啊CTRLV,呃,那这里边字段呢,我们首先先找一下这个维度字段吧,啊维字字段,那这里边首先有一个UID,那这个就是我们的用户ID,那第二一个呢,就是商品ID就是谁,诶他的这个购物车当中有什么样的商品啊,是这样的,那呃,还是那句话,这里边并没有记录啊这个具体的操作,然后我现在想问一下大家啊,假如说我们后期啊,我就有这样的需求,我就想去统计一下咱们这个用户加购物车的这个操作的次数等等等等,我就想去统计这个事儿。
02:36
那你说我从这张表当中我能统计出来吗?能不能统计出来?显然是不能的,对不对,咱们一再强调这里面没有没有记录你那个明细的操作,所以说你要想从这里边统计,你肯定统计不了。啊,那我有没有其他的办法呢。我现在就想让大家去统计啊,咱们用户加入购物车的这个操作的这个次数,就想要统计,你说能不能统计出来。
03:02
啊,从这肯定是不行,那从别的地方行不行呢。想想啊,从别的地方行不行?他这个得灵活一些啊。啊,昨天一再说啊,咱们讲一张表,大家要熟悉一张表,但还是没有熟悉啊,咱们看一下啊。我们是不是在DWD层啊,有一张叫做dwdx log这样的表,对不对?这张表当中存了什么呢?是不是存了用户在使用咱们这个应用的过程当中所做的所有的操作呀,对不对?那所有操作你往后翻,往后翻我们找到一个这个字段叫做action ID,哎,我点错表了吧?啊,没有,还没拉到后边呢,啊,在这呢啊这不有一个action ID action ID指的是动作类型吧,它动作类型里边是不是有favor爱的,这是什么?收藏啊,Card remove,什么移除购物车card eyed加购物车对不对,那这个是不是就是咱们明细的操作了呀,我要真想让你去统计加购物车的次数,你应该统计谁是不是car I的这个次数啊,对不对,这是不是也能统计出来呀,是这样的,就是大大家得把这些表呢,一定得熟悉起来啊,得熟悉起来啊,就这么多吧,啊行,那接下来呢,咱们继续往下走啊。
04:21
好,那咱们刚才是提到了这张表跟咱们那个呃,其他的表的一个区别啊,就它里边没有明细操作,咱们搞清楚就行了,呃,刚才说了度量维度字段,咱们接下来说度量值,那度量值对于家购物车这个来说,在这儿的度量值应应该就是啥了呀?啊就是这个用户的购物车当中这件商品一共有多少件啊还还有呢,这购物车里边商品的总金额是多少?诶那个金额呢。诶,这个金额这没有是吧?啊,他这应该是那个没有,要没有的话,那咱们这儿诶有啊有一个啥,是不是有一个cut price是有一个放入购物车的价格呀,对不对啊,那所以说这个价格能作为度量值吗。
05:04
能吗?不能,它是不能做度量值的,应该怎么办?哎,应该它俩乘一下做一个度量值对吧?但是这边这个实时表当中,它它这个乘了我给咱们他没成,那所以这块呢,其实也是有点小问题的啊啊不过也没关系啊,既然他没成,那没成,假如说我要真要统计这个金额怎么办呀,你统计的时候再乘一下是不是也是也是一样的呀,是这样的啊OK,那大家知道这块啊怎么回事就行了啊,这张表咱们就说完了啊行,那说完之后呢,我们这张表其实你数据装载就比较简单了,数据装载相当于是每日全量表嘛,就把ods层最新一天的分区拿过来,放到DWD最新一天的分区是不是就完事了呀,这个比较简单啊好,那接下来往下走,看一下这个装载数据的这个circle啊,CTRLC。放在这你看是不是就是这个逻辑啊啊,是一样的啊,这个不再多说了啊,那紧接着咱们就不再单独录视频了啊,我们把剩下的这个收藏这事实表咱们也一起说了,因为他俩是一样的嘛,啊一样的啊好,我们先来分析一下收藏事实表当中一行数据所指代的这个事实是什么啊,这个是一次具体的收藏操作吗?
06:13
不是啊,这个咱们也没有去记录咱们这个收藏和取消收藏的这个明细操作啊,我们记录的是用户到底收藏了什么商品,所以说这里边儿的一行出金额就是什么,就是一个用户收藏了一个商品啊,一个用户收藏了一个商品啊,是这样的啊好,那接下来呢,咱们把这个粘出来。啊,CTRLC。嗯,来我们CTRL来喂,诶把它拿过来啊,建边语句啊,那看一下里边的字段啊,那字段呢,首先看维度啊,维度呢,我们有用户的user ID吧啊UID,然后下面呢,有一个呃S呃KID,就是用户收藏了什么藏品啊,收藏什么藏品,那下面呢,其实也有一个DT啊DT也是时间范维度嘛,什么时候收藏的啊,是这样的啊好,那这个有没有度量值呢?
07:02
他有没有度量值啊。收藏是不是跟加购物车又不一样了呀,加购之我还有一个加购的那个个数或者件数,还有一个加购的金额呢,对吧,那收藏有个数和金额吗?没有啊没有,那没有的话这个怎么办啊,是不是还是统计那个所谓的行数啊,到时候对不对,比如说我想现在想统计一下,那我这件商品啊被多少人收藏了。啊,这件商品被多少人收藏了,那是不是就是数行啊,对不对啊,就数行就行了,就是countt呗,所以这个其实也就相当是行数对它那个度量值了啊啊,那这个大家知道怎么回事就行啊,这是关于这张表的字段,那它同样也是每日全量表啊,那所以说也是直接从ods层把最新一天分区的数据拿过来就行了啊这个也比较简单啊,直接拿过来放在这儿。搞定啊,这就这张表啊,行了,那这两张表咱们这个很像啊,我就不再多说了啊,我把视频录一下。
我来说两句