00:00
好,DWT层呢,我们已经讲完了访客主题和用户主题啊,那其实这两个主题啊,就已经涵盖了整个DWT层的所有的知识点啊,那后边的这四个主题呢,也就是商品主题,优惠券主题,活动主题和地区主题啊,那他们只是业务不同啊,他们的建表思想以及数据装载的思路和技巧,那实际上啊,与用户主题是完全一致的。啊,那所以说大家只要掌握了用户主题这一个主题,那后边的四个主题呢,那肯定就没有问题了啊,是这样的啊,那所以说后边的几张表呢,我也是只带大家去看一下表结构就可以了啊,至于数据的装载,咱们还是留作练习题啊,大家呢自行练习一下啊,那完成之后呢,可以跟文档当中的最终答案进行比对,好那接下来我们就先来看一下商品主题的表结构啊来,咱打开data去看一下啊,这个呢就是商品主题的建表语句啊,那首先我们先来明确一下,那它的每行数据指代的应该是什么。
01:01
啊,注意啊,它的每行数据呢,指代的是一个SKU啊,它的累计行为啊,注意是一个SKU啊啊,那接下来呢,我们再来看一下它的列,也就是字段对吧?啊OK,我们先来看第一个字段啊,第一个字段就是这个SKID啊,商品ID这个不用多说对吧?啊OK,们先来看下边啊,下边这一部分字段都是与订单相关的统计,对吧?啊,那这里边儿呢,包括了最近一日的统计值,最近七日的统计值,最近三日的统计值,以及下边这个累积的统计值。啊,那虽然这个字段看起来比较多啊,但是呢,内容其实并不多啊,为啥?因为他们的内容是不是都是相同的呀,对吧?啊,比如举个例子啊,最近七日与最近三十日的这些统计值,它们俩比起来只是时间范围不同,对吧?啊里边统计的内容都是相同的。所以说在这儿呢,我们看一个就可以了啊,咱以最近七天的为例啊,咱去看一下这里边都包含了什么内容啊,是不是有最近七日的被下单次数,最近七日的被下单件数,当然指的是啥,指的是每个SKU最近七日被下单次数和件数,对吧?这要搞清楚啊,好接着往下走,这是最近七日参与活动被下单次数,最近七日使用优惠券被下单次数啊,最近七日哎,参与活动的优惠金额啊,最近七日使用优惠券优惠的金额啊,最近七日被下单的原始金额,最近七日被下单的最终金额。
02:25
OK,那这些呢,就是与订单相关的统计啊好,那我们再往下看啊,下边呢,都是与支付相关的统计,对吧?Payment,那这里边包括了什么内容呢?诶,包括了被支付的次数,被支付的件数,被支付的金额,那当然了,同样是分为了最近一日,最近七日、最近三日和累计值啊OK,那接下来我们再往下看啊,下面呢,是与退单相关的统计啊来,从这开始到这儿结束啊,这都是与退单相关的refund order对吧?啊那这里边包含了哪些内容呢?我们来看一下,分别是退单的次数,退单的件数以及退单的金额。
03:01
啊,那同样的是一七三十累计值啊,OK,那接着往下走啊,那再往下呢,都是与退款相关的统计,对吧?Refund payment啊,这里边呢,具体内容有啥?退款次数,退款件数,退款金额,OK,我们再往下走,下边呢是与呃加购车相关的统计对吧?这里边呢,主要包含了最近的一日、七日、三十日和累计被加入购物车的次数啊那紧接着下边呢,就是收藏相关的统计对吧?里边呢,主要就是收藏次数,包括了最近一七三十日以及累计被收藏次数啊。好,再往下走,那最后一部分呢,就是与评价相关的统计了啊,那这里面呢,那包括了好评数,中评数,差评数以及默认评价数啊,那同样的也是一期三十日还有累积的啊OK,那这就是呃,商品主题的所有字段啊OK,那这个字段说完之后呢,我们再来看一下这张表的分区规划啊,那那它的分区规划呢,与用户主题的分区规划一模一样啊,那同样的是按天分区啊,每天的分区当中存储的是什么呢?存储的是截止到当天的全量的SKU的累计行为。
04:12
啊,那同样呢,这张表它也不需要保留全部分区啊,它也是只会保留最新的两个分区啊,这个大家要注意一下,OK,那这就这样的分区规划啊好,那商品主题的表结构我们也就说完了,好,那我们接下来再继续看下一张表啊来,那下边呢是优惠券主题表啊DWT对吧?啊OK,那我们同样还是先来明确一下啊,就是它的每行数据指来的应该是啥?啊,它的每行数据是不是应该是一个优惠券的累计行为啊,没错吧?OK,那进下来我们再来看它的列,也就是字段对吧?啊来我们先看第一个字段啊,第一个字段呢,是库房ID啊,当然指的就是优惠券ID,这个不用解释啊好,那接下来我们继续往下看啊,下边一部分字段呢,都是与领取相关的统计,对吧?这里边包括了什么呀?最近一日、七日、三十日的领取次数,以及从开始至今的累积领取次数,那当然这个领取次数呢,指的是每个优惠券的被领取次数,没错吧?OK,那下来我们继续往下走啊,那下面呢,是与订单相关的统计,没错吧?来,咱们往下一点啊,好,那这些都是与订单相关的统计。
05:18
那这里边同样是包含了最近一日,七日,三十日以及累计的统计对吧?在这儿呢,我们同样只需要看一个就够了啊,我们还是以最近七日的为例,来咱看一下这里边的具体内容是什吧?那首先第一个啊,最近七日使用某券下单次数对吧?那最近七日使用某券下单的优惠金额啊,最近七日使用某券下单的原始金额,还有一个最近七日使用某券下单的最终金额。OK,这就是与订单相关的统计啊,那接下来我们再往下看啊,下边呢,都是与支付相关的统计了,来我们看这。这里边同样是一七三十,没错吧,我们也是只看一个就够了啊,咱还是看这个七天的啊,这里边包括了哪些内容呢?最近七日使用某券支付次数啊,最近七日使用某券优惠金额啊,那最终七日使用某券诶这个支付金额OK,那这个呢,就是诶支付相关的统计啊,最后还有一部分字段啊,这一部分字段是与什么相关的呀,是不是都是与过期相关的统计啊,对吧?这里边呢,包含了最近一日的过期次数,最近七日的,最近三十日的以及累积的过期次数,那这就是优惠券主题的全部字段,那最后呢,我们再来明确一下它的分区规划啊,和前面的主题表都是一样的啊,同样是按天分区,那每天一个分区,每天一个分区,每天的分区当中呢,存储的是什么?是截止到当前日期的全量的优惠券的累积行为啊,在这儿呢,同样是只需要保留最新的两个分区啊,啊,这就是他的分区规划啊,那这张表的表结构我们也就讲完了。
06:55
好,我们继续往下看啊,下一个呢,是活动主题表对吧?啊,那首先我们还是先来明确活动主题表的每行数据指在那个市场,这个大家一定得注意一下啊,活动主题表当中的一行数据指代的并不是一个活动,而是一个活动当中的一条具体的规则啊,因为大家都知道啊,就是咱的一个活动呢,它是有多个规则的,没错吧,我们在做相关统计的时候呢,都是按照具体的规则去统计的啊,这个得明确啊,好,那接下来我们继续,那接下来我们看它的字段啊,那字段呢,都有哪些呢?我们一个个来看啊,首先第一个啊,就是活动的规则ID,那第二呢就是活动ID,这个不用解释啊,接下来往下走。
07:35
下边的这一部分内容都是与订单相关的统计,对吧?但是大家注意观察一下啊,这个与订单相统计是不是只有一个最近一日的,还有一个累计值,它这儿没有什么最近七日没有最近三十日对吧?诶这是为啥呢?给大家解释一下啊,这个呢,其实是跟这个活动的生命周期是有关的,那一般情况下我们的活动的时间不会太长,对吧?比如说可能就一天啊,或者是两天或者三天,对吧?那所以说我没有必要去统计最近七天,最近30天的值,所以在这儿呢,我们只统计了一个最近一天还有累计值啊好,那现在我们来看一下具体的内容是什么啊,来我们以这个累积值为例吧,啊,从这儿到这儿啊,那首先先看第一个啊,第一个是啥,是参与某活动某规则的下单次数对吧?当然这样呢,是累积下单次数啊,那还有什么参与某活动某规则累积下单优惠金额啊,参与某活动某规则累积下单的原始金额啊,还有参与某活动某规则累积的下单最终金额。
08:33
OK,这就是与下单相关的统计啊好,我们再来看一下,下面呢,是与支付相关的统计啊来,我们把它看一下,嗯,那这里边同样呢,只包含了最近一日和累计值,没错吧啊OK,我们来看一下具体内容啊,还是以累计值为例啊那这里边呢,包括了参与某活动某规则累积支付次数,还有参与某活动某规则累积支付优惠金额啊,还有参与某活动某规则累计支付金额啊好,这就是与支付相关的统计啊好,那这些呢,就是活动主题表的全部字段啊好了,最后我们再来明确一下,它的分区同样跟前面是一样的啊,在这儿呢,我们仍然是按天分区啊,那每天的分区呢,存储截止到当天的全量的活动信息的累计行为啊,那当然在这儿呢,我们同样是只需要保留最新的两个分区就可以了啊,OK,这就是这张表的分区规划啊,那它的表结构我们也就讲完了。
09:30
啊,那接下来我们再看最后一张表啊,最后一张表呢,是地区主题表啊,啊同样还是先来看它的每行数据,指代的应该是啥啊,那它的每行数据呢,实际上是一个省份的累积行为啊,注意是一个省份啊那接下来呢,我们再来看它的字段啊,来先看第一个字段,第一个字段呢,是province ID对吧?这个当然指的就是省份ID了啊好,我们继续往下看啊,那这一部分字段呢,都是与访问相关的统计啊,那同样分为一七三十日,还有累计值对吧?在这儿呢,我们以最近七日的为例,看一下具体内容,这里边包括了什么呀?是不是包括了最近七日的访客的访问次数啊,以及最近七日的用户访问次数,或者说是用户的登录次数对吧?那OK,那这个就是与访问相关的统计。
10:15
那我们再继续往下看啊,那下边呢,都是与订单相关的统计,来从这儿到这儿啊,这里边同样是最近一期三十日还有累计值对吧?来我们看一下具体内容,还是以最近七天的为例啊,这里面包括了最近七天的下单次数啊,最近七天的下单原始金额,最近七天的下单最终金额,OK,那继续往下走,那下边呢,都是与支付相关的统计啊来我们一起看一下啊,那这里边呢,包括了最近一期30不用多说了,对吧?啊,那这里边具体的内容是啥?是最近七天的支付次数,最近七天的支付金额,OK,那再往下走。下面呢,都是与退单相关的统计啊,没错吧,那这里边的具体内容包括什么呀?包括了退单次数和退单金额啊,那再往下,那下面呢,是最后一部分内容了,对吧?那最后一部分内容呢,都是与退款相关的统计啊,这里面包括了退款的次数,退款的金额。
11:10
啊,好,那这就是地区主题表的全部字段啊,那最后呢,我们再来明确一下它的分区规划啊,那同样呢是按天分区啊,每天的分区当中存放的是截止到当前日期的全部省份的累计行为啊,那同样的只需要保留两个分区啊好,那这就是他的分区规划啊OK,那这张表的表结构我们也就说完了啊,那到目前为止呢,DWT层所有的表我们也就相当于结束了啊。
我来说两句