00:00
好,那DWS层呢,只剩下最后三个主题了,那分别是优惠券主题啊,活动主题啊,还有地区主题啊,然后在这呢,我需要给大家说明一下啊,那这三个主题他们的数据装载需要用到的这个思路啊,或者是技巧啊,我们在前边所讲的三个主题里边都已经涉及到了啊,那所以说那接下来的这三个主题呢,呃,我就只带着大家呢去看一下每张表的表结构,那至于每张表的数据装载呢,大家可以作为练习题啊,自己练习一下啊,那我们的文档当中呢,都有这个最终的答案啊,大家做完之后呢,可以自己对比一下,好,那我们现在先看优惠券主题的表结构啊,那首先我们先来明确一下啊,这张表它的每行数据应该是什么?那优惠券主题表当中每行数据就是每个优惠券在每天的汇总行为。啊,OK,这就是它的行,注意每行就是一个优惠券啊好,那接下来呢,我们再来看它的列啊,就是它的字段,来咱一个一个看啊,首先第一个coupon ID,这很简单,是不是就是优惠券ID啊,对吧?那接下来我们继续往下走啊,那还有啥呀?啊,那下一个字段是get count get count,是不是指的是这个优惠券的被领取次数啊,对吧?当然指的是这个优惠券在每一天被领取的次数。
01:15
没错吧,OK,那接下来往下走啊,下一个。Count这个是啥呀?这个呢,指的是这个优惠券啊,被使用下单的次数啊,那下一个amount,这是啥啊?这个指的是用券下单的优惠金额啊,OK,继续往下走,那还有一个original amount,这是啥呀?这是用券订单的原价金额。OK,那接下来继续,那还有一个是older final,这指的是啥呀?这个指的是用券下单的最终金额。OK,我们继续往下走,下一个呢,是payment count payment count是啥呢?是被使用支付的次数。啊,这是被使用支付的次数啊,OK,那接下来咱们继续往下走,那那下一个是啥?下一个是payment reduce amount,这个指的是用券支付的优惠金额。
02:04
啊,那再再有还有一个,那就是啥是呃,Payment amount对吧?那payment amount指的是什么呢?指的是用券支付的总金额啊,然后下一个下一个是count,那当然这个呢,指的就是过期次数了,OK,那这就是优惠券主题表的所有字段啊OK,那最后呢,我们再来说一下它的分区规划啊那当然这个这个表呢,也是使用DT字段进行分区啊,那同样呢,是每天一个分区啊,每天的分区当中存放的是什么呢?是当天活跃的优惠券了,汇总行为,那什么叫活跃的优惠券呢?啊,很简单,只要这个券啊在今天被人领了,或者是被人用了啊,甚至是今天都过期了,这是不是都叫做活跃呀,对吧?啊是这样的啊,那这就是这张表的分区规划啊,那优惠券主题表的表结构我们就说完了啊,OK,那紧紧接着我们看下一张啊,那下一张呢,是活动主题表对吧?那我们来看一下活动主题表的表结构啊,那同样还是先来明确一下它的每行数据应该是一个什么。
03:05
注意啊,那它的每行数据不是一个活动啊,而是什么呢?而是一个活动当中的一条规则,然后呢,在某天的汇总行为啊,也是我们去统计活动相关的指标的时候呢,我们都是按规则去统计的啊OK,这个一定得注意一下啊,这是它的行啊,那接下来呢,我们来再来看它的列,也就是它的字段对吧?那接下来我们一起来看啊,那首先第一个啊,Activity弱ID,这是不是就是活动规则ID啊对吧?那下一个是activity ID,那这个指的是啥?是不是就是这个规则所属的活动的ID啊OK,那接下来继续啊,下一个下一个是啥?下一个是older count。那这个指的是啥呀?是不是应该是参与某活动某规则的下单次数啊,啊,这个大家一定要搞清楚啊,是参与某活动某规则啊,因为我们这儿呢,都是按照规则去分别统计的啊好,下一个啊,下一个是啥?下一个是older reduce amount,这个当然指的是参与某活动某规则的下单减免金额啊OK,下一个下一呢是older amount,这是啥呀?这个呢,是参与某活动某规则下单的原始金额啊,然后再往下older final amount,那这指的是啥?这个只是参与某活动某规则哎,下单的最终金额啊好,接下来我们再往下走,下边呢,是payment count啊,这个当然指的就是参与某活动某规则的支付次数啊,下一个payment reduce amount,这指的是啥?是参与某活动规则支付减免金额啊,然后再往下最后一个啊,Payment amount,这个当然指的就是参与某活动规。
04:42
它的支付金额了,OK,那这就是活动主题表的所有字段啊,那最终我们再来说一下它的分区规划啊,那它同样是以DT作为分区字段对吧?那同样呢,是按天分区,每天的分区当中存放的是什么呢?每天的分区当中存放的是哎,这个当天的活跃的活动规则的汇总行为对吧?那同样什么叫做活跃呀,很简单,是不是有人参与这个活动它就叫活跃呀?那这就是这张表的分区规划啊好,那活动主题表的表结构我们也就说完了啊好,那接下来我们再看最后一张表啊,也就是地区主题表啊,那它的表结构什么样的呢?我们首先来明确一下啊,这张表的每行数据是什么?注意啊,它的每行数据是诶,一个省份啊,然后呢,在某天的汇总行为。
05:29
啊,这是它的每行啊,接下来我们再来看它的列,也就是字段对吧?首先第一个province ID啊,那这个很简单,是不是就是省份ID或者是咱们的地区ID啊对吧?OK,那接着往下走,下一个,下一个呢是visit count,然后再往下呢,还有一个low count,那他俩是一对对吧?那一个是什么?一个是访问次数,一个是登录次数,那当然具体内容应该是啥呀?是不是应该是每个省份在每一天的登录次数或者是访问次数啊,然后大家要注意啊,这个访问次数呢,咱不关注是否注册对吧?但是登录次数咱统计的是不是都是注册用户的呀,这一定要注意啊,OK,进来进来继续往下走,那下边呢,还有一个visitor count以及user count,那这个呢,统计的啥是反客人数以及用户人数,注意啊,一个是次数,一个是人数啊好接着往下走,那再往下呢,是older count,那这个是啥呀?是不是就是下单次数啊,那当然在这指的就是每个省份啊,每一天的下单总次数,好继续往下走,那下边是啥,Older original amount,这是啥呀?是诶每个省份。
06:30
然后呢,每天的下单原始金额啊,那下边这个呢,就是下单最终金额order final,然后继续往下走,下边还有一个payment count,这啥是支付次数,然后再往下payment amount是支付金额啊,然后再往下,那这俩分别是啥呀?诶分别是退单的次数,退单的金额,下边呢是退款的次数以及退款的金额。OK,那这就是这张表的字段啊,那最后我们再来看一下这张表的分区规划啊,那它的分区规划呢,跟之前一样,那同样呢,是以DT作为分区字段啊,然后呢,按天分区,每天的分区当中存放的是什么呢?每天的分区里边存放的是当天的活跃地区的汇总行为。
07:10
啊,那当然呢,这个所谓的活跃地区指的是啥呀?啊,是不是这个地区有人下单,这个地区有人支付,那是不是就叫活跃呀?啊,就这个意思啊,OK,那这就是地区这张表的,诶表结构好,那三张表的表结构呢,我们就说完了啊那至于这个数据装载,我就不再重复给大家去演示这个SF的编写了啊,大家自己练习一下就可以了。
我来说两句