00:00
简单长成样,那这呢是每日优惠券的一个统计,这是DWS层,也就相当于每天的一个优惠券统计,那一涉及到这个,我估计大家应该有点感觉了吧。是吧,这张这张简单,这张表少啊,我发现大家呢,就是对表少就容易处理啊,表少那首先DWS层,哎,我要统计哪些字段呢?哎,就是增加上你想要的一些度量值啊,度量值领用次数,下单次数,使用支付次数啊,使用支数我额外增加这些。那下面这个呢,是对应的这个字段啊,对应的字段。那这个是怎么处理的呢?来看一下。看。嗯,行,大家看一下啊,来看一下啊,首先呢,这里面数据我标成两种颜色,一种叫CEO,一种叫C,就是两张表,那CU呢,是上面这张表。
01:00
对吧,CI呢,是下面这张表。那也就是说这里面这些的字段,我通过一张表是不能够完全覆盖的。那你看它核心主体是优惠券的领用表,哪张是优惠券领用表呢?这张优惠券领用表。优惠券领用表不能覆盖所有信息,那需要一张什么表呢?需要一张优惠券表,我能把这些信息全部覆盖。那我想到的就是咔咔卡卡招引呢,哎,进行一个招引不就完了吗?哎招引那优惠券领用这块呢,它是由于数据设计的原因哈,这块呢,你需要来一个left噪应把它俩拼接在一起。啊,也是把它拼接在一起,也就是说你要保证优惠券有,但是呢,优惠券这个信息不一定有,其实在这个深圳的生产环境下是不存在这种情况的,只不过我们照的数据啊,啊这块它有可能招音不上,那招音不上的,你来一个love的噪音,至少保证这里面有数据,那就能把它拼接上,对吧?啊是这个事儿哈,行,那往下看,那这里面主要来处理什么呢?首先第一个。
02:06
如果你是黑体的这些字的话。不需要。为什么你直接从这个优惠券领用,这张市值表里面原封不动,你用啥我覆盖啥?哎,不充这张表啊I。啊,是从下面这张表哈,是从下面下面这个优惠券这张表里面信息,你说黑的这些信息,你从优惠券这张信息里面原封不动直接对应过来就可以。那就可以,你需要唯一处理的是优惠券领用这块领用里面主要来处理的就是次数,次数次数什么什么次数。啊,领用的次数,那这个次数呢,怎么来做,哎,怎么来做。领用的次数呢,我就需要按照这个领用的这个优惠券的ID进行相应的分组,你说哪一个优惠券的ID被领了多少次,知道吗?啊,一涉及到什么什么次啊,可以用count,也可以用some一个累加,那这里面就是some先判断。
03:08
不同的优惠券累积什么呢?如果你这个get time时间是今天。那我就累加一次啊,是今天累加一次,今天再累加一次,不同的这个优惠券ID,那这里面要注意,那为什么这个加上一个格式化呢?因为这个get time这个时间呢,它后面呢,有那个十分秒啊十分秒,所以说你需要这块提前处理一下。啊,提前处理一下,比如说把这个呢,只要这个时间发生了,有这么一个时间,那我就加一次有这么一个get type时间。我就加一次,也是就是按照这个领用的这个时间进行相应的一个区分的。嗯,好,那之后呢,下面还有。妖精次数。啊,也就是说使用的下单次数,同样道理也是这种方式。啊,把它加在一起,还有呢,是使用支付的次数,什么什么次数,那我就判断这个时间出现了。
04:03
那我就把它加在一起啊,加一次出现一个这个use time,加一次出现use time加一次,那它是按照这个相同用户ID的啊进行。处理啊,相当ID处理啊好,那往下呢,是这里面领用次数啊,还有呢,使用次数被支付次数对应上这些字段就完事了啊,那这个呢,相对说被简单一些,就是两张小表进行一个噪音处理,那这个次数呢,相当于需要进行一个呃萨姆雷加。啊,累加之前呢,进行一个判断,就看那个时间。啊,看时间。好。简单的操作一下。下里面插入相应的数据。
05:01
搞定,呃,这个呢,是每日优惠券的一个统计啊,你看我这里面标记了一个预留啊,什么叫预留呢?呃,就是因为这里面的表结构设计的不是那么特别合理,在未来你的adi层里面其实是没有跟优惠券相关的这个呃,指标的一个分析。啊,在我们下一版的话,会加上这个优惠券相关的主题分析哈,所以说这版呢,就是暂时在这儿放着啊,就是一个预留啊,当然本次课呢啊,你可以去导他,不导其实也没问题啊,不导也没问题啊,但这个表呢,我们还是要创建的,因为在这个未来这个脚本里面,你要不创建这个表的话,那它会抛异常啊,所以说你要把这个表提前创建好就OK了。这是这块,那同时我就把这个活动这个也说了得了。嗯,活动那个。我就不那么啊DS加T了哈,那看一下这个活动呢。其实跟这个优惠券的思想是一样的哈,思路。
06:05
那看一下在这个活动表当中,我们还是增加了两个度量值,一般增加的都是度量值啊,比如说下单活动的下单次数,还有活动的这个支付次数啊,支付次数,那同样道理,你这是DWS城,我要向。DWD里面去找对应的这个表,那DWD里哪张表跟它对应呢?DWD,我看啊DWD,这是d WD effect order in符,还有呢是active info,主要的是这个active info。他提供了大量的信息。A信息。啊,这几个黑的跟他们直接覆盖,如果只是黑的的话,那你就不需要进行后续的一个。只是黑的话不需要噪音,那现在呢,这个出现一个红的,红的呢又出现什么什么次数,比如说要统计它对应的度量值。跟我们刚才那个优惠券领用是一样的,只是加了一个上判断,如果当前创建时间啊,也是下单的时候,是下单的创建时间是今天。
07:09
那我就加一次,是今天加一次。好,那下面呢是支付次数,支付次数呢是支付的时间,如果是今天。那我就加一次,哎,就是通过这个时间去判断对应的次数。啊,是这样的一个结果哈,那这块呢,有个小的插曲啊,有个小的插曲啊,什么小的插曲呢,就是支付这一块。啊,你这个订单下下完之后什么时候支付。我们是按照创建这个订单,创建时间进行创建分区的。比如说订单呢,是二十二二十三点,嗯,四十五十九分。订单创建了。订单创建没问题吧,订单创建到了第二天,第二天01:30的时候。
08:01
支付了。01:30的时候支付了,那这个怎么办?你说支付时间算谁的。啊,上哪些呢。啊,就这种特殊情况。嗯,那这种呢,就需要把这个时间呢过滤出来,你看我这里加了两个时间,呃,一个呢是这个时间,如果是当天。那没问题,或者这个时间是前一天的,我也要给他累加一些,比如说这个时间呢,我可以是今天的。也可以是昨天的,就防止这种昨天下昨天创建的数据,然后今天进行一个啊,昨天下的单,今天进行一个支付啊,这种跨跨天的那天的话,我这里面就来了一个时间段呢,这个是今天或者是昨天。啊,或者说然后呢,活动ID不会空进行后续的这一个判断啊,是为了为了解决这种事儿啊,解决这种事,统计这个支付的呢次数啊好,那这个结束之后我们来处理一下哈。
09:15
这。拿过来。里面插入对应的数据。OK。比如说DWD层呢,我们就差不多了,还差一张表购买行为。嗯。
10:00
行,那这块呢,这个就OK了哈,你说d wi层。
我来说两句