00:00
呃,好了各位,那现在我们继续往下走,呃,现在我们已经看完前六张表了,那接下来我们看第七张表,第七张表呢,我们还是先从这个这个ED开始啊,呃,ED呢,这张表是一个什么表,看一下是一个用户力度的,是一个加购的业务过程的最近一日的汇总表。好,看到这个标题之后,我们先来想象一下它里边会存什么样的数据,你想啊,把加购对不对,这张表呢,最近一天的数据聚合到用户力度,你能得到什么数据啊,是不是应该能得到,就是每个用户在最近一天里边的,比如说加购的次数,加购的件数,是不是就这些东西啊,还有啊,应该是能想明白的啊好,那接下来呢,咱们就把这张表的这个键面语句,还有数据状态语句拿出来们一起过一下就行了啊来吧,这个看起来很简单啊,来CTRL位我们放在这个位置,呃,那首先呢,我们先来看一下它这个最终的键表语句,先看一下表名,熟悉一下,咱们至少得会个混个脸熟对吧?OK,那现在看一看。
01:00
呃,首先DWS层对吧,Trade的数据域用户是力度,然后呢,Car I呢是它的这个业务过程,然然ED是最近一天统计周期啊行,那接下来继续往下看,看一下它具体的结构行列啊一行那仍然是一个用户,这个就不多说了,然后下面呢,就是具体的字段,字段很少,那是不是就是一个UID,一个是他最近一天的架构次数,一个是在最近一天的架构建设啊对不对,这个字段看起来少啊,你要想让它看起来更丰满一些,你可以怎么做呢?你可以从诶维度表当中,是不是往里边退化一些这个维度属性啊,对吧?啊,当然在那咱们没有去做啊,就没必要啊,行了,那接下来咱继续往下走吧,表结构就说这么多,下面呢,就是它的这个数据装载了,数据装载呢,我们包括首日和每日对吧,1D的表,咱这儿呢,都给它区分了一个首日和每日啊,先看首日首日怎么做的。是不是还是那么做,找到下加购加购车这张明细表对吧?全表数据拿过来,按照U的ID加上日期,咱们分个组,分完组之后你得到的数据是什么呢?你得到的是在每一天每一个用户他的架构次数和架构的件数,对吧?那得到之后呢,我们再按照这个天或者叫做日期进行动态分区,把数据呢写往咱们这张表就OK了,诶这个咱就过了啊,这是首日,那每日怎么做呢?每日跟首日基本上差不多啊,只不过呢,这回我只需要拿一天的这个明细,对吧?聚合到用户力度之后呢,再把数据呢,写完咱们这张表今天的分区里,那就搞定了对不对?还是这个套路全是一样的啊行了,那这张表那咱们就算是搞定了,它搞定之后,那我们就得来分析分析,那我们有没有一个与之相对应的N填的表呢?有没有,咱们还是去看一下配生指标就行啊来,我们先找到刚刚的这个1D的派生指标,呃,刚才咱们是什么力度,是用户力度对吧?呃,那完了之后什么业务过程是。
02:48
这加构的这个业务过程,那然后是不是应该就是这个呀,对吧?诶大家现在可能会需要去思考一个问题啊,什么问题,诶不对啊。你这这个派生指标只有一个呀,对不对,只有一个派生指标,我有必要去给他建一个汇总表吗?有必要吗?
03:06
就是首先咱们得知道汇总表咱们的目的是什么,是减少重复计算对吧?那怎么样才能减少重复计算,就是至少我至少至少我得有两个需求用到你这个排成指标了,用到你这汇总表了,这是不是才能叫做减少重复计算呀,对吧?是是是这个道理吧,那所以理论上我这只有一个需求会用到这张汇总表,其实理论上原则上咱们没必要给它去建啊,呃,没必要去建,但是咱们这儿仍然给它建出来了啊,这儿为什么建呢?这很道理很简单,是因为我们现在后边要做的需求跟真实的这个企业当中相比,实在是太少了,对吧,咱们这个需求相对来说比较少啊,是这样的啊,那所以在这儿呢,呃,就是会用到这样的一个汇总表的需求,它就比较少啊,那实际上呢,我们在这儿建出来这个汇总表呢,呃,其实也算是一个比较通用的了,一个用户力度,一个加构的业务过程,对吧,这样的汇也算是比较通用的,就是当企业足够多,企业当中这个需求足够多的时候,那我们这个呃,就是复用性就会比较高啊,这一点稍微的理解一下就行了啊OK,那。
04:07
在这儿呢,我们把这张表呢,就给它正确的建出来就完事了,这是我们刚看到这个1D的表,让后边呢,呃,我们还会有一个与之对应的ND的表,这已经能够看到了,对吧?那接下来咱们去找一下与之相对应的那个ND的表,来我们往下走走走找到最近N日这一小节,然后呢,往下走走找到这儿,这个是不是就是与之对应的那个ND的那个汇总表啊对吧?来,那现在呢,给它拿出来,咱们一起过一下啊,CTRLCL拿过来啊,之后呢,我们给它放在这儿啊,首先我们还是先来熟悉一下它的这个表结构表明先来过过一遍啊,这个户面验收来看一下,那这个呢,叫做DWS,叫做交易域,叫做用户力度car I car是不是就是那个加构啊对吧?然后后边再有一个ND,也就是最近N天啊,这个就不多说了,好了,现在呢,我们来明确一下,这上面的行还有列,呃,每行仍然是一个用户吧,对吧?那列有啥呢?列无非就是用户ID,再加上七天的统计值和30的统计值啊,最近七天的加购的次数,最近七天的加购的件数等等等等,这个就不再一个列举了啊。
05:07
行了,行和列基本上就是这样了,那数据装载还是怎么做呢?是不是还是找到一地表拿30个分区对吧,直接聚合哎,就得到了什么呀,就得到了这个最近30天的统计值了,有条件的聚合呢,那就是七天的统计值,行了,那就完事了,还是这么做啊,行了,这个完成之后视频我给他停一下,哎,我给。
我来说两句