00:00
好,接下来我们来看一下这个第四步叫确定事实啊确定事实,那确定事实的什么呢?人员,你这个事实表已经确定好了,对吧,这几张表。啊,这张表在这个exce也有对吧,这几张表,其实这不就是试资表吗?已经确定好了,那你还确定是啥呀?哎,这里面确定的事实的叫度量值。确定40表的度量值,那什么叫度量值啊?什么叫度量值?度量值呢,通常指的就是次数,个数,金额啊,能够进行累加的值,这个词呢,我看这写的哈。那订单次数。我括号一下吧,给你们备备注一下啊,一般指的是次数个数这数。金额可以累加。这它的特点,这是它特点,那行,那例如什么订单金额啊,下单次数啊,在DWD层呢,以业务过程为建模啊,建模驱动。
01:07
呃,基于每一个业务过程的特点呢,构建最细度度的这个明细事时成啊,实时表呢,可适当的这个呃,宽表化处理,这句话说的有点啰嗦啊,没有必要,那往下我们直接给大家确定一下这个度量值哈,那所谓的确定度量值怎么确定的?很简单。三把这个记一下啊。第四步。确定事实确定事实,确定事实的度量值。个数次数。这样说。金额好,那来吧,我们来还是拿这个Excel啊,Excel往这一放,那首先我们要确定的是加入购物车,加入购车不好,我先判断这个,呃,下单先确定一下下单的度量值有哪些,下单表的度量值,那走吧,你把这个表打开下单表。
02:14
打开,那谁是它的度量值呢?谁能累加呀。是不是订单总金额啊,哎,总金额可以累加好拿回来。比如说它的度量值呢,是总金额,每一个订单的总金额吗?OK,除他之外,那我们再来看还有没有其他值。往下找订单状态用户表啊,然后呢是order po再往后走。嗯,Number创建时间,操作时间往后走。嗯,这个呢,省份ID这个。看到这几个了吗?啊,叫reduce amount啊,还有这个什么original total amount啊,还有这个fat free啊,看这个英文你可能是不太好啊,直接拿这个。
03:06
这张表当中,这有一个订单表对吧?哎,订单表那除了这个final total amount,就是总金额之外,那还有哪些值能够进行累加呢?那你看吧,这张表当中。是不是跟金额、个数、件数、次数相关联的,那么这优惠金额是多少?哎,我想算一下这个所有订单中优惠了多少钱?啊,原价是多少,所有订单的原价,还有所有订单的运费。啊,运费,那你看这不就跟钱相关的,不就拿都拿过来了吗,优惠金额。这就是确定它的度量值啊一个阶段,那再来一个。再来一个原价金额啊,原价金额。好,那听错了。那这是原价金额,再来一个。
04:00
运费金额啊,运费呢,还涉及到一个这个分摊,分摊到订单详情,每一个商品的一个运费啊。那稍微要复杂一点。对吧,这些是度量值吧,一样你先上。不良者运费金额。这些可不可以累加啊,你就看他能不能累加总金额,能不能累加所有订单的一个总金额能加吧,啊所有订单优惠总共优惠了多少啊,所有订单的所有的原价是多少啊,这个所有订单的总共运费是多少?那再往下呢,下单明细式表,看一下下单明细,下单明细订单详情呗,哎,订单详情,那你看这里面谁能累加。啊,谁能来下。价格啊,订单每一个商品的价格对吧?啊,每一个商品的价格啊,还有呢,是这个商品的数量,还有他俩的相乘乘级。比如说这个商品,这个海骨日丸100块钱一瓶啊,然后数量呢,买两瓶,那就是这个订单详情的总金额,能不能算总金额是200吧,然后每一个商品的单价啊,然后每一个商品的数量啊,其实这里面我们更关注的是这个订单详情的总金额和数量。
05:14
好拿过来,那这里面就是总金额。再一个呢,就是数量对吧,这是我们关心的,嗯,到底买了多少个商品嘛,那再来领用优惠券,那看一下领用优惠券。领用优惠券。这样啊,优惠券领用对吧,优惠券领用,那优惠券领用里面你看看有没有度量值。购物卷iddd,然后业务卷状态,然后各种时间找了半天,好像没找到这个度量值,那它是不是实值表呢?它是啊是这里面其实它隐含了一个什么含义呢?领用优惠券的次数。
06:01
哎,总共领了多少优惠券,哎,所以说这里面啊,它是有个隐含的叫次数。那你这么一说,他有这个隐含的这个领用优惠券次数,那你再看一下这个下单明细和下单他们有没有次数呢,有没有隐含这个次数呢?比如说下单的多少次。下单明细表多少次?哎,其实这里面也隐含了一个下单次数的问题,它这里面也有一个下单次数是隐含的啊次数OK,那这也是他的数量值,那再往下支付啊支付看一下支付表。支付表找一下这支付流水,那支付表当中哪一个是它的度量值呢?支付的金额肯定是,那它是否有隐含的支付的次数是不是也有啊,哎,支付的金额和对应的支付次数,OK,那这里呢,就是支付的金额是吧,次数OK,搞定,再往下退单啊,那退单大家能猜到吧,我就直接写了,是不是退单的次数和退单的金额呀啊,退多少单之后评价评价的话没有金额,那他就只有隐含的一个次数啊,收藏的以此类推,它也有收藏的次数。
07:23
啊,那上面还有一个加购加购,加购的话呢,有一个加,我们可以看一下啊加入购车。加入购物车这呢加购表啊,加购表里面有什么呢?哎,有加入购物车时的一个价格和数量,其实这俩呢,哎,加入购物车的总金额也能够算出来,对吧,它俩一相乘啊,算出来了跟那个订单相,呃订单呃明细明细表是差不多的,那同时呢,还有一个加入购物车的次数。好,那这里面就是。它会比较多一些。加入购物车的商品数量,还有加入购物车当中的商品的总金额。
08:04
总金额怎么来?总金额就是商品的数量乘以商品的单价,那再来就是,呃,加入购物车的。次数啊,一共加了多少次啊,加了多少次。哎,大概呢,就把这个度量值,每一个事实表的度量值全部都确定好了,往这一放,因为后面这个产品经理出的一些指标都是跟度量值相关的。你想想你自己给自己出一些指标,你说你是一个老板,你要统计这个未来这个,呃,公司当中哪些指标呢,为你的决策有作用呢。你关心什么?啊,我们一般关心的,比如说这个支付,我们关心今天一共支付了多少金额啊,支付了多少笔多少笔订单,对吧,我今天退单多少啊,像这个退单啊,这个是非常非常关心的。你像咱们开发的时候,一般不怎么关心退单,但是呢,在这个,呃,老板那角度来说,他最关心的就是退了多少钱,因为退单这钱已经进到手了,然后又给退了,这多遗憾呢啊,他肯定关心这个是越少越好,对吧?啊,越少越好。
09:12
退单多少次?退单金额是什么?那他还关心什么呢?他还关心的是什么时间,什么地点,哪一个用户把哪一个商品给退了。对吧,然后退的钱是多少,退的次数多少。你看到吗?哎,就是你未来统计指标的时候,你会发现啊,我们都是按照这个。维度加40这么一个组合,嗯,怎么个组合,我选择相应的这个维度,然后对应上对应的这个四值表,然后挂上这个度量值。就是我未来要统计的指标。稍微思考一下啊,是不是这样。就是我未来关心的都是这些度量值啊,因为它能够累加你,你你关心这个商品,关心比如说用户性别,那你关心用户性别的啥呀,你是不是还是关心用户性别的次数啊,啊,或者说用户的一个比例啊。
10:11
那么还是能够可以累加的吗?次数、个数,件数、金额,哎,都得落到这种度量值上,是我们未来关心的。好,那这个是度量值啊,有点印象,OK,那我们再来看一下这个笔记里面有没有遗漏的内容啊。啊,四实表和维度表呢,关联的比较灵活,但是为了对应更复杂的业务啊,可以将能关联上的表呢,尽量关联上啊,如何判断是否能关联上,在业务表中,只要两张表能够通过中间表进行关联,就说明能够关联上啊,这呢是我们在打勾的时候遵循的原则,你看我这里面其实打的比较少啊,咱们上课的时候打的比较多,那打的多呢和少都取决于你未来你要统计哪些指标啊,你要统计这个指标,你给它勾上,你不统计的话,你不勾也没事儿啊,那这里面说的是你尽可能的把它勾上对吧?啊,尽可能勾上,这样的话呢,这个呃,书上能够分析的指标呢,就会更多一些。
11:03
好,致使呢,舒仓的这个维度建模就已经完毕了,那DWD层呢,是以这个业务过程为驱动的,什么叫业务过程,是不是这些事儿啊,你干了什么事啊,完全是按照这个事儿去做的,那后面呢,像我们这个DWSDWT啊,以及ADS呢,是以这个需求为驱动的。就说未来我们这个宽表层,它能够分析哪些需求,我们把它进行一个聚合操作。哎,和这个维度建模就已经没关系了,比如说智齿现在维度建模已经完事了。啊,后续的宽表,那是为了我们方便统计需求指标在做的事,嗯。保存一下。
我来说两句