00:00
呃,那咱们在做维度建模的时候呢,我们可以就是借助一个电子表格啊,咱们用表格啊,去先帮助咱们去进行一个初步的建模啊来我们这时候打开一个表格就行。新建一个空白的啊,然后再放大一点,我们这时候把那个四部曲咱们给他拿过来啊,咱们照着这个呢去做一下。截个屏。三我盯在这儿啊,来,咱们一起看着。首先咱要做的第一件事呢,就是所谓的选择业务过程对吧,那选择业务过程这时候咱们去哪儿选呀,去哪选呀。二选是不是肯定从关系型数据库里边去选呀,从咱们业务系统去选对不对,那接下来那我把咱们之前自己建的那个模拿过来啊,拿过来之后呢,我们看这儿吧,咱们呃根据这个表去选择我们感兴趣的业务过程来,咱们就从上往下一个一个选啊来第一张表activity引O,这个是活动信息表,这个东西很显然它不是一个业务,对吧,这要是做的话,这应该能做一个什么表啊。
01:03
维度表对不对,活动信息嘛,对不对啊,什么活动啊,这就是所谓的一个维度表啊,那这个不用多说,那下边呢,这些都是描述活动的,不多说,那这是不是跟商品相关的,呃,这是这DS是一个那个那个什么表来着,这是呃那个字典表啊,这个不用啊,那这两个表是地区表,地区表是不是这也是作为维度表啊,对吧?那什么trademark,这个也是商品信息,诶card in for card in for是什么?是不是加购物车信那个表啊,里边存储了所有的所有用户的加购物车的记录,对不对,那所以它是不是能够作为一个加购事实。它是没问题的,那这个呢,Common common info这啥评论信息,这是不是评论业务啊啊诶,那把它选出来作为我们的这个诶评论事实啊,那下面还有一个COB in分,Coin分是什么?优惠券信息对不对?那这个是不是也是相当于一个名词啊,名词咱们还是可以作为维度啊,这个不选啊,那些下边common柚,Co柚这是什么?是优惠券领用表对不对?领用这是不是也是一个动作呀,相当于那它是我们的优惠券领用这个业务啊,对应一个优惠券领用时表啊,那下边还有一个favor favor是什么?是收藏啊,收藏,那收藏业务啊,那下边呢,Older detail older info。
02:19
这两表都是跟订单相关的,但是我们前面讲了,咱们得选最小力度对不对,在这咱们选谁order里头没问题,那再往下呢,下边有一个order refund,引o refund的是退款啊,那所以它呢也是可以作为咱们退款业务的,那再往下呢,Payment,哎,Info啊,这是支那个支付啊对不对,那下边SK puu user,这都是维度吧,啊是这样,那所以最终咱们选出来的几个业务啊,咱们来挑一下啊,那首先这一个。啊,然后呢,两个啊三个啊,四个五个六个是不是七个呀,那咱们选来七条业务线,那当然呢,咱们这个,呃,其他咱们这20多张表呢,其实呃,并不全啊,并不全,它这里边呢,是不是只是涵盖了我们这个,呃,电商系统当中的几个核心的业务啊,对不对,其实正常情况下,咱们一个完整的电商还会有啥呀,还有他一些后台管理,比如说什么那个呃,就是售后管理呗,售后的一些什么物流啊,仓库啊,这是不是都是有具体的业务的呀,在咱们这儿呢,没有涉及到这些表,所以咱们就不选了,咱们选这咱们这有的七个业务就可以了啊,咱给他选出来啊,在咱们一个一个往哪写,那是第一个呢,就是咱们的架构。
03:28
你就写啊,在这写啊,从第二行第二行开始啊,加购啊,那加购下面呢,我们还有什么,还有这个哎,收藏啊,还有这个评论,还有什么呀,还有这个下单。啊,就订单吧,订单那还有什么呀,还有这个哎,支付啊,还有退款。啊,退款还有啥。呃,还有领券对吧,领券。领券,哎,是不是这样一共七个呀,诶,那咱们就把这个都选完了啊,都选完了,那都选完之后呢,那接下来我们进入到我们的第二步啊,第二步是干什么,第二步声明力度对不对,那咱们就一个一个声明呗,啊那先从这个开始来加构。
04:11
那对于加购来说呢,那你说咱们这个应该怎么声明啊。这个怎么证明,这里边一行初级应该是什么呀。二。哎,那前前面咱们讲过啊,我我我要声明这个这个明声明力度,要声明最小力度对不对,但现这个加构这呢啊,确实有点特殊啊,有点特殊啊,你会发现加购物车市值表啊,咱们这张表当中它一行数据呢,其实并不是一个最明细的操作。啊,为什么这个跟咱们这张表它里边的这个具体的业务逻辑是有关系的啊,咱们之前讲过加购物车这张表,你说咱们去真正会关心它那个具体的加减操作吗?呃,咱们前面说说不关心这个事儿对吧,不关事,所以这个事儿咱们做的是什么表来着?咱们是做做什么呀,是周期型哎,快照式表对不对,就是一天一快照,一天一个快照啊,那所以说实际上这张表它的力度应该就跟谁一样啊,是不是就跟咱们这张表当中的力度一样,因为我相当于每天是不是对它做了一个快照啊,对不对,那这张表当中我们一行数据到底应该是什么呀。
05:19
你就看字段呗,这张表当中一行数据应该是什么,就是一个用户。他购物车当中的一件商品。啊,这就是他这个所谓的力度,这它的一行数据呢,就是一个用户啊,他购物车里边的一种商品。啊,就是这样的啊,这是它的力度啊,所以说这个呢,咱们先特殊啊,咱们直接给它,诶定下来就行了啊,那接下来咱们看收藏,那收藏呢,跟加购是一样的,那他是不是也是做的咱们这张表做的也是这个什么,也是周期性拍照的啊,因为我们是不是也是并不关心我们用户对一件商品的具体的收藏和取消收藏的这个操作,我们关心的是这个用户最终到底收藏的什么商品对不对啊,那所以说他呢,咱们也没有去记录那个最明细的收藏和取消收藏的操作啊,那所以说最终那这这张表当中,那它的力度是不是跟我们关型数据库当中favor ino这张表的力度是相同的呀,啊,那它这里边一行数据应该是什么呀,是不是就是一个用户收藏的一个sko啊,对不对,这是它一行数据啊,它所指代的东西。
06:25
啊好,那这个咱们也明确啊,那再往下走,下边呢,那就不一样了啊,下边看评论,Comment in for。那对于抠门引后来说,大家说它一行数据指来的应该是啥呀?就是一条评论,一条具体评论对不对,这个是不能再拆的了,对吧?啊,一行数据就是一条评论啊,里边包括了你你的是好评啊,还是差评还是中评啊,就是这些啊,然后往下走,下边看订单,那订单这边咱们前面讲了分析过了,对吧,这个要选最细力度,咱们应该选谁是选那个订单明细啊对吧,咱们给它标注一下啊,就是一行数据,就是一个订单里边的一个商品项啊,那现在往下走,下边有支付,这个支付呢,它没有没有没有什么可选的对吧,一行数据就是一次。
07:09
支付记录啊,然后下边退款,那退款应该是什么呀?拿数据是不是就是一次退款记录对不对,是就是一次退款记录啊,那咱们一次退款记录里边应该退的是什么呀?应该是一个用户退了一个订单当中的哪一件商品,对不对,这就是他一行数据的这个。力度啊,这一行数据所指来的东西啊,啊,大家看最后一个领券,那领券其实一行数据应该是啥呀,就是一个用户对一个券的一个领取使用记录,对吧?啊就是这样的,这就是他的一行数据所指来的东西,那咱们就分析完了啊,就分析完了啊,这就是所谓的生命力度,其实你想一想啊,不管不管是你自己去建表,还是人家建好了,然后你去熟悉他这些表。那你会有一件事比较重要,就是什么事啊,就是你得搞清楚人家这张表当中一行数据到底指来的是什么,对吧?啊,你看咱们是不是自己去熟悉这个业务过程的表的时候,我们要做的一件事也是先要去熟悉它一行数据所指来的是什么呀,对不对,那咱们去建表的时候,咱们要明确的也是一行数据我指来的应该是什么啊,你得把这个搞清楚,然后你才能呃正确的去使用这张表啊啊,那这个第二步,咱们这个呃声明力度相当于也就完成了。
08:25
啊,那这个这时候呢,我们去看一眼这个文档啊,看一下文档,那文档当中是不是也给咱们做好了一张这样的图啊,对吧?哎,大家诶会发现啊,咱们关于订单这个业务呢,我们有两张实施表。是那个订单详情对不对,那有了订单详情,它它还有一个什么,还有一个订单,这个其实对应的就是谁呀,就是那个订单信息,应该就是订单信息,那所以在这呢,咱们也先给他加上啊,然后加上之后呢,我得给大家解释啊,就是为什么咱们这儿有了订单明细了,还要再来一个订单信息。
09:00
信息啊,这个订单信息它的力度应该就是啥,就是一行数据,就是一个订单了,对吧,那这会儿大家考虑考虑,为什么咱们已经有最明细的了,那我为什么还要再放一个订单信息。啊,大家可以考虑一下这个问题。啊,文档上有有咱们就得给它放上,那为什么要给它放上呢。是不是感觉放这个订单信息没必要啊,对不对。对不对,为什么?因为我有了明细了,有明细你是不是就能得到这个订单信息,所有的数据是不是可以啊,肯定是可以的呀,因为你这个要比它细嘛啊,我汇总一下就得到你了,得到明细汇总一下就得到信息了啊,那为什么还要放一个订单信息。其实在这儿呢,咱们是出于啊,主要是出于性能的考虑啊,出于性能的考虑,为什么啊,大家思考一个问题啊,那刚才说了,订单明细呢,能够应对所有的需求,那订单信息呢,能够应对一部分的需求,对不对啊,能够应对一部分的需求,这个大家都知道啊,然后呢,假如说我现在呢,有一些需求,OK,我从订单信息也能出结果,那从订单明细呢,那更能出结果,也是从咱俩都能出。
10:11
那这时候如果让你选的话,你选谁。肯定选订单信息,为啥呀,因为对速度快,因为订单明细,它数据越明细,那说明它它数据越怎么多越怎么样,越多越明细,是不是行数越多呀,行数越多,那相当于我数据量越大啊,那你的计算量就越大啊,那你数据没有那么细,那我数据量相对来少一些,因为我本身就是已经汇总到一个程度了,对吧,那数据量就少。啊,那所以说出于这点考虑呢,那既然我们在业务系统当中,我们有订单信息表,也有明细表,那我就给他俩都给它建出来啊,那这样一来的话,如果说需求只能从明细出,那我就从这出呗,如果说我既能从明细出,也能从信息出,那我就选择订单信息为这个呢,我的性能要好一些,数据量要少一些,呃,其实主要出于性能的考虑,所以在这儿呢,咱们呃没有完全的去遵守咱们这个理论啊,就是在这个理论的基础上呢,咱们呃又做了一个简单的一个修改,啊这样一个修改,那咱们又加了一个订单信息表,作为咱们的一个另外一个实时表。
11:12
啊,所以说这点咱们主要是出于性能的考虑啊,把这点考虑到就行啊行,那接下来我们把这说明白之后呢,我们往下接着走啊,考虑这个下一步哎,确认维度。那确认维度这一步呢,是在干什么事来着,是不是确认每一个事实表它它的维度啊,啊,它相关的维度,确认每一个事实表相关的维度啊,那这时候我们第一步要做什么事啊,第一步呢,要将所有的维度表呢,先给它找到啊,咱们先规划一下我到底应该有哪些维度表啊,那刚才前面讲过啊,我们所有的这个时时表肯定都跟时间维度相关,那所以先来一个时间维度啊,诶这这怎么回事啊。稍等一下啊。时间维度,那OK,下面呢,地区维度,这个肯定有。
12:00
维度啊,那再往后呢,还有什么维度,还有肯定有商品维度对吧?因为你比如说加购收藏,你加购的是什么,收藏是不是都是商品啊,对不对,你收藏什么商品,那所以肯定有一个商品维度啊,那他还有谁啊商品维度啊。移动啊,那还有谁呀。啊,没错,还有用户维度啊,那还有什么呀。还有啊,还有比如说那订单,我订单是不是有可能会参与活动啊,对不对,那你参与的是什么活动,那是不是肯定会有一个活动维度啊活动啊维度。维度,那还有什么呀。咱们这是不是还有一个领券的这个实时表啊,那你领券你领的是哪个券,是不是肯定还有一个优惠券维度啊优惠券。嗯。哎,优惠券,诶维度等等等等,哎就是这么多,那咱们这些实时表呢,它所涉及的维度,哎就只有这些。
13:02
只有这些,那当然呢,如果说我们下边呢,还有一些什么物流的这个业务,比如说物流业务啊,物流啊,你要是有物流业务的话,那你说咱们这个维度还会有什么维度啊。啊,比如说你所使用的快递商啊,对不对,那你所使用的这个那个咱们的仓库对不对,因为你发货你肯定得从某一个仓库发啊,然后你肯定会使用某一个快递对不对?那你的仓库以及你的这个快递商,这是不是都是咱们的维度啊对不对?那当然咱们这没有这些业务,所以这儿呢,咱就放不上了啊,放不上了,那OK,那这就是在这儿呢,我们所确定的所有的维度啊,那接下来呢,我们需要去干什么呀?去确认每一个事实表啊,已知相关的维度啊,有相关的维度,那咱们就看一个架构吧,那对于架构来说呢,我们跟时间肯定是有关系的啊,有关系咱们在这呢,打一个对勾就行,标记一下,那当然前面咱分析过,是不是所有的事实都跟时间有关,那直接往下一拉就行,那都有关系。
14:03
啊,大家大家往后看下边那地区,那对于架构来说跟地区有没有关系啊。哎,咱们得从业务上去考虑啊,有没有关系。实际上应该是有关系的,为什么?因为大家在平时的这个,呃,对加加平时咱们这个购物的这个这个经验,这个购物的经历上来说呢,啊,也有类似的经历啊,你点击加购物车的时候,它是不是会有时候会提示你所选地区这个没货呀什么的,对不对,所以说你加购的时候跟地区肯定也是有关系的,那在这呢,正常情况下应该是有关系的,那咱们有关系就来一个对勾啊CTRLC。CR给他放上就行啊,那接下来往下走,那架构,那这个咱们我看怎么看啊,咱们横着看吧,咱们一个业务一个业务去看,好吧,那架构跟商品维度有没有关系。那肯定有关系啊,你得知道他加的是什么商品对吧,所以打个对勾啊,CTRLC啊CTRLV,那跟用户有没有关系呢?有关系有关系,那跟活动跟优惠券呢,这个可能关系其实不太大啊,在这个活动优惠券主要跟谁有关系啊。
15:09
其实主要跟下单有关系,加购的时候呢,其实跟活动啊没有关系啊,那接下来往下走。那下边呢,我们这儿呢,有一个这个收藏啊,有一个收藏,那收藏跟时间有没有关系。有关系啊,这个肯定有关系的啊,那地区呢。这个地区好像没有关系吧,你收藏的时候应该不会考虑地区的对不对,所以说这个呢,咱们就不不选了啊,那跟商品有没有关系呢?那肯定是有关系的啊,那用户呢,肯定也是有关系的,那他俩就不选了,那下边看评论,评论时间有那地区呢。地区有没有关系?这个其实就得看这个具体的咱们的那个业务系统当中有没有这层关系了啊,那这个有没有关系,你其实也可以怎么看啊,也可以看咱们这个模型,你关型数据库建这个模型,你可以看一下啊,你这个评评论啊,跟地区能不能关联上。
16:00
来我们看一下啊,评论这个是咱们那个评论common那张表对吧?啊评论表,那评论表你跟地区能不能关联上呢。其实你要想关联,能不能关联上。肯定是能管得上的,对不对,因为你评论的话,你评论的是什么。评论是不是订单对不对,那你订单跟有没有关系,那有关系是不是这个也是能关联上的呀,对不对,而且这个关联上它有没有什么,有没有什么,有没有意义啊,也是有意义的,也是有意义的啊,你比如说我这个假如说我就是要统计一下,我看看咱们全国哪个地区这个最爱给这个差评,对不对啊,这个其实也是有一定的这个这个业务呃,这个意义的也是有一定意义的啊,当然这个没有什么太太太强的这个意义啊,没有太太多的意义,那所以这个你要给他想加上这层关系,我能关联上,当然你不加其实也没事,这个其实是没有什么实际的这个分析价值啊,那所以说这个呢,咱们就不加了啊,那评论跟商品有没有关系,这肯定是有的啊,那跟用户呢有关系啊OK,那跟活动跟优惠券呢,这个关系就不大了,咱们就不选了啊,你要看下边这个订单,订单时间肯定有关系,地区呢,肯定有关系商品呢。
17:14
这个它关联不上,因为咱们这一行数据是啥呀,一行数据是是一个订单对吧,一个订单是不是可能会对应多个商品啊,对不对,所以这儿呢,哎,没有办法直接关联上,那所以这个他就不关联了,跟用户有没有关系,有,那跟活动呢有关系,因为订单是不是可以参与活动啊,那优惠券呢有关系,因为我下单可以使用优惠券嘛,啊所以说这个能关联上那下边。订单明细,那订单明细呢,我跟地区有没有关系,有啊跟商品呢肯定是有的,跟用户呢啊是有的,活动呢有啊优惠券也是有的啊,那所以说那他们关联上就可以了啊,那看下边支付,那对于支付来说呢,跟地区啊,其实这个应该是有一定的分析价值的,对不对,有分析价值我们给它加上啊统计不同地区啊,那咱们这个支付金额分别是多少啊,然后看下边啊,那下边咱们跟商品有没有关系呢?
18:08
其实这个没关系不大啊,因为咱们只只关心最终一个金额是多少对吧,不关心你所卖的东西啊,那就最终来用户来有关系,那跟活动跟优惠券呢,咱们关系也不大啊,那就不选了啊,那往下走,那下边咱这儿呢,有一个呃退款业务,有一个领券业务,咱们一个个看啊,先看退款,那退款肯定跟地区它是有关系的啊,跟商品呢。啊也是有关系的,咱们得知道退的是什么商品嘛,那谁退的呢?咱们也得知道啊,OK,那这个玩意儿之后看下边领券,那对于领券来说呢,我们领券跟用户是有关系的啊,跟跟跟跟开店是有关系啊,跟优惠券是有关系的啊,那跟商品有没有关系呢?其实这个呃不能说,呃,这个跟商品有关系啊,这个应该是什么啊,是这样的啊,大家都知道我我领券肯定是适用于某些商品的,对不对,那其实你在你领券的时候。
19:00
啊,你会去关联一个商品吗?会,会给咱们这个领领券记录去关联一个商品吗?这是不会的啊,至于这个券到底能用在什么商品上,这应该属于什么的范畴啊。是不是属于这个优惠券维度的范畴啊,这应该属于优惠券信息吧,我这个优惠券我到底是哪种类型的,我适用于什么商品,这应该是属于优惠券的信息,对不对啊,属于优惠券的描述信息啊,是这样的啊,那所以说这个呢,应该算作咱们优惠券维度里边的一个字段啊,或者是多个字段。啊,所以说这个呢,跟商品是没有办法关联上的啊好,那这个大家搞清楚就可以了。啊,OK,那到这儿呢,我们相当于就哎完成了我们这个呃关联啊,完成了这个关联啊,其实就是做这样一件事啊OK,那做这样一件事的时候呢,这个相对来说呢,它比较灵活啊,比较灵活,那到底能不能关联上这个视什么而定啊,是不是视咱们的业务系统而定啊,那我电商啊,如果是电商业务,那OK,我这样去关联,那可能来到公司之后呢,我我这个公司不是一个电商公司啊,我可能是做这个呃短视频的,对吧?啊或者做做这种呃资讯的,做资讯的啊,那你业务不同,那你这个去关联的时候呢,那肯定这个也不同了,所以说这个相对来说比较灵活,大家需要视具体的业务而定。
20:20
啊,是具体业务而定啊,那这里边儿呢,一个比较就是通用的一个方法,就是什么呢?你可以参照咱们这个业务系统的表。啊,参照业务系统的表啊,因为这个业务系统表之间是不是有各种各样的关联关系啊,对不对啊,到时候呢,你可以根据这层关联关系去判断一下,哎,你比如说假如说我现在呢,我需要考虑一下,哎,我想我觉得觉得什么呀,我觉得这个收藏跟地区它也有关系,也有关系,你觉得有关系,这时候呢,你就去可以考虑考虑,那我这个到底能不能关联上啊,那咱们这看一下收藏跟我的地区能不能关联上啊。啊,你可以考虑一下能不能关联上。你找到收藏表,这是不是收藏啊?那收藏跟地区能关联上吗?
21:03
啊,有的人可能会觉得什么叫关联上啊,我是不是能连上线就叫关联上,是这样的吗?不是这样的啊,不一定你这个线能连上,你它俩就能关联上,它就它俩有可能你通过连线能连上的话,我所有都能连上,对不对,但是你连上之后没有任何的意义,那不行,你比如说咱们这儿看一下,我收藏跟这个地区到底有没有意义啊,那首先收藏那favorite favorite跟谁有关系?往上翻是不是跟用户有关系啊啊,那收藏我首先我跟用户关联上了对不对,那关联上之后用户跟谁有关系。跟订单有关系对吧,订单有关系之后呢,我是不是跟跟哪跟地区也能关联上,但是是不是也是能连上,能连上线呀,能连上这个有意义吗。没有任何意义,你想啊,我用户啊,跟收藏能关联上啊,这相当于什么,我是不是这个用户收藏了某件商品啊,对不对,再再往上呢,用户我去下单,下单时候买东西了,然后你这买的东西跟你收藏那个东西,它可能是不是有可能不是一样啊啊对吧,而且你这个订单啊,关联一个地区,这个订单跟你那个收藏的商品有有半毛钱关系吗?也没有任何关系,所以说不是说能连上线就是有关系,你还是得考虑这个具体的业务啊,如果说从业务上你考虑到他们俩能关联上,那然后呢,你可以从这张表里,呃,从这个模型当中去校验一下,我看能不能关联上啊,能能关联上,那你就给他加上就行了啊,是这样的啊,所以说呃,大家需要去啊,还是以什么为主呢?与咱们的这个业务系统当中的业务逻辑为主啊,从业务逻辑去考虑到底能不能关联上啊,啊,那这个咱们就相当于就呃完成了第三步了确认维度啊,那最后一步呢,我们去做这个所谓的确认事实对吧。
22:46
确事实,那确认事实后边呢,我们再给它加一个字段,叫做度量值。啊度量值,那这时候呢,我们就开始去,呃,考虑咱们这个度量值了啊,那咱们先看第一个啊,对于架构来说。价格来说,咱这里边儿一行数据,是不是就是一个用户他购物车里边的一件商品呀,对不对,那咱们这个度量的东西应该是啥呀。
23:06
度量应该是啥?商品的第一个件数对不对,那然后呢,商品的这个总金额对不对啊金额啊,这就是你加购物车你需要考虑的东西啊,然后再往下呢,下边收藏,那对于收藏这个来说,你说收藏咱们这个有一个明显的度量值吗。有没有明显度量值?好像没有一个冥想度量值对吧,没有说我收藏的时候还有一个收藏几件,然后呢,收藏金额是这是不是没有啊对不对,那这个没有度量值,那咱们统计什么呢。统计什么呀?总结什么呀?其实没有的话呢,那你后期想想你分析,你分析什么,是不是应该去分析我这个,比如说啊分析啊每个用户。啊,那收藏商品的这个呃,种类数啊,或者是什么呀,或者是什么这个次数是不是就这些东西啊啊,因为它没有一个明显的度量值嘛,那我统计的就是啊次数啊,或者是什么个数这些东西了啊是这样的啊,那这边咱们一般情况下是这样的,如果说一个业务事实没有明显的度量值啊,那我们最终啊就统计的就是什么呀,就是它会有一个所谓的一个隐含的度量值,那就是什么呀。
24:25
就是所谓的一个次数,就所谓的一个次数,比如说收藏的次数啊,是这样的啊,那同样还有下面的,比如说评论,评论也是一样的道理啊,那你对于评论来说,你说我有一个明显的度量制吗。有吗?评论我是不是也没有什么评论了,这个几件评论了什么多少钱,是不是也没有这个明显的多量值啊,那他呢,我们统计也是啥呀,也是相当于是这个比如说也是次数吧啊,那比如说同一件商品啊,我好评数有多少次或者有多少个啊,那差评数有多少次或者有多少个,是不是就统计的也是这些东西啊,是这样的啊,那你去统计这些度量值的时候,那你说你那个聚合函数应该就是啥呀。
25:10
其实就是countt是不是就是数行数啊,相当于是啊,就是这样的啊,就是这个意思啊好,那这块呢,咱把这点搞清楚就行了,就是没有明显的度量值的时候呢,那一般情况下我们统计的就是所谓的一个次数和个数,最终落实到circle呢,你其实统计的是行数啊,统计就是行数啊,那这个后续我们去做需求的时候呢,这块大家就能明白了啊,那也说没有度量值,那我们就比如说就写行数吧,咱们统计就是行数啊。因为我一行数据,它所指代的是不是就是一个具体的这个操作呀,对吧?啊,一次具体的业务操作嘛,那我统计的行数,那就是相当于这个操作的次数嘛,是这个意思,诶行。好,那接下来往下走,下面呢,到了这个订单信息和明细了啊,那信息明细呢,其实这里边呃,我们要统计的这个度量值就比较明确了啊,以订单信息为例,那你说你统计的度量值应该有什么呀。
26:06
呃,是不是就是那个订单的金额呀,但是咱们金额有好几个,对不对,咱们有什么金额来着,原始金额啊,原来始,然后呢,还有什么呀,还有优惠。啊,还有什么呀,还有哎运费还有什么呀,最终金额啊,最终这是不是都是咱们下单这个实值表当的一些金额呀,诶咱们都给它放在这儿,那就来说明细,那对于明细来说呢,我们首先会有一个什么。因为它里边一行数据就是一个订单当中的一个商品项,对不对,那所以说这首先第一个应该是啥商品的个数对不对啊,我订单里边我买了第一件商品买了几个啊,所以说会有一个件数或者叫做个数啊,那后边呢,还有啥呀,是不是也会有对应的金额呀,对不对,只不过这个金额,呃,大家要想一想啊,这个金额我们应该跟上面这个金额应该有啥区别。
27:01
啊,或者有什么关联是这样的啊,你看啊,你一个完整的订单,你是不是会分为原始优惠运费最终对不对,然后大家来思考一个问题啊,你说我们这个优惠啊。哎,包括这个运费,这都是针对于什么来的,是不是都针对整个订单来的呀,对不对,那所以说我们到了这个订单明细当中,那你说你需要做一件什么事。你要做些什么事?那是不是每一个商品项,它肯定会有一个自己的原始金额,这个没错吧,啊,那这个直接拿过来就行了,那对于其他的呢。原始啊,这肯定有原始,那对于优惠运费来说,这个怎么办呀,因为大家都知道优惠和优惠和运费本身是针对于整个订单来的,但是我现在哎,我还有一个订单明细,这怎么做呀,咱们需要做一个。拆单相当于是啊,怎么拆哎,你需要把这针对于一个完整订单的优惠,你需要拆,拆分到什么呀,拆分到不同的商品项里边,对不对,你比如说我这个整个订单一共优惠了十块钱,然后呢,我买了三件商品,三种商品啊,那我商品一比如说分三块,它分三块,这个呢,我可能分四块钱。
28:14
对不对,哎,你需要拆分到不同的商品箱里边,所以说这里边儿呢,我们应该会有一个哎分摊的优惠。分摊啊优惠啊优惠,然后还有一个什么呀,分摊哎运费啊,然后还会有一个诶分摊的最终金额。最终。诶是这样的啊,所以这里边儿呢,咱们到时候呢,会涉及到一个分摊的一个操作啊好,那这点咱们大家明确就行了啊,再来看最后一个支付啊,那这个支付来说,它相对来说比较简单了,它支付就是啥呀。支付金额呗,对吧,支付金额这个没什么可说的啊,来接下来看下边退款,那对于退款来说,咱们应该度量值应该有啥呀,这边也是有退款的件数以及退款的金额啊,那接下来最后一个领券,那对于领券来说,大家说这个有没有什么度量值啊。
29:10
度量值有没有?金额优惠券确实有金额,有什么优惠金额对不对,但那个是度量值吗。这不是度量值,这是什么呀?优惠金额,这是不是也是属于优惠券信息里边他的一个信息啊,对对不对,我优惠券我到底满多少减多少,这应该是他的一个信息吧,啊,那所以对他来说,对这个业务来说,这个事实来说,我的度量值应该就是啥,其实应该也是行数啊,也是行数。啊行数啊,也是行数啊,所谓行数呢,其实就是最终就是相当于领取次数对吧?啊领取次数就是行数啊,因为这个我去统计行数的时候呢,所谓的行数就是你那个啊业务事件的次数啊,因为一行数就是指代一个业务事件嘛,啊就是这个意思啊好,那这个呢,就是咱们诶在这给大家讲到的这个一个完整的什么东西,一个完整的维度建模的一个过程,那这四步就做完了啊,选择一个过程,生命力度确认,维度确认实实就做完了,做完之后得到一个这样的表呢,这个表它是有一个术语的啊,那这个术语叫什么,叫做什么业务总线矩阵啊,业务总线矩阵是一个矩阵嘛,啊然后呢,咱们就可以根据这个矩阵呢去进行这个建表了,那当然根据它我们直接基本上就能知道咱们的事实表怎么去建了,对吧,有什么实时表,实时表当中字段咱们都列出来了啊,完了之后呢,剩下就是维度表了,维度表咱们怎么去建来着,前面讲了,那你就直接去哪去咱们的。
30:36
那个关系数据库里边,其实或者就是咱们ods层呗,Ods层关系数据库是不是一样的呀,那从ods层你就去找跟地区相关的表都找到,然后找到一起跟商品相关的照在一起就行了啊,就是这样的一个过程啊好,那这个完事之后把视频录一下啊。
我来说两句