00:00
好,接下来第二步呢,叫生命力度,是选择业务过程,我们把我们感兴趣的业务过程选择完之后,要生命力度。啊,选择业务过程,那这时候我给大家画这个要画这个矩阵图啊画矩阵图。这时候要画矩阵了,把你选择的这个业务啊都给它,嗯,画出来用这个Excel啊,一般用Excel。怎么卡住了。自从来这边上课,这个电脑就。性能就不好了啊,性能就不好了啊,可能咱们是这个有毒王啊是吧,去三里屯这个频率比较高,就上见了打开。随便开一个,那刚才我们选择业务过程啊,选择哪几个业务过程呢?啊,选择了这个这么几个啊,啊也就说我们来到这个网站之后,要加入购物车对吧。加购。你就你就你就回忆一下你来到这网站,你干了啥事?第一件事,把数据加,把这个商品加到购物车啊之后呢,你要下单对吧?啊下单那下完单这里面会产生一个下单时表啊,下单明细时表哈时表啊,这也是下单表,然后再来下完单之后,你要对他进行这个啊领用优惠券,领用优惠券进行支付。
01:26
还有除了领优惠券之后呢,你要对他进行支付,对吧,支付。支付完了之后呢,你要对他啊这个不满意,不满意就退款呗,退退单,退单之后呢,你要对他进行一个啊评价。评价评价之后呢,哎,满意了就收藏呗,收藏。个么个下单明细四表啊,这要注意一下哈,这里面它对应的这个力度不一样,这个下单和下单明细不知道大家能不能捋清楚啊捋清楚。
02:09
嗯,可以给大家看一下啊,看一看下单表和这个下单明细到底什么区别啊。老同学,这个捋不开,这叫订单表。打开。订单表,那订单表里面有啥啊,看一下有啥啊,订单表里面有的是。呃,总订单总金额对吧,啊,这个订单状态啊,订单状态,然后订单总金额之后呢,是订单的这个地址啊发货地址。之后这是描述吧,啊,创建时间操作时间就没啥了,对吧?哎,也就是说这里面有这个订单的总金额,那你看一下订单详情有什么东西,订单详情里面它有对应的这个商品的详细信息,比如说联想啊什么什么型号,然后这个图片的地址是什么。然后这个订单这个价格对吧,这一个商品的价格,然后这个商品买了几件。
03:03
相当于是这样一个关系啊,比如说我这里面有个订单,订单总金额啊,100元啊,然后呢,地址呢,地址呢是这个3V5差不多记住这些信息就OK了,那订单详情呢,订单详情记录的是,哎,我这个这个100元里面有手指。啊啊手指两个手指是五块钱一卷吧,啊五块这个记不住啊,班长知道吗?然后呢,是两个两个同时呢,这里面还有这个像面膜啊,面膜十块一个。十块,嗯,乘以十块乘以50吧,这就50块了是吧,50块还有一个海口认识丸。
04:03
啊,人参丸,嗯,人参丸,你这是一个吧,啊一个多少啊,十块六十四十是吧,41个看一个,嗯,有订单详情记录的是这些信息,订单里面记录的是它啊这里面的力度不一样,不一样,有的同学可能会说这个订单详情它不是一个动作。吧啊,这个下单肯定是个动作,那单不是单详情数记IDID还加上了对应的度量值,它是有这两个特点。啊,也就说动作的那个并不是特别标准啊,最准确的是你要看他有没有ID和多样值啊,动作能干掉一半,他只要有动作那基本上就是啊,那如果这个再进一步判断它是不是呢?啊,你可以判断它有没有这个外界ID和规量值,你看一下啊。有没有商品的数量对吧,商品的数量是不是可以累加呀,商品的价格啊,就是这个订单详情,他们俩一相乘,这就可以进行累加了,那这个是可以累加,除了它之外还有什么呢。
05:05
看有一个sqidd相当于是这个商品详细信息的一个ID,可以对它进行深层次的一个维度描述啊,这是它是一个事实表的一个原因在这啊,这个要理解一下啊,它是比较特殊的啊,比较特殊好,那回过头来我们继续看啊,我们把这个第一步呢,选择业务过程已经搞定,搞定之后呢,我们要声明力度啊,声明力度,那声明力度什么叫为力度。什么叫力度?什么叫力度啊,哎,数据力度呢,是指数据仓库中的数据中保存数据的细化程度,综合的程度级别,这个比较官方,就乍一看还是没太懂啊,没太懂没太懂,看这个啊,直接看这个案例说订单当中每个商品项作为下单40表中的一行信息。啊,力度呢,为每次。简单粗暴一点,就是订单表当中一行信息表示的什么事。
06:05
订单表当中一行信息是不是就表示一次下单呢?我就下了一次单呗,啊叫一次下单OK,那如果我订单信息表里面改了,改成每周的订单次数。作为一行。我每周哎下,比如说下了50单,那这一行表示的就是五。那它的力度呢,就是周按周进行统计聚合了,那好,那如果我这行信息表示的是每月的订单次数。那它的力度就是每月理解一下,再看一下这些数据,我们打开订单。订单表,目前订单表呢,是你看这个是小B是吧?啊,这是B春菊啊下了一个订单,这个订单呢是149啊,这是他下的。这是他一次订单的一个金额,那如果说他下面假如说啊,他后面还有这个啊小B假如说啊,假如说这个,那他吧,你说这是一个人哈,咱们认为他是一个人,那一个人的话,我会把这两行假如说聚合了。
07:10
这个人这一天下了两次单。然后我把它存放到一行信息里面,说这个小B购买了,今天购买了两次订单,那它的力度呢,就是天。那同样道理,那如果这换成周啊,换成周,那这一行信息,比如说这一周买了14订单。那它的力度就是周。这是不同的力度吧,啊,就说这一行信息代表了什么事啊,代表的是周的信息还是月的信息,还是天的信息,那那如果说它的力度不一样,而且还是比较高的力度,那给大家举个例子,如果D达地层,对,就是统计时间范围,如果是每周或者每月的这种力度。那么后续我让你统计。
08:00
每天干了什么事,你能不能统计?假如说啊,这一行信息里面记录的是小张啊小张。这一天下了十次订单啊,这一天下了十次订单,那我想让你统计他每一个订单什么时候下来,我想让你统计每一个订单什么时候下来。能不能统计,比如说如果你这个力度比较粗了,给你的是每月他干了什么事,我让你统计他每天干了什么事,能统计吗?那就统计不了了。理解一下,嗯,他能统计吗。就不能统计了,那再举个例子啊,假如说你看这个订单和订单详情,他俩这个力度就不一样,那就不一样,这个订单详情呢,表示的是一个订单。一个订单是100元啊,对吧,这这一行信息表示这样,那我这个订单详情呢,表示的是手指,他买的这个手指五块两个。
09:03
是吗?哎两个,那我问你,我就想让你统计,哎,他这个今天所有用户购买手指。花了多少钱,或者买手纸卖了多少个?哎,我给你个需求。需求是统计今天手指卖了多少个,怎么统计,或者卖了多少钱吧,卖了多少钱。这是不同明显的不同两个力度哈,记住了哈,看一下哎,一个是订单里面,哎,就一个金额,一共卖了是是几百块钱啊,这个是订单详情,有手指,有面膜,有海文之丸。那统计的时候卖多少钱,你能用哪一个,你是不是只能用这个订单详情啊,因为它的力度是不是更细一些,到了每一个商品多少钱。好,那这时候用这个订单详情详情,因为它是最小力度,相当于是最小力度是吧,能统计的指标更多一些,更作好,那问题又来了,那同学那你这个订单订单就没有意义了,那说我们不用他得了呗,对吧,只用这个订单详情我就能把所有事情搞定,是这样吗?哎,是这样的啊,如果有订单详情的话,理论上来说就没有这个订单也是能搞定的,为啥这个订单这个总金额是不是可以它乘以它加上它乘以它,再加上它乘以它是不是能得到的?
10:37
一样能得到,那为什么还要有它呢?比如说我让你统计这个指标,统计今天啊,这个辽宁地区一共卖了多少钱。所有商品一共卖了多钱多少钱,那怎么办啊,对吧,如果我问你统计辽宁地区一共卖了多少钱。
11:08
我用这个订单详情能不能算出来,能啊,怎么算?哎,一个订单详情,你一个订单详情去加呗,哎他俩加完,比如说这个加完等于十块对吧,然后他俩加完等于50,这再加完呢,等于40啊先把这三个加一起,然后再继续加其他详情加完之后能够统计出来,那这时候谁最快呢?我是不是直接从订单这取,就直接就是100,这个订单就代表了100,那我把这把一共有十个订单,把十个订单一累加是完事了。哎,这就是大力度计算,那这时候呢,我可以用谁呀,那就说可以用。订单表啊,计算那最快最快那几个力度比较那就快一些,但是用订单详情能不能搞定呢?用订单详情也能搞定。
12:00
也能搞定,那就说细力度有细粒的好处,出力度有出力的好处,各自有自己的应用场景,那在生产环境下,也就说这个DWD层这块怎么来选择啊,怎么来选择最小力度啊,我们这里面叫选择最小力度声明嘛啊声明最小力度上面,最小力度在这一层呢,尽量不要聚合。来看一下这个文档。在这上面,力度意味着确定事实表中一行信息代表啊,一行数据表示什么啊,表示什么信息应该尽可能选择最小力度,以此应对各种各样的需求啊,我们的要求呢,是最小力度啊,最小力度。那你看一下吧,看一下我们刚才选择的这个业务过程这些,看看他们的力度都是多少啊力度。看一下加入购物车,那加入购物车一行信息是不是就是加入一次对吧?哎,你加入一它的力度呢,是比这个下单明细师资表也说明细要出的啊,它是最小最小的哈。
13:26
最小力度表示呢,是一个商品,它是一个商品吗?啊一个商品相关信息比较小,那这呢是一个订单,一个订单相当来说呃,要出一些啊跟他比出一些,那下面呢,领用优惠券,那就是一次呗,啊这都是最小力度了啊,然后支付,那支付就当前次这一次啊一次。呃,然后退退单,退单呢,也是你这一次退单啊的相关的一些信息。
14:02
还有评价,那就说针对这一个商品的一个评价,一次收藏也是这一次。比如说这里面除了这个下单之外,其他的都是最小力度啊,在真正的这个开发的时候呢,我们尽可能的选择最小力度啊,选择最小力度,其实只要你不做任何聚合操作就可以了,你说怎么实现这个最小力度很简单。也就说了半天,怎么实现不做聚合操作就行,在DWD层不做聚合操作。比如说你从这个ods传过来的原始数据,它是什么力度,那你就是什么力度就行了,哎,就行了啊,当然像这个订单这个特殊啊,有一定的大力度啊,方便你后期处理也行啊,我们会来会把这个力度放在哪呢?放在一个DWS和DWT。
15:01
把这个里面进行在那那里面进行数据的一个聚合操作,对吧?嗯,好,这是第二步声明力度,嗯。
我来说两句