00:01
好,接下来我们来看一下这个DWD层啊,DWD层呢,是舒仓的建模最核心,最核心的一层啊,那这一层它分了几步,或者说DWD层我们要做什么事啊,做什么事,呃,做什么事呢?你只需要咔。把这四件事儿说出来啊,叫选择业务过程,生命力度确定维度确定事实啊,往出一扔,那人家对方立即就对你是刮目相看啊刮目相看啊觉得嗯,终于来了一个大佬啊,这这四步还没说是啥呢,是吧?啊已经先给你定性了,如果这四步你没扔出来,那么这个就显得这个有点low一些啊,那像咱们这个新版书商升级完之后啊,无论是去这个阿里啊,还是去腾讯啊啊,还是去一些其他大厂,在面试的时候,把这四步一扔啊,基本就过了啊,就这一块就过了啊,所以说这个呢非常重要。咱来看一下哈DWD层呢,需要构建这个维度模型,一般采用的是新型模型,呈现的态势呢是星座,这也没啥说的,对吧?啊,尽量把这个呃40表周围,让它是一级维度,核心思想还是维度建模当中的星型模型,哎,呈现的态势呢是星座,那一般维度建模分成几步呢?分成标准的这么四步,那么十步。
01:16
叫选择业务过程,生命力度确定维度确认事实,乍一看云朗这都干嘛的对吧?嗯,来看第一个,第一个呢叫选择业务过程。什么叫选择业务过程呢?啊,什么叫选择业务过程,在业务系统中挑选我们感兴趣的业务线,比如说下单业务线,支付业务线,退款业务线,物流业务线,一条业务线呢,对应一个实时表,那这怎么选啊,一下看晕了是吧,大家看一下我们之前有一个笔记。第二个呢?我们第二个文档当中有这么一张图,看到了吗?这是电商,呃后台的一个,嗯,前后台吧,啊前后台一个交互的一个业务流程图,那看这张流程图当中哪些是你的业务。
02:00
是吧,咱总说Java后台业务数据,Java后台业务数据,那哪些是他的业务数据,你看这个人来到这个首页对吧?啊,一个用户来到首页,来首页干啥呢?哎,进行分类查询,进行全文检索啊,然后点了一些活动。那哪个是业务呢,这里面。他是不是动作进行了搜索对吧,进行了分类查询,是不是他做的事啊,他干了什么事?哎,这其实就是业务啊,然后进入到商品详情,产品详情是一个静态的一个一个内容,对吧?啊在这展示让你去看啊,那你看好了这个详情之后,你需要把它添加到购物车呀,那加入购物车是不就是一个业务,哎,这是一个业务,这是一个业务,好,那加入购物车之后,你要进行结算,你要进行下单,你要进行支付。那这是不是都是业务啊。都是他做的业务,然后在他售后这个管理这一块,哎,你说你可以对这个你支付完的商品可以进行什么呢?可以进行评价,对吧,哎,动作动作都是业务啊,非常标准啊,一般虽然说这个词呢,这个不是那么特别标准啊,但是我觉得啊,这个呢,呃,判断起来会比较容易一些是吧?啊就是你干了什么事嘛,那干了什么事不就动作吗?那你干不得不得用手或者用脚是吧?啊还是用用脑袋啊,总得去干一些事儿啊,干一些事那好。
03:15
评价。退款对吧?哎,还有这个发送物流,哎,发送物流,然后检查库存有多少,那这些就是代表了Java后台的业务,嗯,搜索是动作啊,不算搜索算呢,比如说你为什么说搜索算呢,算一个业务呢。你像我未来要统计搜索的什么信息,它搜索了多少次,它搜索了哪些商品,那它在这个搜索里面是不是就存在的这种度量值啊,我搜索的次数对吧,只要能存在这个相应的度量值可以累加,那它就是对应的。事务啊业务啊,是也就是对应的实时表,对吧,你判断一下它可不可以累加。哎,那那可以累加的度量值包括哪些次数,个数,件数,金额,那你看它有没有,它是不是有次数对吧,就跟你这个评价是一样的,那你评价是不是对应的评价的次数。
04:08
对吧,哎,评价次数,那你退款呢,退款对应着你退款的次数和对应退款的金额,哎,加入购物车,那加入购物车的次数,加入购物车的金额,它能够可以衡量,可以他进行累加的,那就是对应的业务,那是你看下单下单次数,下单金额。搜索统计了之后啊,还能给你啊进行推荐,看来这个是吧啊月超这个呃,深有体会哈啊,买了一瓶海骨人参丸啊,接下来又推荐了这个各种型号的海有妊娠丸是吧,就配的非常深刻,还有支付对吧,支付的次数,支付的金额啊。这个分类查询,那你分类就是查询了哪些类啊,这个呢,可以累加一个次数是吧?啊这些啊行,那这个呢,就是这个对应的业务啊,光看这业务啊,这个跟我们这个还不匹配对吧?哎,我们叫第一步叫选择业务过程啊,把这个你选择出来啊。
05:02
这是要做事啊,今天又学了一个新新的工具,CTRLCF3。啊,选择了一个神级工具哈,往上一放,好家来们看啊,第一步就要选择业务过程,那就是说我们在这个电商后台有这么多业务过程,那到底我们要选择哪些业务过程呢?来看,哎,看着有这么多,但实际呢,给大家提供的表当中没有那么多业务,我们只提供了23张表,回忆一下这张图呢,叫我这个加了一下颜色,重新绘规划了一下啊,规划了一下,你看带这个深颜色的这些都是对应的诗词表。看一下是不是十点。深颜色都是四表啊,那像这个绿颜色的,这都是对应的这个维度表啊维度表。维度表,其他的这个白颜色呢,这些呢,是未来要进行退化的一个维度表啊,要进应退化是这样一个过程,那看一下选择业务过程啊,选择业务过程,那在这个业务过程当中,我们关心哪些事件呢?那就找呗,啊找找这里面有用户,用户是什么,用户是维度表对吧?哎,订单,你说这个用户来到这个网站之后,首先第一件事他就是下单。
06:18
那下单刚才说了明确是一个业务,好,他下完单之后,哎,这个下单过程当中,他可以去领用优惠券,因为为了优惠嘛,对吧,啊,为了优惠把优惠券领过来啊,在这个订单里面可以进行一个扣款或者打折对吧,或者是不超过呃300啊什么减减50类似这样的活动啊。那再支付,下完单领完优惠券,领完之后是要支付啊对吧?哎,我可能要对他支付,哎支付的时候呢,发现哎,这里面有订单详情,你说这个订单里面包含了呃,两个手指啊,包含了两个面膜,包含了两瓶海果人参丸是吧?这是订单详情里面存储的事情,OK,那之后呢。啊,退单对吧,我这一发现啊,你这个这个还有什丸啊,这瓶是假的啊,这个药效这个不明显,那我要退款是吧,要退啊,那这样之后呃,然后呢,同时呢,我对这个要评价啊,说这个手指啊啊这个手指质量不错啊,我对他进行一个评价啊,非常棒啊非常棒,然后呢,这个手指买的比较好呢,我再对他进行一个收藏。
07:19
是吧,哎收藏起来,那前面这个加入物车啊,是在你这个订单之前啊,应该是先加入购物车,然后下单完之后这一套流程啊,就还是说这里面记录了你来到这个订单网站做了什么事。啊,那就是这就是所谓的选择业务过程,那选择业务过程遵循什么原则呢?大家记一下啊。下。这呢是DWD层。好选择业务过程。选择业务过程叫选择感兴趣的业务过程。
08:03
这个过程,这里所谓的感兴趣,其实就是你后面日后要根据这个业务过程去统计相关指标,就说你你初步判断了一下统计的需求指标当中。需求指标需要用到的业务,那我就得选择呀,你你后面要分析这个指标,你说你这个数据没有,那怎么行啊,所以说要把它选中,那这里面有个原则叫中小型公司公司它的业务表比较少,你看我们这里面23张表,基本上就满足一个中小型公司它的业务表了,那怎么办全选。全部业务过程全拿过来。全拿过来对吧?哎,所谓的全拿过来,你看我这里面一共有23张表,这里面涉及到了八个业务,八个业务过程,那对应的这八个业务过程我全都,哎,全都导入到我的数仓当中,这也是我们要做的,因为很少嘛,导过来也无所谓啊,后面呢,你先先没用到,没用到就先放在那对吧?啊,比如说退单这个业务没没做,那就先放在那啊,无所谓,万一哪天这个产品经理说我们要做一个退单相关的业务统计,那就直接来了啊,不需要再再指导了,对吧?啊,这是一种方式,那还有,那如果是这个中大型公司呢。
09:20
公司比较大,中大型公司,他一上来,比如说之前咱们有个同学去平安。平安保险一上来1000张表,然后让你搭一个数仓,然后让你快速的统计100个指标,那这种情况,那这100个指标啊,可用用不到这么1000张表啊,用到其中的这个200张表就不错了啊用200张。表统计统计这个100个指标,那这个时候你就没有必要说我一下子把1000张表都倒过来,那这个时间就会成倍么样,我只要用200张就行了,那就差了五倍呢,是吧?哎,这时候呢,叫真正的叫选择业务过程,哎,这就叫选择你感兴趣的业务过程,OK吧,哎,这是这条好嗯。
10:13
选择业务过程,那我们这个叫A吧。对好,那第二步呢,叫生命力度基本就百分。
我来说两句