00:00
啊来各位同学,那按照我们这个固定的流程呢,下一步我们要做的就是一个构建所谓的一个业务总线矩阵,那接下来咱们来看一看这个所谓的业务总线矩阵到底是个什么东西啊来我们看5.2.3,呃,那下边呢,这有一个PPT对吧?这个PPT当中就展现出来了什么东西展现出来了谓的业务总线矩阵啊来我把它打开,咱一起看一看这个东西到底是什么啊,到底怎么去看啊来,那这就是一个所谓的业务总线矩阵,既然是矩阵嘛,矩阵是不是就应该是有行有列,是一个二维的表格啊对吧?好,那完了之后我们来看一看这个二维的表格当中,每行指的是什么,每列指的是什么,实际上它每行指代的就是一个啥,其实就是一个业务过程,你看有加购,有下单,有取消订单,有支付等等,是不是有这么多的业务过程啊,对吧,然后前面我把它的数据也给它放在这个位置了,对吧?是不是这些业务过程属于这个域,这些过程属于这个域啊,对吧?等等等等,哎,这个咱们应该是能看懂的,好,那这里边一个列对应的是一个什么呢?是不是就是一个维度啊,对吧?好,那比如说我们以这为例,那这是不会有一个。
01:00
地区维度啊,对吧?OK,好,那么大家一度观察,你看我们这个业务过程跟维度的这个焦点的地方,是不是有的有对勾,有的没对勾啊,对吧?有对勾就表示什么呢?就表示这个业务过程与该维度它是有一个关联关系的,没错吧?OK,那也就是啥意思呢?诶,我下单我得知道是从哪儿下的单,诶是这道理吧?OK,那你再注意观察一个地方,你比如说看这下单我后边是不是还有一个什么退单类型啊,对吧?他俩有关系吗?八竿子打不着啊对不对?退单类型这显然是谁相关的钱是跟退单这个业务过程相关的,对不对啊,什么叫退单类型,这个给大家简单说一下退类型,说一下这是啥?就我们在退单的时候,咱们是不是可以选择退货退款,也可以选择仅退款呀,对不对,这个到底是哪种类型,是不是取决于你是在什么时候申请退单的,对吧,你要是发货了啊,对吧,你再去申请退单,那就是退货退款对吧,要是没发货你就退单,那是不是就仅退款呀,对吧,就这意思,那所以这个维度他跟我这个下单是不是一一点关系都没有,对对他他俩就不需要打对勾对吧,就这个意思好了,那这就是所谓。
02:00
这的业务总线矩阵好了,那接下来呢,咱们继续往下看,咱看这啊,下边有一段话,这个比较重要,咱们一起来读一下,他说在总线矩阵当中呢,呃,我们这个,呃,一行数据是不是代表的是一个业务过程,而一个列代表的是一个维度啊,对吧?那OK,一个业务过程我们通常对应什么来着?是不是维度模型当中的一张什么事实表,注意是事物形式表啊,一个业务过程是不是对应的是一个事物形式表啊,对不对?一个业务上会对应一个什么周期快照表吗?不一定它它会对应一个这个累计快照表吗?也不一定,对吧?所以这一点必须得明确,一个业务过程我们对应的是一张事务实时表,好,那我们继续往下看,那一个维度呢,我们说通常就对应维度模型当中的一张维度表,对吧?比如举个例子,那往上看,这有一个时间,那我是不是就得有一个时间维度表,有一个用户,是不是就得一个用户维度表了,对吧?就这个意思,好,那我们继续往下看,那所以说呢,咱们构建总线矩阵的过程,就是设计维度模型的过程,这一点大家应该是。
03:00
能够体会出来的吧,对吧,我只要把这个所谓的总线矩阵构建出来了,对不对,那我整个维度模型当中有哪些事物事实表,那咱们是不是就已经清晰了,有哪些维度表是不是也已经也已经就已经清晰了,对吧?所以整个维度模型咱基本上就给它规划出来了啊好,那完之后继续往下看,但是这里边我们有一点需要注意,需要注意的是什么呢?总线矩阵当中只包含事物时表了。就是因为一一个业务一行是不是只对应一个事务时表啊,对吧,那我们的事表是不是还有另外两种类型,一个是什么来着?周期快照表,还有一个是累计快照表,对吧?那两种表在我们这个总线矩阵当中是并没有体现出来的,对吧?所以说那两那另外的那两种表咱们需要怎么做呢?你需要根据具体的需求再单独的设计啊是这样的啊,那也是啥意思呢?诶如果说诶我有这种存量型的指标,那我就去设计周期快照表,如果我有这种诶多事物关联统计的指标,那我再去设计这种累计快照表,对吧,你得根据需求单独设计啊是这样的啊好了,那也就实际上呢,我们整个业务总线矩阵呢,它其实是以谁为主体的呢?
04:06
以咱们这个事物师表为主体的,对吧?因为本身我们呃维度模型当中占据绝对主要的师表是不是就是呃这个事物师表对吧?所以说我们在设计整个维度模型的时候呢,咱们就先以这个最重要的啊,这个事物师表这个为准去设计,对吧?设计完之后,那我们再根据具体的需求去增加另外两种类型的视表,这个呢?这这一点大家要体会一下啊,好了,那完之后咱们继续往下进行,那从这段话我们应该能看出来啊,就是说我们构建业务总线矩阵应该是对于维度呃这个模型的一个设计来说是比较重要的,对吧,你只要把它给它整出来了,那我们的维度模型是不是基本上就成型了,对吧?好,现在关键问题来了,咱们怎样能得到这样的一个业务总线矩阵?怎样能得到这样的一个左线矩阵,对吧,我这个左线轴是怎样一步一步的给他整出来的。怎样长出来的?啊,那肯定是设计出来的对吧?前面我说一句话对吧?什么呀,就是我们构建总建矩阵的过程,是不是就是设计维度模型的过程啊,对吧?啊,没,没问题吧,好,那么之后怎样能把这个东西给它设计出来呢?到底哎,其实你往下看,咱们这儿有一句话啊,他说你只需要按照事物事实表的设计流程就能得到一个这样的总线矩阵,诶这个咱们怎么理解呢?哎,其实这个说法也不难理解啊好了,各同学,那现在给大家分析一下啊,首先大家得知道啊,就是整个维度模型当中谁是核心来着,事实表是核心对吧?那在事实表当中又是谁占据了绝对的主要地位呢?是不是就是事物实表占据了绝对的主要地位呢?对吧?OK,好,那所以说其实事物事表的一个设计流程对不对,就能够将咱们最终的这个维度模型给勾勒出来,是这样的啊OK,那所以在这呢,咱们去体会一下这个事儿啊,那首先事物实表的设计流程是不是就这四个步骤,大家得回忆起来对吧?好,那现在呢,咱们把这四个步骤给它拿出来,大家跟我一起看一下啊F3我。
05:58
盯在这个位置,然后呢,我们就对照着这样一个一这样的一个步骤,对吧?咱们去看一看我这个总线矩到底能不能够露出来,我上面PPT呢,只是画了一个简版啊,那下边我这放了一个电子表格,里边放置的就是咱们呃整个数仓最完整的一个这个总线矩阵,来咱们给大家打开一起看一下啊好,这是我们将来这个数据仓库当中的一个完整的业务总线矩阵,OK啊好,那现在呢,咱们就按照我们刚刚所说的这个事物实时表的设计步骤,对吧?咱们去呃,去体会一下,我到底怎样根据它能得到咱们下边的这个总线矩阵,来咱们来过一下看能不能行啊,首先第一步,我们看这儿第一步是干什么来着,是选择业务过程对不对,选择业务过程啊,好,那你想一想选择业务过程,那我们要做的工作就是什么来着,是不是就是选择咱们感兴趣的业务过程,对吧?你选出来了谁了,那你得干啥呢?你是不是得给他记一下啊,对不对?你比如说我选了下单,我选了支付,我选了退单,选择退款,你是不是得给他记录下来,对吧?好,那你记在哪呢?是不是就可以找一个这样的电子表格,OK,我给它放在这一列上面啊,对吧。
06:58
好,那我就选出来了,有加购,有下单,有取消订单,有支付,有退单,有退款,我是不是可以把它选出来,对不对,可以记下来对吧?好,那业务过程选完了之后,我们就到下一步,下一步是什么来着,生命力度对吧?声明力度,你是不是得声明第一步选所选择的每一个业务过程的力度。
07:15
没问题吧,OK,好,那完了之后呢,你每个业务过程的力度是不是也要记一下啊,对吧?好,那怎么办呢?我就在后边说是再加一列,我每个业务过程后边我给他跟跟一个力度啊,对吧?好那比如举个例子,我们以加购为例,你加购那它的力度应该是什么呢?啊,说白了就是你将来这张表当中一行所指代的内容是什么,对吧?OK,那这应该是啥?是不是就是一次加购物车的操作呀,对吧?OK,那这个需要精确到是谁在什么时候对什么商品是不是进行了加购操作呀,对吧?OK,好,那这就是咱们这个力度,好那按照同样的方式,你需要对每一个业务过程都去生平一个力度,好那声明完之后,你就给它记录在这儿呗,那我们这个就先不一个去看了啊,咱们先把这个过程走完好,我们继续往下走,那下一步该什么,是不是就是所谓的确认维度啊,对吧?好,那这个确认维度,咱们要确认的是什么的维度来着。
08:01
是每个业务过程相关的维度吧,这得一个一个去确定,对吧?好,那比如说在这儿我先确定架构,那你说与架构相关的维度有啥呀?按照我们的分析,是不是时间用户商品会跟加购有关啊,对吧?那所以在这儿呢,我就会增上这样的几列时间用户商品,然后在这儿呢,是不是给他打一个勾啊,对吧?诶这就表明OK,架构与他们是相关的,那同样的道理,那下边呢,我到这个下单这个业务过程的时候,对吧?你是不是也得分析与下单相关的这个维度都有谁啊对吧?你会发现有时间,有用户商面,有地区,有活动,有有优惠券,这都是跟下单相关的一些维度等等等等,好,那这些咱们都分析完之后,是不是就会得到一个这样的一个,诶,业务过程和维度的一个关系图啊,对吧,好,那得到之后我们继续往下走,下一步啥。是不是就可以去确认事实了呀,对吧?好,那确认事实我们得确认什么事实,得确认每一个业务过程的事实吧,对不对?这一点大家应该是能想明白了,好,那现在我们继续往下看,那每一个业务过程的事实我们如何确定呢?那就逐个确定呗,对吧?比如说对于加购而言,加购你说它的度量值应该有啥?那是不是就是商品的件数对吧?你加一次购物车,你加了几件嘛?对吧?好,继续往下走,那你下单呢?下单这个可能要多一些,对吧?比如说有什么下单的件数对吧?你下单的原始金额,下单的最终金额,下单的各种优惠金额,这是不是都可以作为度量值啊对吧?OK,好,那这个就是诶我们确认事实这样的一个步骤,OK,好,你会发现啊,你按照这样的一个操作之后,这样的一个过程,你操作完之后,是不是整个所谓的业务总线矩阵就出来了呀,对吧,没问题吧,也就是说咱们这个所谓的业务总线矩阵,你主要就是根据这样的一个步骤去做就完事了,你把这个步骤走完,那总线局它自然而然就出来了,只要他出来之后,那我们这儿建什么事实表,建什么维度表,是不是基本上就OK了呀。
09:46
对吧?哎,但是这里边需要注意的一点是,那这里边的事时表只包含什么来着,事物时表对吧?那为那另外的两种那个所谓的周期快照表和呃,累计快照表,你得单独的再根据需求去设计才行啊,这个要理解一下行了,那这里边实际上还有一个小细节,我刚才没给大家说,那哪呢,就是后边这个所谓的度良,诶,你注意观察一下啊,你会发现我们再去确认这些业务过程的度量的时候,有些业务过程它没有一个明显的度量值。
10:14
嗯,对吧,你像有明显度量值的,比如说前面加购,加购的件数对不对,下单下单的件数,下单的金额,这是不是都是明显的度量值啊,对吧?但是你看下边,比如说举个例子,我们以谁为例的,以收藏为例,那你说收藏这个业务过程当指的收藏商品啊,那它的度量值应该是什么,它有一个什么,收藏了几件,或者是收藏了多少金额这样的一个概念吗?没有对吧,收藏就是点一下收藏就完事了,对不对,没有什么件数,没有金额,当然它没有一个明显的度量值,那这种业务过程的它的度量值应该是什么呢?没有明显的度量值,那我们就哎会给它设置一个什么呢?相当于是一个隐含的度量值,这个隐含的度量值其实就是什么呢?就是次数一,这个怎么理解啊,你想啊,就是在这张表当中,将来它每行数据表示的应该是一个什么含义来着,就是它的力度应该是,是不是应该是一个人对一个商品的一次收藏操作呀,对吧?那所以说一行就表示一次对吧?所以在度量值就是一个隐含的次数一,就是将来呢,我们可以统计什么值,统计比如说这个商品被收藏的次数,对吧?诶是这样的,你可以用它去统计这个次数,好,那其实啊,这个所谓的隐含的度量值次数一。
11:24
不仅仅只位于这几个业务过程当中,你想想我们前面这些有度量值的业务过程,他们有没有那个所谓的隐含的次数一啊,也有啊,对不对?你比如说对于加购而言,我除了有加购的介数,我加购的次数是不是也有对吧?一行是不是表明这个人对这个商品是不是加购的一次啊,对吧,我是不是也能统计,比如说每个商品的,哎,这个被加货的次数啊等等,这些是不是也能统计,对吧?那所以说这个隐含的次数一位于每一个事物实表当中,这一点咱们要理解一下啊,行了,那各位同学,那截止到现在这个构建业务总线矩阵这一步咱们就完成了,实际上呢,你只需要根据这几个步骤就能得到这个总线矩阵,只要得到它了,那接下来咱们需要做什么工作,是不是就可以根据它去设计那个所谓的维度模型了,对吧?咱们直接来到这一小节对吧?维度模型咱们设计的时候无非就是试表加维度表呗,对吧?怎么设计呢?哎,就参考上面的总线矩阵就完事了,那设计出来的表我们都给它放在DW层,设计出来的维度都放在DM完事,那具体具体到底怎么去设计这个表结构啊,我们暂时先不多说了等。
12:24
那后边的时候,咱们认真做的那一层,咱们再一点一点去说啊,行了同学们,那这一步咱们就算是完成了,来视频我停一下。
我来说两句