00:00
那接下来我们看DWD层的业务表啊,那实际上这些业务表呢,就是我们前面所见的维度模型当中的事实表,对吧?啊,那关于维度模型大家还能回忆起来哪些知识点呀?啊,我们回忆一下啊,首先有一个最最重要的知识点,就是维度建模的四个步骤,对吧?我们回过去看一下啊,来找到前面所讲的维度建模的四个步骤,来大家一起看一下,那这四个步骤分别是选择业务过程,声明力度,确认维度,确认事实对吧?那大家还记得这里边儿每一步我们要做的具体的工作是什么吗?那咱们回顾一下啊,那首先先看选择业务过程。选择这个业务过程这一步呢,我们要做的是挑选感兴趣的业务线,对吧,那挑选出来的业务线是不是每条业务线都对应一个事实表啊,对吧,也就实际上第一步我们做的工作就是确定维度模型当中有哪些事实表。没错吧,那接下来我们看第二步,第二步呢,是声明力度,那大家还记得力度的概念吧?什么叫力度?是不是力度指的是我们数据的细化程度或综合程度的级别呀?没错吧?那我们在声明力度的时候,实际上声明的是什么呀?声明的是第一步所确定的每张实施表的力度。
01:18
没错吧,而且圈力度的时候呢,咱们有一个要求啊,是不是尽量的选择最小力度啊啊OK,这是诶声明力度啊,那当然呢,声明力度实际上做的工作就是什么,就是确定啊第一步啊,所声明的每张事实表的每行数据是什么。没错吧,哎,这就是生命力度啊,那接下来我们继续。啊,确认维度啊,实际上确认维度这一步,我们要做的是什么呀?啊,就是要确认每张事实表相关的维度都有哪些。啊,举个例子啊,比如说呃,订单实时表,那我相关的维度呢,有用户,有时间,有地区啊,那其他的实时表也有相应的这个维度,对吧?OK,那就是确认维度这一步啊,那当然这一步我们实际上做的是什么呢?实际上其实做的就是确认每张事实表当中的维度外界有哪些。
02:11
前面咱讲过啊,那一个实时表它的字段可以分为两类对吧?一类是维度表的外界,还有一类呢,是度量值,那第三步想让咱们确认的就是每一张事实表的维度外界啊,OK,也就是其实确认了一部分字段对吧?那接下来大家再继续啊,最后一步确认事实啊,此处的这个事实指的实际上是每张事实表当中的度量值,对吧?也就是咱最后一步确认的就是每张实实表的度量值字段啊,OK,那大家发现啊,我们把这四步做完之后,那维度模型当中有哪些事实表啊,那事实表当中的每行数据是什么啊,那事实表的字段有哪些,我们是不是就已经确定下来了?OK,那这就是维度建模的四个步骤啊,这是非常重要的,大家必须得理解啊,好,那现在我们回顾完了。
03:00
接下来呢,还有一个比较重要的知识点啊,什么知识点呢,就是事实表的分类。啊,咱前面讲过啊,事实表一共可以分为三个类别,对吧。那分别是事务型事时表啊,还有周期型快照实时表,那还有呢,就是累积型快照实时表,接下来我们把这三类实时表回顾一下啊,那我们先看第一种啊,事物型事实表啊,我们先简单回忆一下事物型事实表适用于什么样的业务啊啊,它适用于不会发生变化的业务。啊,那所以说那这种类型的实时表呢,它有一个这样的特点,数据一旦写入这个实时表就不会再发生变化了啊OK,那这种时表它对应的那个业务表的同步策略,通常情况下是增量同步啊OK,那接下来我们看第二一个啊,周期型快照时时表啊,那周期型快照师表适用于什么样的场景呢?那假如说有某个业务,我们不需要去保留它最明细的操作记录啊,而只关心比如说每天的结果是什么样的啊,那这时候呢,我们就可以对它做一个周期型快照实时表啊,那它的特点呢,就是不会保留所有的操作数据,只保留固定时间间隔的数据啊,那其实周期性快照时表呢,就相当于每天打一个全量的快照对吧?每天一个全量快照,每天一块全量快照,那所以说它所对应的业务表的同步策略,通常情况下是全量同步啊OK,那接下来我们再看最后一种累积型快照时表。
04:33
那这种时表呢,适用于会发生周期性变化的业务啊,那最典型的一个例子就是订单业务对吧?啊OK,那这种实表的特点是它的数据不是一次性写入的,而是分多次累积写入的,那所以说呢,它叫累积型快照时表。啊,那说的通俗一点就是什么呀?啊,就是说一条数据写到这张表当中之后呢,我后续还可能在对这条数据进行修改对吧?OK,那这就是累积型快照时表的特点啊,那一般情况下累积型快照时表的同步策略呢,都是诶新增及变化同步,那维度建模当中两个重要的知识点我们就回顾完了。
我来说两句