温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
OK,我们从本节开始搭建DWT层啊,那同样我们还是先来回顾一下DWT层的建模思想啊,那实际上呢,DWT层的建模思想与DWS层很像啊,那所以在这儿我们对比这两层去看一下啊,那提到这个建模,那我们是不是就主要解决两个问题就够了,对吧?那第一个问题,那就是说呃,我们应该建什么表对吧?那第二个问题呢,就是每张表的表结构具体是什么样的?没错吧,那我现在先来看第一个问题就是建哪些表,那那实际上DWT层去决定建哪些表的时候呢,与DWS层的思路是一样的。啊,是一样的啊,DWS层当初咱们是怎么确定的呀,是不是以维度为基准呀,对吧?那DWS层的每张表是不是就对应维度模型当中的一个维度啊,没错吧,那同理DWT层也是这样的啊,大家可以注意观察一下啊,你看咱们DWS和DWT这两层他们的表是不是上下对应啊,对吧?你看DWS有一个访客主题表,那DWT层也对应着有一个访客主题表。
01:03
啊,OK,那这是我们的第一个问题啊,那接下来呢,我们再来看一下每张表的表结构啊,OK,那表结构呢,我们同样是分三个方面去看啊,分别是行列以及分区啊,那我们还是先看行啊,那在这儿我们也与DWS层对比的去看一下啊好,那现在我们先回顾一下DWS层的每行数据指代的应该是什么啊?其实很简单,DW层的每行数据指代的是一个维度对象在一天当中的汇总行为。没错吧,那OK,那DWT层的每行数据是什么呢?啊,大家要注意了啊,是一个维度对象,它的累积汇总行为。啊,这个跟DWS层是有区别的对吧?OK,那这就是行啊好,那接下来我们看列啊,同样我们还是先来回顾一下DWS层的列是如何确定的啊,就是很简单啊,那首先DWS层的宽表当中呢,会有一个维度ID啊OK,那余字段呢?其余字段其实就是维度模型当中与该维度相关的事实表的度量值的聚合值啊OK,然后大家要注意的是什么啊,就这个聚合值,它是一天的聚合值对不对?啥意思呢?也就是这个聚合值呢,是由一天的数据聚合而来的诶OK,这是DWS层当中的列对吧?那接下来我们再来看DWT层的列是如何确定的啊,那其实与DWS层很像很像啊OK,那DWT层的表当中呢,也会有一个维度的ID啊,那其余字段呢?其余字段也是维度模型当中与该维度相关的事实表的度量值的聚合值啊,只不过呢,这个聚合值不再是。
02:40
一天的聚合值了,而是什么呢?而是最近N天的聚合值,比如说最近七天,最近15,最近30啊,也就是说这个聚合值呢,是由最近N天的数据聚合而来的,OK,那这就是DWT层的列啊,那最后呢,我们再来看这个分区啊,那DWS层的分区是如何规划的呀?啊,其实很简单,对吧?DWS层的分区呢,是这样规划的啊,首先是按天分区,是每天一个分区,每天一个分区啊对吧?那每天的分区当中保存的是什么数据啊。
03:11
啊,每天的分区当中保存的是啊当天的活跃的维度对象的汇总行为。没错吧,OK,那这是DWS层的分区啊,那接下来呢,我们再来看DWT层的分区啊,DWT层分区是什么样的呢?OK,也是按天分区啊,每天一个分区,每天一个分区啊,然后每天的分区当中存储的是什么数据呢?啊,每天的分区当中存储的是截止到当日的全量的维度对象的累积汇总行为。OK,那这个呢,是DWT层的分区,它与DW层呢,还是有一定的区别的,那OK,那至于这个分区规划的一些细节内容,哎,我们放到后边再详细给大家去说啊好了,那DWT层的建模思想我们就回顾完了。
我来说两句