温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
好,那从本节我们就要开始搭建DWS层了啊,那在开始搭建之前,我们先来回顾一下DWS层的意义是什么,以及它的建模思想是什么啊,好,那先看它的意义是什么。其实DWS层的意义呢,主要就是为了避免重复计算对吧?啊,实际上我们具体的做法呢,就是将一些计算频率比较高的结果保存在DWS层啊,那这样一来,我们后续再有类似的需求,我们就不需要再从头开始计算了啊,我们只需要从DWS层获取咱们所需的中间结果就可以了,OK,那这就是DW层的主要的意义啊,就是避免重复计算,提高数据的复用性啊OK,那接下来呢,我们再来回忆一下DWS层的建模思想是什么啊,那其实我们主要就是回答这样的两个问题,第一个就是DW层应该创建哪些表对吧?第二个问题呢,那就是每张表的表结构应该是什么样的啊好,那现在我们回顾一下啊,首先我们回答第一个问题,就是应该创建哪些表,实际上DWS层咱在创建表的时候呢,是以维度模型当中的维度为基准的,那也就是说维度模型当中有一个维度,那在DWS层当中呢,就有一个表。
01:13
而与之对应啊,咱举个例子啊,那我们维度模型当中咱有啥,有用户维度对吧?有商品维度,有地区维度等等等等对吧?那在DWS层呢,我们就会有对应的用户宽表,商品宽表,还有这个地区宽表等等等等,OK,那这是我们的第一个问题,那接下来呢,我们再来明确一下每张表的表结构是什么样的啊,那实际上DWS层那它咱们称之为什么称之为宽表对吧?啊,也就是宽表没宽表字段非常多对吧?啊,那它的表结构是什么样的呢?来我们明确一下啊,首先我们先来明确它的一行数据是一个什么啊,DW层当中的一行数据呢,就是一个维度对象的当日的汇总行为。啊,一行数据就是一个维度对象啊,OK,那接下来呢,我们再来看它的这个字段啊,也是它的列对吧?那字段有哪些呢?首先要明确一点,DWS宽表的主键就是维度的ID啊,就是维度的ID,那其余字段是什么呢?其字段就是啊,在维度模型当中,与该维度相关的视实表的度量值的聚合值啊,那咱们聚合到什么程度呢?DWS层就聚合到天啊,就是按天进行汇总,OK,那这个呢,就是DWS层啊,这个宽表的字段啊OK,那我们再来看一下,那它的分区是如何规划的?那实际上DWS层的分区咱是这样规划的啊,我们是按天分区啊,也就是每天一个分区,每天一个分区,每天的分区里存放的是什么数据呢?每天的分区当中存放的就是当天的活跃的维度对象的汇总行为。
02:52
啊,这就是DWS层的分区规划啊,好了,那现在整个DWS层的建模思想我们就回顾完了。
我来说两句