温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
呃,来了各位同学,那截止到现在我们整个DWD还有DM层就都完成了,也就是整个维度模型咱就完成了,那完成之后咱们来分析分析,就是最终我们会在DWD层加dim层,就是保存下来什么样的数据,就是随着时间的推移,我们会得到什么样的数据。咱们先说DWD啊,DWD咱们绝大多数的表都是事物型实时表,对吧?那所以在这儿呢,我们就以事物实时表去代代表咱们这个实时表啊,OK,那所有的事物值表,那咱的分区规划都是哪种,都是呃,增量分区对吧?我们都是一天一个分区,一天一个分区,而且大多数的事物实值表呢,我们在做首日的数据装载的时候,都做了这个历史数据的处理了,对不对,那完了之后呢,我们把很多的历史数据放到了它应该属于的那个事实表的历史的分区上面去了,OK,好,那再往后走呢,我每天还会再新增一个分区,新增一个一天一个,一天一个对吧?OK,那也就是我们的事务实时表呢,将来就会是这样的一个形式,那他每天的分区里放的都是什么呢?其实都是当天的操作记录,对吧,对吧,那14号放14号的记录,15号放15号的记录等等等等,OK,那这是我们事实表所保留下来的内容,OK,那我们的维度表会保留哪些内容呢?
01:16
维度表,那咱们绝大多数的维度表都是哪种类型的呀?是那种每日全量快照的维度表对吧?拉链表虽然有,但是很少,相对来说啊,OK,还是这种每日全量快照表多,每日全量快照表它应该是一个什么样的形式呢?它应该是一个每天一个分区,对吧?哎,一天一个分区,每天的分区放的就是什么?就是当天的这个维度的全量的一个信息,对不对,OK啊,OK,那这个就是咱们维度表从前到后保留下来的一个数据,每天的历史状态,咱们其实都是有保存的,OK,那这就是事实和维度咱们保存下来的数据,好你想一想,只要有了这两部分数据,那将来我们不管去做什么样类型的分析,咱们基本上是不是就都能够应对呀,对不对?比如说我想分析历史上某一天的这个订单对不对,那你就怎么办,你就找到你那一天的下单记录对不对,然后呢,找到你那一天的相关维度,维度我们哪天呢都能找着对不对啊是这样的,然后呢,他俩是不是只要一性关联,然后你进行各种各样的。
02:17
分组聚合进行统计,那就完事了,对吧,你想分析哪天的,你就去找哪天的事实,以及哪天的维度,就是我们事实表,维度表将来正常是这么去用的,诶这一点大家要搞清楚,也是我们整个维度模型呢,将来就会保存下来这样的一些这个数据资产啊,它其实能够应对绝大多数的这个统计需求啊,这个大家理解一下啊,行了,那完成之后视频我简单的停一。
我来说两句