00:00
好,那接下来我们再来看一个概念啊,就是维度模型的分类啊,那实际上维度模型呢,一共有两个分类啊,一个叫做星型模型,一个叫做雪花模型啊,那当然大家看到了后边还有一个星座模型,对吧?啊,实际上这个星座模型呢,它并不是一个特定的分类啊,并不是一个特定的分类啊,那这个星座模型我后续再给大家解释,现在我们先重点看星星和雪花模型啊,来我们看一下这个图。啊,左边呃是一个星型模型,右边是一个雪花模型,大家可以先玩一个找不同啊,看看两边啊哪不一样啊,那他大家应该能够发现对吧,是不是它们俩的区别主要就在这两个维度表上面啊。对吧,那你可以看一看雪花模型啊,它相对于我们这个星星模型做了一个什么样的操作,是不是把维度表拆开了呀,对吧?啊,那我们想呃,看到这个拆表,我们应该能联想到什么,不能联想到我们之前在讲那个呃,关系模型的时候提到的那个范式啊,对吧?啊,其实那雪花模型啊,跟星型模型的主要区别就是雪花模型会对维度表进行规范化,那主要目的呢,就是消除数据的冗余。
01:13
啊,这就是星星和雪花模型的一个主要的区别啊,但是雪花模型呢,它并不会完全的去遵循呃三范式啊,因为完全遵循三犯之后呢,那是不是相当于又变成了我们的关系模型呀,啊是这样的啊,那雪花模型其实主要是对呃维度表进行这个规范化啊,是这样的啊,这就是星型模型跟雪花模型的一个主要区别啊,当然这个星型模型和雪花模型啊,它其实还是比较形象的啊,这个名字起的还是比较形象的啊,那为什么这个叫星形这个雪雪花呢?其实这样啊,咱们来看一下。假如说那我画的这个方块就是诶咱们的一张事实表,那周围呢?诶就是啥,就是它的维度表啊,那星形模型,因为维度表没有规范化对吧?那所以说我是不是呃只有一圈的这个维度表啊,对吧?是这样的诶那我给它连起来啊,连起来之后呢,我再补上两笔,大家来看一下啊,画的比较难看啊,简单看一下,那这个是不是就看着就比较像一个星形啊对吧,一个星形star对吧?啊这就是所谓的星形模型啊,那雪花模型怎么来的呢?诶很简单,那我同样中间这个小方块呢,指代的就是一个实时表,那周围诶是它的这个诶维度表,那因为维度表是不是进行了规范化呀,对吧?规范化是不是会拆开诶成多个表啊对吧?哎,那OK,那它大致就是这样的一个,诶形状,那OK,我给它连起来之后呢,诶大家可以简单看一下,那其实这个呢,是不是看起来就有点像一个雪花了呀,对吧?啊,当然画的就是比较难看啊,这就是所谓的雪花模型啊,其实就是根据他们的这个形状啊而命名的。
02:47
啊好,那星星模型雪花模型我们就介介绍完毕了啊,那接下来我们继续往下看啊,再往下翻,那还有这个星座模型的概念,那到底什么是星座模型呢?我们来看一下。大家现在看到的这个图啊,其实就是一个典型的星座模型啊,那星座模型是怎么来的啊,其实很简单啊,多个星型模型交织在一起,那就会组成一个星座模型,那其实这个还是很形象的,对吧?多个星星我连在一块儿,那就会组成一个星座嘛,啊就这意思啊,那这个交织在一起具体指的是什么呢?啊,其实我们可以看一看这个图啊,一看你就你就能看懂啊,你看一下那这个事实表跟这个事实表他们两个是不是会啊,共用一些维度表啊,没错吧,那其实就是通过这些共用的维度表交织在一块儿了,这就是所谓的星座模型。
03:38
啊,好,那现在我们就把刚刚所提到的这三个概念介绍完毕了,一个是雪花,一个是星星,还有一个是星座模型啊OK,那讲完这个,呃,三种模型之后呢,那接下来我们就得思考一个问题啊,就是在咱们自己搭建数仓的时候,我们应该怎么去选择呢?啊,那到底我们应该使用哪种模型呢?啊,来我们一起看一下。
04:00
那首先星座这个是不需要我们去选择的,对吧,这个大家应该是能理解的,那我们要选的话呢,只需要选择是星星还是雪花,没错吧,那咱们到底选谁呢?啊,那到底选谁,其实取决于呃咱们是性能优先还是灵活优先啊那星星星型模型,呃,由于我的表结构呃最简单对吧?啊我的维度表没有进行规范化啊,那我的性能是诶最好的啊那我的这个呃呃雪花模型呢啊,它的维度表进行的这个规范化啊对吧?那我的表诶拆的比较散啊,比较碎对不对?那所以说我使用起来呢,会更加灵活啊那所以说呃,那咱们这去选择的时候呢,就得看我们更注重什么了,那如果注重性能,那OK,我们就首选模型,那如果我们注重哎这个灵活性啊,那我们就选用啊星呃雪花模型。啊,是这样的啊,那当然在我们这个数据仓库当中,哎,我们选择的是什么呢?选择的是维度更少的星型模型。
05:05
啊,因为咱们是在这个大数据呃这个背景下嘛,对吧,那大数据体系当中,呃,那我们是不是应该尽量的去减少这个join操作呀,对吧?因为减少join我们就能够减少沙Le是这样的啊所以最终哎我们就哎确定下来在咱们的这个数据仓库当中啊,我们所选用的这个维度模型呢,是星型模型,那当然最终啊啊它会组成一个星座模型啊OK,那这就是我们呃维度模型的分类的相关知识点。
我来说两句