00:00
呃,2.3呢,是维度表和事实表,这里面写的是一个重点啊,非常重要,你说给你任何一张表,你应该快速的定位出来,它是一张维度表还是一张事实表。哎,你要把它定位出来,那行,那像在我们这个书商当中啊。这个呢,是我们书上的表结构图对吧?啊,有这么多张表,那这么多张表怎么去判断它是维度表还是实表呢?我们先从理论上给大家这个啊描述一下哈,什么叫维度表呢?叫一般是对事实的一个描述信息。每一张每表对应现实世界当中一个对象或者概念。现实世界当中的对象或者概念,那对象概念不就是业务名词吗?那一般我就形象为名词啊,一个对象,比如说用户。啊,描述这个用户的年龄啊,性别生日这些信息全是基本他的啊那另一个呢,商品描述商品相关信息的,商品的价格,商品的这个颜色,商品的大小尺寸,然它的日期,什么时间,什么地区,那这些都是属于维度表的信息。
01:16
我们来看一个看一个用户信息吧,我看有没有用户啊。嗯,就他吧,嗯,就这个得了,这是活动信息对吧?哎,活动表的一张信息,那活动表的信息里面包括什么呢?包括活动的名称,活动的类型啊,还有这个是活动的这个满减活动什么类型啊,这个活动的一个具体描述。开始的时间,结束的时间以及活动的创建时间。哎,这都是这个具体啊最下面是吧?这呢啊最下面啊,这个你看这个光磊啊,就是没事呢,就盯着这个下面是吧?啊这个比较专业啊来我们来看一下啊呃,这呢是登录的名称,昵称用户名,这个是密码用户名啊还有这个电话号,邮件啊,你是邮箱,这个是hi image啊这是图片啊啊user level,用户等级,生日性别。
02:12
都是描述这个用户的一些属性的,那属于相应的叫维度表啊,这叫维度表,好,那我们再往下看啊,啊,这是维度表的信息。找点感觉啊,找找感觉啊,这个看多了才有这种感觉啊,看少了没有这种感觉哈啊维度表的范围呢比较宽,具有多个属性列比较多。什么意思,看一下。再回顾一下,尤其这个用户表,用户的名称昵称word啊,这个密码用户名啊,你看这很多很多列呀,列的信息比较多。啊,那就是具备了其中一个特征,那继续再往下看,它还有什么特点呢?还有呢,就是跟事实表相比,它的行数相对来说比较少啊,小于啊12行啊,这个不绝对啊,因为有有的公司是数据量比较大,有的公司数据量比较小啊,这也不绝对,你可以不参考啊,那它的常数相对于40表来说是比较少的。
03:11
那这怎么理解呢?啊,比如说用户啊,这个有多少多少用户,那他就是比如说有10万个用户还是1亿个用户,那就固定死了,差不多这么多,比如说咱中国就13亿人口,对吧,支付宝的注册用户最多在中国也就13亿。那么13亿的订单啊,订单后面会说啊,它叫40表,你订单是40表的话,那你13亿用户。我最多这个用户表是13个,呃,13亿个,那我订单可以是13亿乘以每个人买十个订单吗?那就乘以十,它的量级会比你这个单独的这个维度表要多啊,维度多就是随时产生变化,随时在产生,源源不断的在产生,那它的产生的这个,呃,这个范围啊就小很多了啊,这种内容相对固定啊相固定,你看你这个用户这个13亿这个用户注册完这个信息,你会经常发发生改变吗?
04:05
啊,不太容易改变,除非像那个班长对吧?啊,这个做去一趟泰国啊,做个手术啊,有可能会来练一下啊,这这种的毕竟是少数嘛,对吧?啊,也就像小胡有可能会陪着一下对吧?啊,陪着也一起做吧,这个手拉手对吧?啊,从男人变成女人啊,这种呢,毕竟是少数,了解一下,呃,下面再往下呢,是时间维度,这是一张时间维度的一张表啊,这里面记录了什么时间啊,是周几啊,是一年当中的第几天啊,是这个季度的第几天,然后是否是元旦啊,元旦节假日啊等等一个正常的一个描述叫描述信息,属于维度表。
我来说两句