00:00
好,接下来呢,我们看一下下一个哈,时间维度啊,时间维度呢,这里面我是一个预留的,因为后面呢,我们没有后面的DWS和DWT啊,由于我们目前这些指标呢,还没有用到这个时间相关的东西,因为都是用的呃,每张表自带的什么create time op time啊这些内容。嗯,那这个呢,就暂时预留,那预留的话DW层咱们是还是要给他准备好的哈。首先来看一下这个时间维度表里面有哪些信息,还有哪些信息?这是一张外部表,然后data ID。日啊,然后呢是week ID,就是说是哪周,然后week date呢,是周的第几天,比如说你这一周嘛,比如说这个这是第50周啊,50周的第几天啊,是这样去算的哈,是嗯,再之后呢,是day每月的。第几天?啊,每月的第几天,这个这个day表示的是月里面的月里面的day哈,然后下面呢,是第几月,就是你当前是第几月啊,我们这是第几月,这是第三月对吧?啊第三月好啊还是还有呢,当前日期是第几季度。
01:07
那我们现在是第几季度啊,一到三月份应该属于第一季度对吧,一季度,然后哪一年没啥说的,这个2020年。呃,是否是周末,那今天是25号,不是周末,如果你是这个26,不是28或者29,那这块呢,就会提示是周末啊,这个标记是否是节假日。那现在呢,25号应该也不是什么这个节假日对吧?啊,这个马上要到清明,清明的时候应该是有节假就下周行,那就是这里面每一个字段的一个含义,那这个像时间这块啊,说过啊,这里面只需要呃把一张表,Date in for这张表导入这里面去,这里面生成了最近这两年的呃,所有的这个日啊,周啊,周的第几天呢,每月第几天呢,包括第几季度。啊,还有是否是周末,你节假日等等的提前都是啊,可以照好的啊,提前照好的呃,然后直接上传上去,直接导入到你对应的这张表里面就可以,这张表没有必要每天都导,一点必要都没有啊,就跟那个地区维度是一样的,它不会发生变化,你说你这个周的第几天,你说任何未来的某一天,假如说。
02:17
未来6月1号啊,6月1号他是这一年的当中的第几天啊,是第几周。是周的第几天,周的第一天啊,是每月的第几天,每月的第一天啊,第几月,第六月第几季度。嗯,六暂应该是第二季度啊,第几年2020年是否是周末,不是是否是节假日,是节假日。啊,就是这样的一张表哈,这样一张表,我们先把它上传上来之后,我们再来那个再跟这张表啊,再核对一下哈,核对一下那这个data in在哪里呢。给大家的这个资料。嗯,资料包,资料包儿下面有一个数据生成脚本。它,哎,这里面有个代音,稍微打开看一下。
03:05
哎,这里面是你看2011年1月这个第一号二号三号,你第一列不是哪一天吗。啊,这是每月的哪一天啊,每月哪一天,然后之后呢,这一列一一个一个对应上的啊对应上的我们先导进来看一下啊。看一下。把它上传上来。二加PC.model,嗯。DB放到这个文件夹下。好,进入到这个文件夹下面啊,有一个它,那把它呢,上传到哪里呢?加载到have的这张表里面,直接加载。直接加载到这个DW d DM data in这张表,那这张表呢,我要需要提前创建一下。
04:11
好,提前创建成功,那下边的话把一个本地文件的数据加载到一个have表里面,那用到什么命令呢?哎,这呢,Load data local。啊,Local的话就是本地文件嘛,你这个文件是本地的一个路径放大一下啊,啊,就是load data local本地,然后in pass,如果是集群路径的话,那这就没有对吧,然后in pass o BD model到DB这个文件夹下有一个date in for这个文件,那把它into到table,哪一个table呢?哎,Into到table dwdm date in这张表里面去就可以了,就这么简单啊,你写一下。
05:00
Date。Local in pass,那本地路径,本地路径的话,把这个路径拿回来。好好后面再拼上你对应的这个文件,这个文件名称在这。Pass into table啊,我们要插入的表表是这张表。哎呀。哎,复制复制都可以。行,比如说像这张表里面插入数据啊,Load data local in pass,好插一下试试。
06:02
那现在呢,就已经插入成功了,那插入成功之后呢,我们查一下这里面有没有数据啊,Select行from。这张表。哎,你发现这里面啊,就已经把所有的数据呢,就已经插入进来了啊插入进来了,那后续的话,我们要用到时间相关的,那我们就可以跟这张表呢,进行相应的一个关联,取出这里面对应的日期。哎,这就是这一张啊,一张表啊,行,那这个呢,是时间维度,你们后续的,呃,本次项目当中我们暂时先先别用哈,由于时间紧,没有把这个时间维度关联到对应的这个主题上,近是可以关联上上去的哈,就是什么时间啊,这一天是不是节假日啊,节假日要不要搞活动啊啊等等啊,是第几季度啊,这个财报月报啊。包括这一季度的这个日活新增啊,交易额啊等等啊都可以,你说按照时间维度去统计是完全没有任何问题的啊,只不过呢,这个由于稍微时间有点紧啊,这块呢,没有把它这个并进去啊,并的话其实也容易啊。
07:13
行,那这个呢,先放在这儿啊,先放这这是时间维度的一个预留。
我来说两句