温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
我们先看第一个特地区这个纬度表,呃,地区纬度表呢,它之所以特殊,我们大家应该都很熟悉,它特殊就是因为什么。它特殊,因为它不怎么变对吧?啊,我们从呃业务系统当中啊,往MYSQ里导的时候呢,我们只需要跑一份就够了,那当然呢,我们在DW层建这个地区维度表的时候呢,那咱们是不是也是只存一份就够了呀?啊,那后续我们去写这个脚本的时候啊。小脚本我们从ods往DWD导的时候,那是不是也得区分一下这个首次导入和哎,后边重复每天导入这个事儿啊啊第一次导的时候有这张表,那后边再导就没他了,是不是这个意思啊啊那这个后边咱们再考虑,那现在呢,我们从这个地区维度表的建表语句上啊,去看一看它这个特殊之处啊,其实特殊咱这个想都不用想啊哪啊是不用分区啊。它是没有分区啊,就这个特殊嘛,啊完了之后呢,其实大家也可以思考一下,就是这边这个存劣势存储和这个拉斯罗压缩。
01:01
其实对于这个地区维度板来说,其实也没有太大的意义啊,因为这个本身数据量是不是太小了呀,对不对,太小了,你压不压缩,其实这个相当于无蚊痛痒啊,因为你那个效果不是很明显啊,一共就在咱们这个这张表的主建应该什么呀?是一个地区ID对吧?但是在这儿指的应该是啥呀?是咱们的省份ID,就是这张表一共多少条数据。考验大家这个地理常识的时候到了哈,一共多少个省份啊,几个省就是几条数据吧,34,谁说32来着,你这有罪啊,这给你抓起来啊,34个省份啊,34个啊,34个省份啊,那所以说就是34条数据嘛,这个压不压缩啊,其实无所谓啊,无所谓,那在这儿咱们统一的这个数据格式就是帕亏的加拉斯罗那这个表呢,确实就不用分居了啊,不用分居了,行,那这就是关于咱们这个地区维度表。啊,那建面语句放在这儿了,那这个数据的装载呢,就比较容易了啊,数据装载怎么做,是不是从咱们ODI层去找跟地区相关的两张表,一个是那个province,一个是region,那province就是省,那region就是地区,华北地区,东北地区等等等,是不是这些东西啊,两张表转到一起就行了啊,大家来看一下这个S啊,呃,咱们文档上这个circle其实写的还有点那什么啊。
02:20
呃,有有有点冗余啊,你看一下啊。这有必要写子查询吗?没必要吧,因为ods层咱们这两张表是不是本身就没有分区,那所以说直接照怎么样就行,两张表直接照着不就完事了啊,没必要再写这个紫查询啊,没必要写啊,行,那咱们把这个粘出来啊,给大家看一下啊,CTRLC先把键面L语句拿过来吧啊。Control said。来放在这CTR位啊,这是建表语句啊,这有省份名称,地区编码啊,这个ISO code的isoo的是一个国际上通用的一个地区编码,这个是跟我们后续做可视化有关系的啊,这个咱们先先保留,后续再解释啊,这呢有一个region,呃,ID啊,地区ID嘛啊,地区名称就是这些字段啊,然后这个数据装载呢,就是俩表转一下就完事了啊好,CTRLC咱们拿过来。
03:15
啊来,我们把这个所毁的精简一下吧,那这里边咱们要改的话呢,是不是只需要把这个它去掉,把这个去掉,别名得保留啊,因为上面是不是用这个别名了呀,那他呢,这儿也是这样去改一下啊,这个得给它干掉,那这边呢,给它放到这个位置,诶是不是搞定,其实这个表这么写就行啊,没必要再写子查询了啊啊,那这个特殊表咱们搞定,哎,点击保存。
我来说两句