温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
好,那接下来我们再来了解一下这个数据仓库开发的一些规范啊,那这里边呃,会包含表命名的规范,脚本命名的规范,以及表字段类型的一些规范啊,那这些啊,我们在数后续的开发过程当中都必须严格遵守啊,那首先我们先看这个表命名啊,那因为我们出仓啊,我们会有一个分层的结构对吧?啊,那所以说每一层的表,那它的表明前边都需要有一个层的前缀,那比如说O层,所有的表我们都称之为O啊加表啊,那DM层我们都是D加表啊,这样类推,每一层都会有一个层的前缀啊,那我们出仓当中还可能会去建一些临时表啊,那临时表的前缀呢,就是tmp啊等等等等啊,这是表命名的规范,那下一个脚本命名的规范。在后续我们这个数据仓库啊,啊,咱们需要去开发很多的脚本,那这些脚本它主要的职责或者是主要的功能就是啊,用来装载数据啊,那我们装载数据的时候呢,一般情况下就是从某一层读取数据,然后呢把数据进行相应的处理,哎之后呢,再放到下一层,那所以说我们这个脚本的命名规范就是这样的啊数据源,然后呢,To,然后后边加一个目的,后边再加上一个DB或者是log的后缀,那这个DB所指代的就是业务数据,那log呢指代的就是用户行为数据。
01:31
啊,那在这儿呢,我们举一个简单的例子啊,比如说我们现在需要有一个脚本,那这个脚本的作用就是将ods层的业务数据导到DWD层,那OK,大家可以想一想这个脚尾应该如何命名。啊,那显然应该就是ods,然后to d WD后边加一个DB的后缀对吧?啊,DB.sh啊,OK,那这就是脚本命名的一个规范啊,咱们后续简单遵守一下就可以了,好,下一个,那这边我们对每张表里边的字段类型也做了相应的这个规范要求啊,首先看第一个所有的数量类型我们统一使用big int啊,那所有的金额类型,我们考虑到这个精度的问题,在这儿使用decimal类型。
02:14
啊,那当然里边我们需要传参,一个是16,一个是二,那16所表明的是16位有效数字,那二呢,表明保留两位小数啊,因为我们一般情况下金额,金额我们是不是一般精确到分就够了,对吧?所以说保留两个小数啊好,那下一个,那当然所有的这个呃,名字或者说描述信息等等等,我们统一使用string类型字符串啊啊那主外键类型统一使用string类型,那所有的时间串呢,我们统一使用big类型。啊好,那这就是呃,我们数据仓库当中的一些呃规范啊,后续我们在开发的过程当中严格遵守就可以了啊。
我来说两句