温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
好,接下来呢,我们看一下啊,1.3数仓的一个命名规范,那这个命名规范呢,是非常重要的,在企业里面呢,都是有这种规范来看一下,比如说ods层的命名呢,我们也是以ods开头,后面呢跟的是这个表名字。DWD层的命名的是DWD,那后面这块略微有些区别,我们加了一个DMDM,往往叫这个维度表。啊,后面我给大家解释一个维度和这个事实哈,会在这个二点。在这块啊,我给大家说一下,什么是维度表,什么是事实表,那你知道啊,这是维度表,然后事实表呢,我加上一个事实,那这是咱们的一个命名方法哈,那标准的阿里的命名方法是什么呢?它会把这个dim啊抽取出来。就叫Di'm开头,不是以D为开头dim,然后后面那是表明的这样,但是吧,我我这个个人特点呢,有的时候我不习惯于一个把这个Di拿出来,总感觉怪怪的,而且我这里面只是DWD常用啊,所以说我这里面,嗯,按照我这个规则呢,我我就给它放了一个DM啊,就是DWD后面加了一个DM啊,也就前面加了一个前缀啊,其实问题也不大啊,只要你能说得通,那这事呢,规范那就OK。
01:10
那再往后呢,是这个事实表,如果事实表的话,加一个fact之后呢,跟上这个表明啊,一看这个名字就知道哇,它是DWD层的维度表还是事实表,然后具体的表明这是什么。要一定要这个非常清晰啊,建明之意。之后呢是DWS层,那DWS层呢,就是DWS前缀加上对应的表名字,DWT呢是DWT命名之后跟上对应的表名字ADSADS什么命名加上表名字,这个比较简单对吧?啊还有一些临时表,如果你创建了一些临时表啊,啊一般的这种呢,就是表名字加一个后缀,比如说它可能不属于这个每一层。就是你临时使用的。那这时候我的黑点呢,一般给它放在一个后缀,当然你也可以放在前缀上,也没问题啊,比如说你前缀开头time,然后表明这也没问题,对吧?啊也是没问题的,再往后呢,是这个用户行为表以log为后缀。
02:06
比如说我这里面分用户行为和业务数据两块,这块是买点的,这块是加了一个后台的啊,我这里面只是对这个用户行为的加了,每个表后面加了一个后缀log。因为加log的是用户行为,不加log的不就是业务的吗?啊这样的区分开啊,否则的话你这边就加个DB啊,我感觉这个表明有点长啊,表面你看这个,你要加上这个后缀的话,就是DWDDM,然后表明着表明这后面呢,要加上一个log。啊,Job呢,再加个DB啊,这样的一个情况啊,所以我觉得比较长,我就把它只有一个加了,加了的话就是日志,不加的话就是这个呃,DB啊就可以了。后面呢,是这个脚本的命名,脚本命名呢,这边我重新规划了一下,是以这个按照蛇形命名方式啊,咱们之前学过的叫驼峰对吧?啊驼峰呢,就是这个举个例子。驼峰my circle啊,比如说to to的话,HDFS,这叫驼峰,比如说每一个单词的这个首字母呢,是大写,那蛇形命名是什么特点呢?它这样啊,MySQL to啊,然后呢,HDFS所有字母呢,全部小写,中间呢,用这个下划线进行分割啊,这在企业当中呢,也是一个啊,比较主流的一种命名方式哈。
03:24
行,那我这里面规定的就是数据源,你说你这个数据哪来的,比如说我们第一个要不按MYQ对吧,按MYSQ,然后to to到哪呢?目标地址ADNS。上啊,HDS。啊,之后呢,这块呢是你是目标地址,之后呢是呃你是DB还是log啊,你要导的是DB数据库,那你是DB.sh如果你导的是这个log数据呢,那就是log.sh啊这样的一个区分哈,行,那用户脚本呢是以log后缀,业务数据的脚本呢,是以DB为后缀啊当然你也可以说这个呃用户行为再加个DB啊,加个log业务的你不加我觉得也没问题,这都是可以的哈,根据你的那个呃规则习惯要求,嗯,只要大家这个约定书成,你就所有的这个开发人员参与的开发人员啊一致认可这样去命名,那就OK。
我来说两句