温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
好,那接下来我们看动作日表啊,那老规矩,我们还是得先分析一下它的表结构啊,对吧?那它的行啊,以及列还有分区应该如何去规划,那接下来咱们分析一下,首先我们先看它的行啊,比如它的每行数据应该是什么。啊,那考虑到DWD层要保存明细数据对吧?那所以对于动作来说最明细的数据,那是不是就是一条动作记录啊,对吧?啊,那OK,所以说动作日表当中每行数据保存的就是一个动作记录啊,OK,这是它的行啊接下来我们再来看列啊,也就是字段啊,那动作日表当中的字段应该包含哪些呢?啊,那首首先我们先来分析一下啊,动作日表当的数据应该来自于哪种结构的日志。那这个不用多说,是不是肯定是来自于页面买点日志啊,对吧,我们回去看一下啊,来点过来。大家来看啊,那页面日志当中是不是有一个actions字段呀,对吧?那所以说呃,那咱的这个动作日表当中是不是必须得包含这些action字段,对吧?比如说什么action ID item item types等等等等,那那这些字段是必须包含的啊,那除了这些字段还要不要包含其他字段呢?
01:11
那肯定是要的啊,那比如说谁,比如说common字段,也就是这个公共字段,没错吧,啊,因为咱们得知道这个动作是谁做的,对吧,在什么地点做的,什么时候做的等等等等,也就是这些描述性信息我们也要保留,那那OK,那除此之外还要不要其他字段呢?啊,其实在这儿呢,诶,我们也可以把配置字段保留下来啊,为什么要把配置字段保留下来啊,那其实我们可以思考一下,其实页面相关的信息是不是也相当于是对诶这个动作的一个描述啊,对吧?那咱们是不是就能知道这个动作是在用户浏览哪个页面的时候做的,没错吧?那所以说最终咱就确定下来了啊,动作日志表当中应当包含公共信息啊,页面信息以及动作信息啊OK,那这就是动作日志表的列,也就是它的字段啊OK,那接下来我们再来看一下啊,动作日表它的分区是如何规划的啊,跟前面的两张表它的这个分区规划是相同的,那仍然是按天分区,每天的分区当中存储当天产生的动作日志就OK了啊OK,那这就是动作日志表的表结构啊,OK,那接下来我们再拿到它的界名语句,详细的去看一下来,拿下来。
02:26
CTRLC来放到笔记当中,CTR为大家来一起看一下啊,这就是动作日志表的建表语句,那首先看一下它的表明dwd action log啊对吧?那接下来我们再往下走啊,看一下它的字段,那字段呢,主要分为这的三部分啊,那这部分就属于它的公共字段对吧?那这部分呢,属于页面的字段,那最后一部分呢,就属于动作的字段啊OK,那这就是它具体的字段啊,在这儿呢,我们就不再一个一个去看了啊现在往下走呃,我们再来看一下它的这个数据存储啊,尤其是它的格式啊,那来看一下,那是不是仍然是parkque列存储加上拉塞罗亚缩亚对吧?啊OK,那这就是呃,DWD层的动作日志表的呃建表语句。
我来说两句