00:00
啊,上节课呢,我们是把这个启动日志处理完了,那下节接下来我们来处理什么呢?哎,还有个事件日志呢,对吧?哎,事件日志,那事件日志长啥样啊,看看大家还记不记得啊。拿过来。哎,看一下事件日志,哎,事件日志呢就长这样,它的前面呢,这块呢是服务器时间对吧?哎,中间这块呢是这个公共字段,之后呢这呢是AP gmail啊APP的一个名称啊这呢是ET,那下面这块呢,是具体的一个事件,那看着这个格式啊,挺复杂的。哎,但是还好,到了ODI层啊,我们只做一件事,保持数据原貌对吧?哎,保持原貌,那不管你这是多么复杂的内容,到我这你都是一行。都是string的对吧?啊,你就是一个字符串,哎,不管你怎么变换是吧?啊本质就是一个字符串,那行了,那剩下的键表就容易了,哎,还是如果上来啊,如果表已经存在。啊,标时间把它删掉呗,啊然后之后呢,创建一张外部表。
01:04
那这个呢,这个字段呢,仍然是一个哈,你说只有这一行,来这个名字变一下啊变一下,那下面更简单了,按照日期创建对应的分区,哎,同时存储的时候呢,仍然采用拉着罗方式存储啊,最后呢是设置保存的位置对吧?嗯,Ods原来上一个呢是ods starlo,那么这块呢,变成ods evenlo就可以了啊就这么简单哈,行,那这个呢,我们来做一下啊,来写一下。那比如说刚才我们写的是这个,这是启动日志,那我们来一个事件日志,我就基于他去改哈。怎么改呢?你这次启动的这是E,我改成它。然后这下面对吧,如果这张表已经存在,我就把你删除掉。啊,把你删除掉,然后这里面仍然是有一个字段,还是line是际分区呢,仍然是part by dt是这存储这个,然后location location要注意warehouse gmail ods,这变了。
02:09
啊,也说这变了,这变成even。啊,你看有了第一张表之后,创建第二张就容易多了,拿来。好,走。那这样呢,就创建完了啊,创建完创建完之后呢,你还是可以来到这个呃,路径上去看一眼啊。Ods。啊,你刚创建完的Oslo啊,这里面目前是没有任何数据的。那你需要仍然是需要从那个original date把数据给它剪切过来,你说你需要把这里面的。EVENT3月10号的数据直接剪切过去,那怎么剪啊,哎,仍然看一下这个语句啊。是不是在这呢?是吧,哎,我们基于他去改吧。
03:05
就基于它去改,那这怎么改啊,首先还是load date in pass对吧,没变,然后呢,原始数据还是在original date gmail log没问题,这变了,Topic start变成topic 3月10号没变,Into table,这变了,不是start了。再往后走。王种呢,这是part对吧,Partan,然后DT没有问题对吧?啊没有问题直接拿过来。你说你只改个表名字就行了哈。走。好加载完了,加载完之后呢,先上这个路径上搂一眼看有没有啊。Ma house gmail oslo3月10号对吧,哎,现在它就有了啊,有的话我们可以查一下。
04:00
确认一下。Select新from o love啊,Love limit two。哎,这样呢,我就把我们的这个事件表啊,就查过来了啊。你说还是这个服务器时间开头,然后竖线中间各种接一大堆,不管你是多少,你都是一个字段lie。啊,你说对应的这个类型的就是对吧,然后第二个字段呢,就是DT啊,就是DT,不管你多复杂直接过来。行,那这个呢,就加载过来了,加载过来之后呢,别忘了这个,哎,创建索引呢,啊对它创建索引,那你看开度架前面这块呢,拉住罗没问题,这呢是全类名的索引啊没问题,这块这块要变啊慢慢变。这是ods大法。变成一对吧,哎,改变一下路径,OK走。
05:07
哎,所以说呢,就是开始的时候啊,大家上手可能会慢一些,之后的话好多都是成熟代码。OK啊,这样呢,这个就OK了哈,那这个OK了,那看一眼吧,看一眼O不OK啊。G mail的log刷新。对吧,哎,有了一个它那就OK了哈,行,那这个呢,就是四件表的一个啊,加载数据哈,也很简单。
我来说两句