00:00
拍这个呃,文档找到曝光日志表,呃,曝光日志表,这个曝光日志表呢,咱们就不用再卖关子了,这个跟刚才呃咱们那张表很像啊,很像,那接下来呢,我们就来想一想啊,曝光日表首先它主要来源于哪张哪种日志,是不是页面买点日志对吧?那完了之后呢,在页面买点日志当中啊啊是不是曝光数据也是位于一个数组当中啊,也是为一个数组当中,那这个其实跟刚才咱们那action就很像了啊,就很像了啊OK,那现在呢,我们还是先按照之前的顺序吧,先去设计一下这个曝光日志表啊,先设计下它,那这计它呢,主要两个方向,第一个方向就是一行数据指代什么,第二一个呢,就是它有什么字段啊,一行数据指代什么呀,对他来说啊,对,明细的数据是不是就是一次曝光记录,或叫一个曝光记录啊,对不对,这就是一行数据啊,那有什么字段呢?那同样的道理会有公共字段,曝光字段,还有什么呀?还有页面字段,因为咱们得知道啊,是哪个页面上的曝光信息,相当也是描述信息吧啊。
01:00
能放上就给它放上啊,是这样的啊,OK,那这就是咱们这张表的设计啊,那刚才咱们也明确了一行数据是一个曝光记录,但是我ODI层一行数据当中,我是不是相当于是一条日志,一条日志里边是不是有一个曝光数组啊,那这是不是又涉及到我们需要将一条数据哎,转成多条数据,是不是又需要啊UDTF函数啊,对不对?那你说这次咱们还需要再重新写一个吗?还用不用啊。不用了啊,为什么不用了呢?啊,你要知道啊,刚才咱们写那个函数啊,其实咱们那个函数是一个比较通用的函数,叫做啊explo的阶层葛瑞啊,咱们是不是里边并没有涉及到具体的业务字段啊,我就是你给我一个阶层数组,我就给你把阶层数组的元素一个一个字炸开,对不对?那咱们这是不是也是一个阶森数组啊啊,当然他们这两个尖森对象它们的字段是不一样的,但是它都是尖S数组啊,我是不是都可以把它炸开啊,炸开之后我再用gets object去获取各自的字段就行了,那咱们那函数是一个比较通用的函数啊,大家自己在工作的时候呢,写这种UDTF函数啊,啊,也应该尽可能的保证它怎么样啊。
02:10
尽可能的通用一些,对不对啊,尽可能通用一些啊,就是写udf函数的时候呢,尽可能的不要掺杂太多的业务里边在里边。啊,尽可能的不要掺杂太多的业务在里边啊,因为你你业务越多,那你这个函数的这个呃功能就越越越局限,你只能局限在特定的一个场景,你写的通用一点呢啊,有类似场景你都可以用它啊这样的啊,那咱们这儿呢,写的相对就比较通用啊,就会通用啊是这样的啊OK,那这时候这张表咱们就还直接用它去解析就行了啊,而且写词和的这个方式呢,也是很像的啊来,咱们先把键表语句看一下,呃键表语当中呢,刚才分析过,包括公共字段,包括页面字段,包括这个曝光的字段,曝光字段主要就是它们多这么多啊,那这时候呢,咱们从上到下啊把这几个。
03:00
是的,拿过来,CTRLC。来放到我们这个笔记里边啊,好,那放在这了,那接下来呢,我们就把这个circle呢一起啊去写一下吧,其实跟刚才几乎是没啥区别啊,In insidet啊,Overight table dwd,咱叫做display log啊,那后边partan啊,来里边写这个DT等于2020杠零六杠幺四啊来往下走,再来的,再在哪呢?Play from from ods log,那其实这个过滤条件呀,是不是都是一样的呀,对吧,CTRLC拿过来。啊,放在这很好,那上边呢,我们补上letter you explode e explorede啊,然后呢,来接son,哎,Array啊,然后呢,哎,往里边放上我们那个所需的这个字段啊,当然这会呢,不能是了,这应该是谁呀,Display Di plays,呃,PI啊,LA啊,Display好,那咱们这儿要做的事呢,是不是就把这个给它扎了呀,对吧,给杀来放在这,那同样后边写一个tmp啊,As这回咱们就不要act了,叫做display ts,呃,Play啊,Display好,那上面选的话是不是还是各种get?呃,介词object就OK了啊,那这块不再重复了啊,来把这个补一下啊。
04:20
这么多字的拿过来,CTRLC。放在这里啊好,那咱们还是老规矩,我们只是把这个查一下,先不先不往里边插入啊,先执行这一部分走好,那数据呢,已经出来了啊,OK,搞定啊,这就是我们在这儿呢,给大家强调的这个,呃,Display这张表啊,其实这个基本上去会一个就都会了啊啊来,我把视频录一下。
我来说两句