00:00
好,接下来呢,我们来看一下这个DWD层啊,也就是说这个用自定义udf函数和自定义udtf函数进行数据的一个解析。啊,来看那自定义这个udf,我们在这里面要做哪些事。稍微看一下。好,来看一下。我们需要呢,解析的是这个公共值的主要来解析它,那这里面制定一个udf,根据传进来的K获取对应的Y。你说你传进来的,如果是对应的这里面的K值,任何一个K我就能取出来对应的值,比如说我传进来哈,这是line,这line是这些内容。把它传进来。我能。里面这个key是mind。那我就应该把这个卖的谁呀,996传出。取出来996。你传进来,因为这line line不就是我们刚才的最开始这叫event OS log啊,这条日志进来,进来之后我就能知道啊,你取的是慢的这个值,把它取出来,那这怎么做呢。
01:13
往下看,那首先来传进来的数据,它是这样的格式啊,是服务器时间拼上对应的截止数据。那你得把这个服务器时间给它截掉啊,对吧,我们要的是下面这块。内存,你取出服务器时间和对应的监视数据。我相信大家没问题对吧,用竖线切割。好往下根据切割后的数据创建一个接层对象。因为你切割出来的下面这些,它就是一个阶层object,那你创建一个阶层object没有任何问题,好。创建。之后呢,判断输入进来的K。你说判断你传进来的它是谁,现在呢,我们传进来的是这个mind,那你去慢值,那如果传进来是ST呢。哎,传进来it你取谁呢?哎,这里面我们告诉他传进it默认的就取这个服务器时间,把这个服务器时间我们取出来。
02:08
哎,是这样一个含义哈,也就是说ST呢,是我们人为设置的,只要你穿ST,我就取时间。OK,好再来,那如果判断输入值传进来的是T,如果你传进来的是这个ET。那我们就把这个ET后面对应的这个接身数组整体打包给它取出来。为什么要取它呢?因为我们后续要对这个ET啊,进一步的解析,用到udtf,你说传进来这个数组相当于是一行,我要给它按照每一个数组元素炸裂出来。炸裂出来一行一行的是这样一个过程啊,根据对应的一个事件去炸裂。好,这是这么两块,然后判断书的P,如果P既不是ST,又不是ET,比如说既然不是复利时间也不是ET的话,那我们就给它获取的是CM。
03:02
就进入到这个队列里面,比如说你看我现在这个传进来的是MD,那m midd它就既不是这个服务器时间,也不是ET这个。那它是设备ID。那么干什么呢?那你就从这个CM里面取,那CM这块呢,然后根据K的值获取CM里的value,那这一块这一块你首先得获取传进你自己手动的传进一个CM,取出来对应的CM的value。变成一个健身数据,那对这个健身数据你再传进去,对应的传来的它。它把它取出来啊,是这样的,相当于一层一层的剥洋葱这种感觉哈。再播一下吧。啊,给大家稍微回顾一下啊,这里面你首先传进来的是一行数据,那这一行数据呢,可以根据你传进来的这个值,比如说P值进行一个判断,那我们有几类呢?有这么几类,第一类呢,传进来的是服务器时间,比如说你传的是SD。
04:03
It啊,我给你返回服务器时间,如果你传进来的是ET,那我打包把你整个这个精神宿主给你传过去,如果你既不是ST也不是ET,那我默认认为是这个相应的CM里的K值,那CM里的K值怎么办呢?你需要在代码里面首先传进去CM,取出来对应的竞争对象。然后再把这个对应的这个P传到这里面去,取出对应的值啊,这样一个逻辑哈,这是我们自定义udf要做的事。
我来说两句