00:03
那接下来呢,我们将这个流呢处理成相同的数据类型,数据类型呢在visit states。啊,就是这个样子对吧,所以呢,我们现在要把这个数据变成这个样子,首先第一个是UV对吧,我们按照顺序来啊,UV点点。Map是不是做一个map转换的,对吧,首先这里边呢是一行数据。一行数据啊呃,那最终呢,我们肯定返回一个visit space,那先开始呢,这是一个接格式的,所以我们先要把这一行数据变成什么接算对象对吧,接三。点pass object,然后呢,来嘉宾得到一个杰森object。呃,那接下来呢,最终我们是return又一个。这个visit states,好,我们看下里边要的东西,第一个SGTGT跟e dt我说过了,它是由于开窗。
01:02
之后才有的。对吧,它是开窗之后才有的,所以呢,先在这儿我们确定不了,那我们就只能怎么办,它是四类类型,那我们就给个空的。对吧,给一个空值就好了啊,最后呢,我们再处理,呃,那接下来维度VC啊,那我们就要去找一个数据来看一下了啊,还是点开我们的这个啊。这里边儿呢,应该有这个数据。哎,这个数据没有对吧,那接下来呢,我们把这个打开。点到我们的jli r talo对吧,然后呢。我们的。Log app.log点开就是它,呃,那我们看啊,我们要的VC在哪。看我放大一点啊,VC在这motion对吧,版本啊呃,那这个属于common模块里边的吧,对吧后VC那其实还有几个is new对吧,新老用户还有呢,我们的AR地区A对吧,还有我们的叫之前我们还说还有一个什么。
02:17
版本还有个渠道吧,渠道在这啊,渠道China渠道对吧,这四个都属于common里边的字段,所以我们就知道那很简单了,对吧?呃,我们就直接先在这儿提取康氮。那就是杰森object,点接生object,获取come。得到一个common磁段,接下来这个位置第一个要VC,那就common点。Get stream啊,直接写VC,刚才我们看到叫VC对吧?呃,第二个CHCH呢,就直接叫CH啊点get stream。ZH。
03:00
好,第三个位置是我们的L,看到没点。Get a。对吧,第四个呢是一六。Is new,好啊,接下来就是我们几个度量,第一个是UV,那UV呢,我们就正常给一对吧,因为我们现在求的就是UV啊,就是UV,所以给一好,那看PV给零吧,之前我们说的补零啊,然后这个都补零就好了。普林,对吧?啊,这是ug,还有一个零,最后一个还剩一个什么TSTS呢?我们就直接这个从杰森object当中点get along得到一个TS,因为我们数据当中是有世界时间,既然我们用世界时间,那就用这个吧,对吧。是不是?好呃,那这个就搞定啊,就搞定了,这个比较简单吧,对吧,那看家V得到一个visit states。
04:08
这个是VUV的。With UV的点。对吧,好,接下来这是第一个啊,第一个我们这样写一下,3.1就是处理UV数据对吧,好3.2。处理这个ug数据啊,Ug数据呢,跟他差不多对吧,那就是ug。e.map然后呢,这里边是来,那我把这个拿过来啊。我都想把这个拿过来啊,因为他俩几乎一样。对吧,U界数据啊,你看这写法都一样,然后呢,也是提取这个公共字段,但唯一的区别在于哪啊,在于这个位置,这UV我们给零,而ug给什么给一。
05:05
对吧,唯一的区别就是这个地方啊,唯一的区别就在这儿是不是。这没问题吧,我这个就直接粘过来的,大家有没有问题啊,扣一波我看一下。好,那大家呢,都没有问题。对吧,啊,都没有问题啊,行,那我们就看一下。我们继续啊,第三个呢,就会比较麻烦一点啊,比较麻烦一点啊,呃,第三个处理。
06:00
叫PV数据啊,PV数据来看一下这个地方呢,我们要拿一点东西了。呃,把这个拿过来就是关于。配个我们要求的东西。对吧,我们要求的东西,我们要求第一个PV,这个好求第二个要进入页面数,那进入页面数我们是不是要处理一下。对吧,那进入页面数,我们要判断它的上一条为呢。它就是一,否则是零,那duration sum这个也不用管,对吧,Duration sum呢,我们找一个页面数据啊,这个页面数据对吧,我们直接获取的是duration time这个东西就好了,直接把它做累加,那也就是说这里面实际上进入页面数这个指标啊,还要做一个判断。判断上一跳是否为呢?如果为闹那就是对的,如果不为呢,我们要做过滤的,对吧?那大家想啊,这一块我们有没有必要,哎,那有同学说了,这个既然你要做判断,那不如这样把这个PV跟这个do some写到一起,把这个进入页面数单独写一下。
07:17
对吧,先做一个过滤,然后呢,直接加一。能不能行?我把这个PV指标和这个连续访问市场指标把它放在一起。然后接下来进入页面数呢,给它单独的。能不能行?但是我想把它放在一起去做,大家想一下这个应该怎么做啊,关键的是我们先把这个来写好啊,PV对吧,PV点点。
08:07
卖。哎,这个地方没有得返回值对吧,我把这个返回值先写一下,呃,那这个返回值呢,我们叫这个名字叫V。Ug,对吧,好,那这边呢是一个map map里边呢还是一个map,这个东西还得有,对吧?啊,这个都还得有,那接下来呢,是我们的第一步还是一样的杰森。点pass object把这个放进来。得到了Jason object。对吧,还是一样的,从这个当中呢,提取我们的公共字段。Comment。得到一个comment段,对吧,接下来呢,我们最终是为了返回有一个visit states,好,这里面放的东西呢,我也把它拿过来吧,啊,我直接把这个拿过来啊,改一改,简单一点对吧,因为整体上来说他们三个人都是一样的,好,这边呢,又飘了一堆波浪线,说这两个代码重复了对吧?好,那这个呢,重复没有关系,我们接下来看一下啊,首先UV0PV是一了。
09:21
对吧,PV是1SV0 ug是零没有问题,但是呢,这个数据我们要做处理,这个呢,不能是零了,对吧?我们得是什么?哎,这里面除了获取它,我们还得获取一个,呃,杰森object.get j object谁啊配得到一个页面对吧?就是这个配置,然后接下来呢,从配置当中获取它。就是最后一个位置对吧,就从配置点get了,把这个放进来。对吧,TS还是正常给就好了。啊,TS还是正常给对吧,那关键的问题就在于这个不对呀,给零也不对,给一也不对,那怎么办。
10:09
大家想一下啊。提出来判断赋值,再写入这个地方,无论怎么样,我们肯定要获取页面当中的什么,上一跳页面ID对不对?我们是不是肯定要获取上一跳?页面。对,我们肯定获取页面信息之后,我们要把谁呢配置。点get。Get stream,然后这个地方写这个叫last page ID对吧?好得到一个last page,那将来我们在这边定义一个什么呢。
11:09
浪。我第一个叫SV。啊,先默认给个什么,给个零,它呢,If last pd,它不等于now。不等于呢,对吧,并且last倍力点LS它大于零,一往往来说我们都是做两个判断啊,如果说这样的话,SV我重新赋值为一。对吧,最后呢,把SV放在这儿。OK吗?能不能理解?OK,这种方式。啊,对,这个反了,这个反了。对对对,应该是进入页面数应该是等等于呢,对吧?呃。
12:04
等等于呢?或者它的一个length怎么样小于等于零,对,写反了,写反了,这个逻辑写反了。对,是的,写反了啊,这个没有问题吧,啊,逻辑这样啊,就是说刚才写反了,因为我们要的进入页面数,进入页面数它的上一调得是零,得是浪对吧,应该是浪才可以啊,升到才可以没问题啊,写反了啊,好,这个就搞定了啊,就是说我们可以做一个判断,然后呢,外面放一个指标,因为无非就是两种情况,要不然这是零,要不然是一对吧,所以我们可以这样去写,我们做一个判断就好了。对吧,好,这个就搞定好,CTRL加V得到一个visit states,然后呢。Visit states with。PVDS对吧?啊,得拿到我们配置V当中的一个DS。
13:04
好,这个呢是处理三个流,接下来UNIT3个流,我们就把它写一下啊,这个就很简单对吧,那首先是visit states with UV对吧,点UN2个,然后呢是visit states。With ug啊,不要写错了啊,这个地方不要自己用自己的TV对吧?好,那这样的情况得到了一个UN。我们就得到了一个UDS对吧,把三个流呢放在一起,你要看一下这个东西没写错,UVUGPV对吧?啊,因为名字太像了,容易写错啊好,那这个搞定,搞定之后呢,我们把同时把这个wordmark提取一下啊点。Sign time style and what marks对吧?呃,那接下来呢,是what mark strange。反正我们要做开窗,那这个乱序呢,我给一个啊给一个乱序,因为我们要做开窗了嘛,既然我们按照失电时间,所以呢,我们就做一个这个乱序啊呃,那这里面呢,放的是visit states对吧。
14:11
那我们现在呢,想着我们给多长时间啊,随便吧,我给个一秒钟对吧,我给个一秒钟啊,继续点有一个civilization的一个marks,好,每一个数据呢,我们都提取了这个时间戳点。Get ks,对吧?好,我们都用了系统的时间啊,好,那这就搞定了,加倍得到一个visit states,然后with watermark。With oldmark的一个DS对吧,WM的一个DS啊好,那接下来呢,按照这个维度信息做聚合,我们说了唯独信息有四个,那我们一样的点K呗,对吧,有一个可。呃,那K的类型,那想一下啊,我们要拿四个字段作为K,那这个类型应该写什么呢?
15:11
大家想一下,我们应该用什么类型比较合适?对,我们四个维度呢,要不然可以拼接。拼接一点对吧,那这个地方呢,我们就可以用一个。他对吧,然后呢四个啊。直接搞一个实验组就好了。
16:00
对吧,好,那这边呢,我们可以列一个它。哎,错了,不是盖的。注意导这个Java的啊,那这个里边呢,我们放了一个东西。对吧,呃,四个,那首先呢,是我们的visit states,当然这个顺序没关系了,对吧,Visit states啊,然后呢,Value点。主要是这四个就行了,AR。Y6点。A,有了,然后呢,渠道跟他的顺序没关系啊,因为每个人过来顺序都提取的一样的嘛。呃,然后一六还有一个VC对吧,点开VC。对啊,这里边呢,放我们类型啊。哎,这个是top four top four就少写了一个四对吧,好,那这个呢,我们就搞定对吧?呃,那搞定好以后呢,我们keep就成功了,得到了一个K的stream啊,K的一个stream。
17:06
对吧,啊好,这个就搞定。
我来说两句