00:00
呃,那接下来呢,写这个双流状语,这个就很简单了,我们今天都写过了啊,In for点题拿着all in for当中的get ID。这个地方我们就get。对吧,然后呢,去interval join啊,去interval join join谁呢,是all the detail DS当中keep by啊,注意啊,这边不要写错了,这边呢是all the detail all the detail什么呢?Get,注意一定要用all ID,注意这个地方有之前有同学写错了也写的ID,那就不对了。对吧,我们订单表用ID,订单明细表是不是应该用all的ID啊,这一块不要写错了,容易写错啊,对吧,倒不是说你没理解这个东西,只是说顺手写习惯了,哎,直接就写的在ID了。OK吧,这块提示一下啊,不要写错了,好,接下来呢是between between,好between呢是时间一个范围,对吧,那就是time.second比方说我们给一个负五到五。
01:07
啊,就给一个负五到五其实就够了啊。Time second,然后呢,是好这边呢,呃,注意在生产环境当中,我们写下生产环境中给的时间为这个最大延迟时间。对吧,你想不丢数据就给最大的延迟时间就好了,好继续,那这个呢,我们就都保留呗,对吧,就是左臂右臂的区间啊,Process啊,用一个这个process join方式好呃,左边out in for,右边detail,那返回值呢,返回值我们就不能写这个object,也不能写table了,我们是不是得有一个关联的。明细数据啊,对吧,所以呢,这个地方还是一样的,我们到这边来继续写的时候,对吧,设置时点时间生成准位线啊,这个它搞定,搞定好之后呢。
02:00
我们创建一个outwe,这个outwe呢,就是集中了,那我们先把这个outwe拿过来啊。并报。那我问大家,这个里边字段我应该给给哪些,我要怎么给。大家想一下,这个out的字段我应该怎么给?像我们的all in跟out detail都直接来自于这个。啊,像总说了,订单表加订单明细表加维度表都要其他同学呢。
03:22
全都要业务需求。啊,假如说没有业务需求让你去做这个事儿,因为你刚到公司当中,可能对业务不熟嘛。那你应该怎么搞?全都要啊,其实向总说的没问题啊,就是订单表跟订单明细表,还有所有的维度表,把它字段都全要,但是有一个问题,你比方说啊,你看啊,刚才我们都在做做join的时候,对吧,看到这边呢,是ID这边的all ID他俩是不是相当于是同一个字段呀。
04:14
是不是同一个字段。是不是?对吧,所以应该是怎么回事呢?这边我稍微的去写一下,稍微写一下,写一个注释在这啊,这张表呢,就是你公司当中你不太知道的时候,就是说所有这个单当天这张表就是订单表。加订单。明细表加所有的所有需要所需的所需的。维度。表。所需的维度表,然后呢,字段。去虫之后的。是不是应该把他们资料放在一起做一个去重啊?
05:04
这块有没有问题。对吧,所以你要搞清楚,我也介绍清楚,因为你到公司当中,你要自己写这个东西的。对吧,你现在是大家都粘贴粘的挺爽的,但是到生产环的工作的时候,你得自己做对吧,所以呢,我要把这个告诉大家啊。好,那我就拿过来了啊,我就拿过来了,嗯,我就把这个东西拿过来啊,从这对吧,这个比较多啊,因为它这个字段很多对吧?啊所以呢,拿过来。那我们看一下这里面我们放了什么东西啊,来,首先是。各个人的ID这些东西啊,订单表对吧,然后呢,跟金额相关的放在一起了,呃,时间相关的好这个呢,是地区维度表啊,前面两个啊这两个。
06:07
这两个是订单和订单明细表。去重之后的字段,然后这块呢,地区表贡献的字段,用户表,然后这个是SPU。PU PU trademark和K看见没,对吧?Trademark ID trademark name PU ID name catd和c name对吧?所有的这个维度啊,那接下来呢,下面我们是为了方便操作加的几个方法啊,自己写的几个方法,那这边第一个这是一个构造器,构造器里边呢传all in for跟all detail进来,然后呢,直接默指all in for,默指out detail,那我们就看墨out in for啊,那这个地方呢,就是说当我们关联的这个out in for,如果不等于那对吧,那就把out in for里边。
07:00
独有的字段全部付给我们的当前的对象,This。对吧,付给这个啊,那同理摸着all the detail也一样的,如果说all the detail它不等于的,那我们把all the detail的数据付过来啊,最后我们还写了一个跟其他的凹的。Y的关联,但是这个方法其实没用的啊,你可以把它干掉啊。可以干掉这个没关系,对吧,主要用的就是这个内容,这个大家之前也见到过,你们之前写的那个,呃。还记得吗?在Spark里边写的那个,那个叫B,不就是长这个样子吗?对吧,啊,它就是长这样的行,那这块呢,我们就搞定,搞定了之后呢,这边我们就有对象了,叫all the white。The white对吧?好,这边呢,我们就可以直接out。点,然后又一个。
08:02
然后呢,把这个left left呢我们叫left啊叫order,这个呢叫order detail。这边呢,就放all in for,放一个all the detail。对吧,好在这种情况来说呢,我们就得到了一个O的。Wide,但是这个时候没有维度信息对吧?啊,No with no,这个D'M我们叫这个啊,叫with no game,就是任何维度并没有关联。对吧,啊,那在这个之前呢,我们可以对它做一个打印啊。短音测试啊,就是写完一点之后呢,我们做一个测试,那就out.print。这个呢,就叫它。对吧,啊做这个事情好,然后接下来呢,因为点。Excute。这里边儿我们也放一个这个。
09:00
APP。对吧,放一个它啊,那这块呢,咱们就搞定啊,咱们搞定接下来呢,我们要做一个测试。
我来说两句