00:00
呃,那么如果说啊,你要是想去完全关联的话,那么咱们现在也得把它分开一下,对吧,因为我现在要关联的东西呢,那有两个对,一个呢是我们这省份,那另外一个呢,是我们这个用户对用户对吧?所以说呢,咱们现在呢,来把这个代码拿过来。然后直接写代码吧。呃,来到哪呢?来到我现在它的一个DWD层auto eone这个里边,那么关联的话,大家想一想,是不是应该是在我们这个真正去维护用户状态之前来做这个事的,对吧?我们说啊,我在写的时候呢,哎,有一个什么顺序,1234,但这个顺序呢,它并不是直接都排下来的,对吧?那么我现在昨天在做我订单相关的一个操作的时候,那第三步呢,是维护用户状态,把它保存到我现在这个H贝菲利克斯里去,然后第四步咱们是不是同批次状态修正了对吧?然后接下来,那么再往下,咱们在维护用户状态之前,对吧?那我接下来要进行我们的第五步操作,对吧?这个第五步操作呢,那其实呢,就是来关联啊。
01:13
和我们这个维度表进行关联,和维度表来进行我们这个关联是吧,那先和哪个维度表进行关联呢?先和省份吧,啊先和省份这个维度表来进行关联,有什么思路吗?大家比如说我现在想和维度表省份表进行关联,什么思路吗?这个套的怎么做?啊,先把一边读出来,其实和咱们这个状态的关联是不是其实是一样的。你想想咱们原来我在关,我在我在想获取当前这个user户是不是首单的时候,咱们是不是也要去it base它这个user states里边来取数据啊,对吧,那咱现在我要想判断诶我当前这个订单的省份是什么的话,我是不是也得去我AV的省份表里面来取数据呀,对吧?所以说目前呢,那最少大家应该知道两种方式了,一个是一条条去取,我拿到一个订单,然后呢,我到时候去我们那个这个HB的里边,把当前这个订单它所对应的省份,它所关联的或者省份的这个内容是不是给拿过来。
02:21
导致第一种方式,但这种方式呢,那我觉得肯定不好,那如果不好的话怎么办,是不是以分区为单位啊,对吧?所以说第二种方式以分区为单位来进行处理,那咱们就来呗,以分区为单位,上边呢,我得到的一个是order in for real stream,然后接下来对吧,那么咱们现在呢,在这里啊,也是对吧,不要这个和省份维度进行关联,那么现在呢,这里我也要除了我们单单独关联之外啊,我要给大家提供两种方案对吧?那方案一对吧,方一以谁呢?和我们这个观点,我状态啊这个思路一样,以分区,以我们这个分区为单位对吧?然后呢,对我们这个订单数据来进行处理,对吧?或者说以分区为单位对订单数据进行处理,和谁呢?和我们这个菲利格斯对中的订单点对吧,来进行我这个关联。
03:21
对吧,那如果要是以分区为单位的话,那大家想一想,那这块咱们是不是得用为什么map partition这个算子呀,是吧。来啊,咱把这个。拿过来在这里对吧,那就叫我这个map parts这个算子对吧,然后接下来那么咱们现在的这个map part算子,这个时候拿到是什么呢?拿到的应该是一个order in inform I tr吧,对吧?拿到当前这个分区里面的所有订单,然后咱们第一件事干什么?转换例子对不对?哎,那么咱现在呢,把当前它转换成集合,那就是order in for,我们这个a tr,然后点to list转换集合,方便呢后续进行操作,这个呢,就是我们这order in for list的order list,然后接下来短到最后呢,咱们肯定把这这个这个order for list呀,要给它转换回去,对吧,给它打过去对吧?那么咱们现在呢,在这里把集合达到了,你从这集合里边要拿什么?
04:23
当是我把首份ID打出来对吧?获取咱们这个当前分区中的那么订单当前分区中呃,订单呃,它对应的省份的一个ID吧,那怎么来获取呢?那应该是order in for list的点外B一下,然后接下来根据我的订单对象来得到它的一个province ID,那么这个ID呢,那应该也是一个集合吧,对吧?那咱第一个集合来接绍一下,这个呢,就是province ID的list pro ID,然后记起来,那么拿到这个之后,咱们是不是可以去查询一下了,对吧?那要根据什么呢?根据我们这个省份的ID到哪呢?到我们这个菲尼克斯上啊,到菲利克斯州来查询对应的省份,把这个省份数据啊,这个记录给查询出来,那你是不是得写circle过来呀,VR,对,然后circle口,然后接下来在这里啊,然后呢。
05:22
我要写一个circle是吧?在写circle之前呢,我要先把比例写一下啊。
我来说两句