温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
前面咱们讲的那个join啊,咱们说了啊,就相当于咱们circlel语句中两个表的内连接啊,但是呢,在circle当中还有个外连接的概念,这个效果呢,在咱们的RDD当中也存在啊,大家可以到它有个叫left啊左外连接,那有左连接是不应该有类似于咱们的右外连接呀啊,左连接右连接,那么左连接右连接,其实它主要决定于什么主表啊,它的位置不对,呃,在咱们circle当中,如果我们的主表在join的左边就是左连接,如果我们的主表在join的右边就叫右连接,对不对,看它以谁为主了,那么主表的数据就会查出来,那么我们的重表的数据是可能有可能没有,对不对?诶,所以这个呢,我相信如果你对比着来学习的话,我觉得问题不大啊,来咱们在这里呢,把这个关掉啊,关掉以后呢,来把这个都关掉,咱们拷贝,拷贝以后呢,我们来我们写上一个22点击OK啊好把这个呢,我们拿过来啊。
01:01
啊,拿过来把这个呢,我们都去掉,不要它,嗯,不要它,然后这个跟刚才一样,咱们叫ABC啊,然后呢叫做AB,然后呢,写上一个C,然后写上一个四啊咱们的五,然后写上一个六好了,但是我现在想做一个什么事情呢?就是我们的以左边的这个RDD呢作为主要的RDD,然后呢,我们以它为主的话,那么我们这边的数据啊可能就不存在了,所以把这个C呢,咱们给它注掉啊把它注掉,注掉以后同学们看啊,咱们的RDD,咱们叫做点点了以后咱们叫做alter join,然后呢,把RDD咱们放过来,然后呢,我们写上咱们叫做left join啊咱们join r DD等于它行了,把这个放过来,咱们看一看是什么样的效果吧,嗯,咱们运行。记住啊,同学们,我们依然是相同的K要做关联,但是这个C啊,它没有相同的K,那这样的话呢,我们说了以主表为主,它即使没有对应的这个数据,它应该也出来吧,诶只不过出来以后什么样的效果咱不知道,大家看一下效果就是这样的啊,咱们的C左边的这个三是没有问题的,但是右边是没有找到对应的数据,它用了一个叫做纳。
02:18
就是我们option类型对不对,叫可选类型,或者叫选项类型对不对,所以啊,这个时候你会发现这个就是我们的左连接,其实你想一想吧,如果有左连接的话,就应该有什么东西啊,应该有我们的右连接对不对,所以大家看一下来,我们写上咱们叫right啊,咱们这边写上一个叫right,那这个right呢,把它也改一改啊,咱们叫right,把这个放开,把这个放开啊,然后呢,把这个呢给它注掉吧,啊把这个注掉一样的啊,其实效果上是一样的,就就看以谁为主嘛,那么我们以那个RDDR为主的话,那么我们RDD的数据如果没出来的话,这个C照样能够出来,对不对,所以我们来把这个呢,我们给它改一个叫right,好,那我们现在呢再来试一试啊,咱们运行一下,嗯,运行以后看结果。
03:05
看一看我们会出现一个什么样的结果,好吧,同学们,嗯。好,大家有没有发现我们的数据是不是我们的右边这边有数据了,但左边是可能有可能没有,对不对,这就叫做我们的右连接啊,就是这个意思了,嗯,左连接右连接啊。
我来说两句