温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
好,那接下来我们看一下这个map join应脉部join应其实这个属性啊,我们之前看到默认是什么。是处的对吧,但是我们是不是已经改成了什么false了,因为测那个大表校验小表的时候改成了false,对吧,不让他开启这个什么。注E现在呢,我们该它打开啊,Map交应,因为麦部交应呢,选择自动的,它默认的就开启,这个时候呢,就是我们所说的,那什么是大表,什么是小表呢。25兆啊,25兆,25兆这个灯,那我们看一下这个值,那假如说你这个机器的内存比较足。对吧,我这服务器,我这服务器呢,256的。256G的,那是不是我们可以把这个值适当的再给他。调大一点啊,对吧,啊调大一点。因为你内存足的话,你能缓存的这个表的数据是不是越多呀,对吧?哎,调大一点就是牺牲内存来换取什么时间啊,换取时间做这个事好,然后我们再看一下这个原理呢,其实大家之前都讲过了啊,讲过了这个东西呢,就是缓存过来,然后另外一张表读进来,从开始当中读这个数据吧,大家之前这个代码呢,Map也写过啊,也写过开启,然后同样的呢,我们来。
01:16
效应数据来。这个数据来看一下还是用的什么。小了和大了。啊,我们之前是不是保留了一个数据啊,我当时是不是43秒是吧的时候是不是43秒啊,对吧,然后我们对比一下啊,对比一下麦教养啊开启的时候,就是之前跟大家说的那个整个麦教那个任务啊都有多重要了,你要知道,因为你们喜欢吗?所以大概知道它怎么运行的,对吧?他读进来的时候去判断一下是把这小表,然后呢,缓存到开始里面开里面去,26刚才是多少,43,这个差距还是蛮大的吧,啊这个数据量,数据量级上还是能看出来差别的啊,但是呢,这个其实也不用管,因为默认他是干什么开启的,开启的,但是我们要关心一个属性就在于哪呢。
02:10
就是当我们内存足的时候,我们可以把这个值干什么,调大一点吧,啊,因为明显感觉到你开启的三不跟不开启还是两个差别吧啊,数据量就是在那个时间上面还是很有差别的,因为我们表没变嘛,Small table table还是用的之前的那个表对吧,那这个也一样啊,因为我们说了,呃,大表加一小表,小表加一大表,默认是做了什么。做了优化了,那你先看一下,把大表呢写在前面,其实这个时间上也差不多,这个是26对吧。这个二六刚才记下,我们把它拿下,这次呢是26放在这。缓存一个,缓存一个。大表放在前面,它也是小于25兆的话,那是不是大表。
03:03
不是大表,小于25兆那就不叫大表对吧?小于25兆就不叫大表了。不是这个表,这个表不小于。这个你看啊,这个是我们那导的10万条数据,这个是100万条,这是100万条,这100万条就这意思,那其实他们俩的速度差不多吧,啊,至于大表小表哪个放在前面,是不是我们已经说了,因为它底层已经做了优化了,已经做了优化,所以说你不用搞定那个功能了,但是脉部交易这个东西呢,你要知道啊,你要知道,而且呢,你要知道它默认是开启的,而且是另外一个属性。是这个大小的一个属性吧,啊,这是我们所讲的一个优化啊。
我来说两句