温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
好,同学们,那么我们接下来讲一下save相关的算子啊,这个咱们其实之前讲过一个叫save,就是分区保存文件对吧,或者说保存分区文件啊都是可以的,那我们现在呢,来看一看,把这个去掉,然后呢我们这里拷贝,拷贝以后呢,写上咱们叫做零五啊,然后呢,拿过来点击OK啊,放这边,然后呢,我们这边简单一点把这个去掉,去掉以后呢,我们写上咱们叫RDD,点我们叫做什么呢?叫save X啊,As test fair,然后写上一个我们叫做outp put,诶,就是它了,但是其实你会发现这个方法以save开头的,其实不仅仅只有一个呀,所以我们打开你会发现还有save as object,还有一个叫second,诶,所以不太一样啊,那么我们这里来一下叫做我们的诶,Object,嗯,好,这个为了区分开啊,给他个一呀,然后正好呢,我确认一下咱们这边那个文件目录有没有,诶好像有,有的话给它。
01:00
删掉它啊,咱们delete一下,嗯。好,然后呢,我们这里再来啊,把这个呢,给它一个二啊,给它一个R,这样的话呢,诶不对,这个两个重复了,我们这还有一个叫sequence啊,所以来咱们把这个去掉,咱们叫as,咱们叫sequence,哎,咱们在这个位置啊,你的这个位置没有任何问题,那么text object和sequence啊,然后呢,我们这里运行一下。看一看我们会保存成什么样的文件出来。嗯,好了同学们,我们这边呢,已经出来了啊,出来了以后我们来看一下,首先第一个,那第一个呢,诶我们这忘了写分区了,没关系,忘了写分区的话,但数据应该是都能出来啊打开打开以后大家看一下A1是吧,然后呢,再往下咱们找找啊AA2,然后呢,再来一个A3,所以啊它的数据呢,会保存到我们不同的分区文件当中,但是我忘了刚才指定分区了,所以呢,它是我们的八个分区对不对?好啊这个不管它了,然后呢,我们的OUTPUT1咱们打开打开以后呢,我们点一下你有有没有发现它里面其实有点看不懂了吧,诶这个呢是我们的object啊,咱们的file有点看不懂了,然后呢,这里面的东西看不懂,看这这个呢,这个也没有是吧?嗯,这个呢,诶这里面是有东西的,对吧,所以啊,它放在了不同的分区当中,这个跟我们关系不大,咱们先不管它了,那好接着往下啊,哎,咱们的这个second fair咱们打开,打开以后呢,我们点一下点,诶这个好像不是,然后呢再打开,哎,这个有了啊。
02:30
有的话你会发现也看不懂,对不对,他们都是用特殊的方式把我们数据呢,保存到不同的文件当中,这个咱们理解一下就可以了,咱们一般还是用这个用的会多一些,为什么呢?好理解起来容易嘛,对不对,而且传给别人的话,用起来也更加的方便啊,是这个样子的,但是肯定它的性能各方面会有所差别嘛,因为保存的方式可能不太一样,对吧?还有一个我们的这个叫save as file,有一些问题,为什么呢?咱们这里说一下,就是我们上面两个方法随便用这个是没事儿的,但是我们的这个方法,嗯。
03:05
这个方法它要求要求我们的数据的格式,它必须为什么呢?叫KV类型。啊,就是我们的渐值类型,那比方说咱们举个例子,同学看我现在呢,把它来我们写上叫做map,嗯,然后呢,写上一个下划线,逗啊,咱们点叫下划线,一再写个点,你发现不行,当你不是键值类型之后,你的这个方法就用不了,所以它要求必须是我们的这个类型啊,就是这个意思了,嗯,好了啊,这个咱们就讲到这儿啊。
我来说两句