温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
呃,刚才呢,我们给大家讲了一下咱们的这个持久化操作啊,接下来我们再讲一个叫做检查点操作,这个检查点呢,它也可以把数据呢,给它暂时的存起来也是可以的啊同学们看我们这里来说一下,把这个关掉,然后拷贝,拷贝以后呢,我们这里写上一个我们的零四啊,然后呢,写上啊,诶咱们还叫做process,然后点击OK,放过来,嗯,放过来以后啊,这个咱们这个地方该去的就去掉了啊,去掉这个咱们也不要了,咱们换一个咱们叫做点,咱们叫什么呢?叫checkpoint,那这个checkpoint呢,它有个要求,它有什么要求呢?它要求呢,你必须设定检查点的保存路径,就意味着这个checkpoint是要落盘的啊,这里咱们说一下啊,咱们checkpoint啊,它需要落盘。嗯,它需要我们的落啊,咱们的盘,所以需要呢什么呢?指定咱们的什么我们的,嗯,检查点我们的保存路径,那么说到这儿呢,有的同学就会有疑问了,说老师你之前的那个persist持久化不也有那个Dis嘛,对吧,就是我们的磁盘吗?那为什么当时是没有那个路径这个概念的呢?那是因为啊,咱们之前的那个啊是保存成临时文件啊,就意味着运行之后是要删除的啊,就是当我们的作业执行完是需要删除的,但是我们这个检查点路径,即使作业执行完了以后,它是不会删掉的,所以我们说一下啊,我们的这个检查点路径中啊来咱们叫检查点路径中啊保存的文件当我们的作业执行完毕后,完毕后它不会被删除,不会被删除,所以它需要指定啊,那么在这里呢,我们就来,咱们叫SC,咱们DR,咱们有个set叫checkpoint DR。
01:49
我这个里面其实按理说啊,应该保存到我们的什么呃,分布式的存储当中,但是我为了演示方便,我就在咱们的这个地方啊,给它创建一个我们的checkpoint路径就可以了啊,所以呢,我们这里都能写上啊,一般一般我们的保存路径啊,都是在我们的分布式存储系统中,比方说我们的H啊,但是我为了演示方便,咱们就放在了我们当前的本地目录当中了,好,我们来看一看啊,咱们来运行一下,呃,运行以后我们来看一看咱们的效果。
02:28
好了,大家会发现现在是不是已经执行完了,所以说你会发现呢,我们这个星号的下面并没有把这个圈A它重复执行,所以这个时候啊,就证明了它确实重复使用了啊,里面的数据确实有了,而且在咱们这个CP里面,大家看点一下,里面是不是也出现了,对不对,在这里面打开,打开以后是不是里面也有东西啊,诶就是这样啊,所以我们通过这种现象啊,咱们就明白了,其实啊是可以把数据放在不同的位置的,然后去读取它,这个是完全可以做到的啊,这是我们的检查点。
我来说两句