00:01
好,那我们刚刚已经完成了阿兹卡班的部署了,那接下来我们就正式进入到了这个阿兹卡班的使用阶段了啊,那阿阿兹卡班的使用呃阶段呢,我们安排了两部分内容,那一部分呢,是诶2.2这一节,那在这一小节里边呢?呃,我们一共有四个基础案例啊,相对来说都比较简单啊,那还有一部分呢,是这个第三章啊,它是进阶内容啊,那这部分的内容呢,呃,相对要复杂一些。啊,要高级一些啊,我们先从这个最基础的案例开始啊好,那我们来看一下基础的这个几个案例啊,这里边儿呢,有一个hello的案例,那相对于一个入门案例,那还有一个作业依赖案例,然后呢,还有两个失败重试的案例。好,我们先从这个hello word开始啊,这个我会借助这个hello word的案例呢啊,从头到尾的啊,先给大家完整的演示一下这个阿兹卡班的这个使用,先从头到尾的去演示一下啊,那这个hello word的案例呢,主要是呃,先让大家有一个哎宏观上的一个感知啊,那至于我们呃,做这个案例过程当中涉及到的一些具体的啊内容啊,这个呢,不用着急,后边呢,我会给大家去详细的呃讲解的啊好,那现在大家可以先看我从头到尾的去使用一下这个阿兹卡班,好,那前面其实给大家也提到过啊,就是我们使用这种工作流程调度系统,不光是阿兹卡拉啊啊还有屋Z啊,Airlow,呃,Doin sc等等等等,使用这些工作流程调度系统的时候呢,我们其实主要就是分两步去做,那第一步呢啊,就是描述我们自己的工作流程。
01:41
对吧,第二步呢,就是配置这个定时啊,就是配置定时,那阿德卡文当然也不例外,也不例外啊,那一会儿大家可以呃,在我操作的时候看一看,我们是不是做了这样的两步啊,那首先我们看文档,我们要想去使用阿斯卡班去调度一个工作流程,首先我们需要怎么做呢?需要在咱这个Windows环境下边呢,先新建两个文件。
02:06
这两个文件分别是什么?一个是点project文件,还有一个呢是点flow文件啊,文件名可以随意的去起,但但是它的后缀名不能乱写。必须得是点project以及点flow文件啊,那我们现在呢,把这两个文件创建出来,然后呢,把这两个文件的内容给它加进去,我们现在先创建第一个文件。在这呢,我使用呃,Notepad加加吧,嗯,好,那现在呢,我们呃新建一个这个文件啊,建一个文件在这里边,我们把第一个文件的内容先拿过来,叫做阿兹卡班,诶这个fluvation2.0啊,这个文件的内容什么意思,它干什么用的,这个我后边会给大家详细的解释了啊,咱现在先不用管啊,我现在给它保存一下,那保存成什么呢?保存成比如说我们就叫做first,这是我们的第一个对吧,那这个叫什么名都可以啊,第一个案例first,然后点啊我们后边呢,可以给它取名为这个product pro,这是必须得是点product啊,那下边后缀名呢,我们给它,呃给它改了,改成这个就行了,然后点击我们放到桌面吧,放到桌面那然后呢,点击保存。
03:13
好,那我们现在第一个文件就创建出来了啊,紧接着我们创建第二一个文件,第二个文件的内容呢,我们把它拿过来,哎,CTRLC。CTRLV啊,这个文件的内容呢,相对要多一些,对吧?啊,我们同样还是先不管内容啊,我们先给它保存下来啊,CTRLS保存。啊,那这个也放在桌面,呃,给它起个名字呢,也叫first,这是我们的第一个啊,这个文件第一个这个案例对吧,咱们管它叫做flow first flow,那同样的我们把文件名呃,文件那个后缀给它改一下啊完了之后呢,点击保存。行,那现在我们就完成了这两个文件的创建了啊,完成两个文件的创建了,好,那创建完之后呢,我们呃,接下来呃,继续往下进行啊,继续往进行,我们现在呢,打开这个阿兹卡文的web页面,那打开之后呢,我们已经完成了登录了啊,那现在我们还要使用,我们需要怎么做呢?需要在这儿呢,Create一个project,创建一个项目,那我们点击create product完之后呢,我们在这儿呢,需要给它起一个名字,诶比如说我们叫做first,下面呢是这个项目的描述信息,我们也选择啊也写也写为first,那现在点击create product。
04:20
创建出来了,那创建出来之后呢,我们看右上角这个位置呢,有三个按钮,分别是delete product,删除该项,Upload和download啊这个咱们都知道是啥,那上传啊和下载,我们上传的是什么,下载的又是什么呢。哎,其实哎可以给大家说一下啊,咱们这要上传或者要下载的东西呢,其实就是什么,其实就是我们工作流程的描述文件。啊,工作流程的描述文件,因为我们前面提到过,使用这种工作流程调度系统,我们首先得先描述这个工作流程,对吧,咱们得先告诉阿德卡文我的工作流程是什么样的,那其实我们刚刚所创建的两个文件就已经把我们的工作流程描述好了。
05:07
啊,那现在我们要做的事就是把这俩文件诶给@卡曼,那怎么给他呢?啊,不能直接上传,我们需要将这两个文件诶给它打到同一个zipip包里,注意这块呢,只能是zipip包啊,我们压缩到这个zip包,Zip包好,压缩进去之后呢,我们需要将这个文件名给它改一下,当然这块不改也没事啊,我们改成first.zip那这个呢,就是我们现在所需要用到的一个zip包,好,那现在我们将该zip包进行上传,点击upload,选择我们刚刚那个诶zip包就是它,然后打开,打开之后呢,点击upload。啊,如果说我们现在能来到这个界面啊,那就说明我们的刚才所编写的两个配置文件是没有任何语法问题的啊,换句话说啊,也就是说我们阿兹卡班呢,你在上传他的这个工作流程配置文件的时候,也就我们刚才那个zip包的时候呢,它其实会校验咱们那个配置文件的格式的啊,如果你的格式不对,有错误,它会在这个位置来给我们提示出来。
06:06
是这样的啊好,那现在进到这个页面之后呢,我们,呃,怎么去执行这个工作流程呢,咱们现在是不是要执行它来对吧,怎么执行。在这呢,我们可以点击这个绿色的按钮,叫做skill flow,执行工作流程,这个flow呢,在这指的就是工作流程,就是工作流程啊,点它。点完之后呢,我们来到了一个这样的一个诶界面啊,这个界面,这个界面呢,首先这里边的主体其实是这样的一个图啊,这是一个work flow工作流程图啊,理论上呢,这块应该是像我们前面描述的那样一个工作流程应该是什么呀?应该是由多个工作单元组成,对不对,然后呢,每个工作单元之间呢,是有前后的依赖关系的,对吧?它应该是这样的一个流程图,那但是这边咱这展示的只有这样的一个job a这样的一个工作节点,对吧?啊这个是怎么回事,给大家解释一下,这是因为我们第一个hello的案例啊,我们报度的是一个最简单的工作流程,工作流程当中呢,只有一个工作单元。
07:05
只有所以说这个图呢,展出来就是这样的啊,就是呃,是这么一回事啊好,那这个呢,大家知道怎么回事就行了,那接下来我们往下看啊,下边你会发现这儿呢,一共有两个按钮啊,两个按钮一个呢是绿色的schedule啊,Schedule什么意思呢?就是定时调度,那右边这个按钮叫做excute啊,就是执行的意思啊,我给大家解释一下这俩按钮分别干什么用的啊,如果我们点击excute,那这个工作流程呢,就会立即执行,而且只执行一次。啊,这叫cute,那下左边这个schedule呢,它是干什么用的呢?哎,它是做这个定时调度的啊,做定时调度的啊,那现在我们可以看一下啊,比如说我们现在点击诶schedule这个按钮,然完之后呢,我们就来到了这样的一个配置界面,我们的定时规则呢,就是在这个页面去配置了。啊,就在这个页面去配置啊,比如说我想让他在每一天的00:30去跑,那这块呢,你需要做相应的配置啊,那至于这个具体的配置规则呢,我们现在先不用管啊,后边呢,会单独拿出来一小节去讲解这个定时配置啊,那现在呢,我们呃先测试一下咱们这个环境到底能不能哎跑通,哎,我们现在呢,只让这个工作流程执行一次啊,所以说我们现在点击右下角的cute,点击点完之后呢,出现一个这样的对话框,我们点击continue。
08:24
好,那这时候呢,大家呃,是不是又自动跳到了一个界面上,对吧?然后大家现在呃,应该能看到咱们这个页面的主体,其实也应该是一个什么呢?也应该是一个工作流程图啊,也应该是一个工作流程图啊,但是只不过因为我们这儿的工作流程太简单了,只有一个工作单元啊,那理论上呢,这儿呃,会有一个这样的图啊,会这样一个图,那然后这个页面呢,它会给我们实时的展示我们整个工作流程的执行进度。啊,会实时的展示整个流程的工作进度啊,那这里边儿不同的颜色代表我们,呃,这个不同的完成状态,如果说啊某个工作单元它的颜色是绿色,表明哎,该任务已经执行成功了。
09:10
啊,如果某个工作单元它的颜色呢是蓝色,表明哎这个工作单元呢,正在执行中啊,那如果某个工作单元,哎,它的颜色是红色,那非常不幸,说明该任务已经失败了。啊,该任务已经失败了啊,那这是咱们这个页面的一个主要内容啊,这个页面的一个主要内容,好,那这块介绍完之后呢,我们继续来看一看这个页面的一些其他的这个内容啊,其他的内容啊,那现在我们先呃试着跟我思考一个问题啊,假如我们这儿呢,有一个工作流程对吧?开工流程,那假如说执行到某一步的时候,它变红了,变红了刚才说了是不是说明他说明他报错了对吧?他有问题对吧?失败了,那我们是不是需要去查找那这个工作单元它失败的原因啊,对吧。那去哪去查找这个原因,也就是去哪去查看咱们任务的日志呢?哎,注意是在上面去看的啊,呃,我们要看的话呢,呃,应该看的是这个是job list,而不是这个flow log啊注意这个flow log呢,它指的是整个工作流程,是整个工作流程的这个日志啊,它只会显示整个流程是成功的还是失败了,那至于你具体的工作单元的日志在这呢,是看不到的,我们需要需要去去哪看呢?需要在这个job list里边去看啊,咱们点击list。
10:27
这儿呢,我们需要给大家再再强调一下两个概念啊,哪两个概念呢,一个就是flow,一个呢就是照吧。阿兹卡班当中呢,Flow,它所对应的概念呢,就是工作流程。啊,Flow指的就是工作流程啊,那job指的是什么呢?Job所对应的就是我们前面提到的哎,工作单元。啊,一提到job指的就是工作单元,Flow指的就是工作流程啊,这是大家需要注意的啊,然后咱们这个节点这个位置呢,它叫做job list,对吧?也就说这个位置呢,它会有一个列表,对不对,会把什么展示出来呢?会把我们整个流程当中的每个工作单元给咱们展示出来,那当然我们这儿呢,因为只有一个工作单元啊,只有一个单元啊,那假如说你这有多个工作单元,你这时候你需要找到那个红色的工作单元看一看,哎,他到底为啥报错,怎么去哪看日志呢?你可以看到啊,每个工作单边,每个job后边是不是有一个log呀,对吧?那这里边所存储的就是该工作单元执行过程当中所打印的日志啊,你现在可以点进去。
11:29
啊,点击之后呢,你可以看到咱们这个呃,这个job呃,没有报任何的错误,全是in份信息啊,全是in份信息啊,那这个呢,就是我们出现问题之后,排查日志的位置,去排查日志的位置啊这块呢,是大家需要去注意的一个地方啊好了,那阿兹卡湾哎,我们的第一个案例就算是完成了啊,从这通过这个案例呢,就是希望大家哎能够总体上啊,先大致的去了解阿兹卡班哎从头到尾的一个使用过程。
12:02
啊,一个使用过程好,至于剩下的细节的东西呢,哎,我们下来再讲。
我来说两句