00:00
首先我们打开文档啊,刚才我们大家也看也发现了啊,发现什么了呢?就是我们呃,往@卡班上去传这个配置文件的时候呢,咱们传俩对吧,俩文件啊,咱们一个一个介绍啊先看。那这个文件叫做什么什么点product文件对吧,我们看一下它文件内容啊。注意这个文件内容是固定的啊,内容是固定的啊,就是所有的工作流程我都得给他配一个这样的文件,而且里边的内容都是这个能理解吧?啊,那这个内容可以看一看是什么,你看这是啥呀。叫做什么阿兹卡奔float version对不对,然后后边2.0,这好像是在标识一个什么东西,标识一个版本对不对,那标识的版本是谁呢?是阿兹卡奔这个框架的版本吗?不是咱们框架版本,咱们装的是多多少版的呀,三点八点多对吧?啊,咱们可以看到是三点八点多,那这个2.0显然不是阿兹卡文框架的版本,那它指的是谁的版本呢?注意他这个所谓的版本指的是阿兹卡班当中的你的工作流程描述文件的版本。
01:03
啊,工作流程描述文件的版本,谁才是那个真正的工作流程的描述文件呀,是不是下边这个flow文件呀,对不对啊是这样的,就是目前情况下,咱们阿兹卡班的工作流程描述文件呢,它的格式有两种啊,也就是所谓的两个版本,那它的第一种也是第一个版本是什么样的呢?是prop文件。Property文件是什么形式啊,大家应该熟悉吧,就是K等于VK等于V是不是这种这种模式啊,对不对,这是proper文件,这是第一个版本,那现在它这个版本呢,就已经这个相当于过时了,已经不推荐使用了,那现在是不是有2.0版本了呀,2.0版本就是谁,就是咱们现在用的这个这个文件的格式,显然它不是proper吧,这不是什么等于什么等于什么,不是那个吧,那这个文件的格式什么格式呢?是哎email格式,这格式大家可能之前没听说过,也没用过,一会儿我们会先学习一下这个格式啊,是格式。啊,也就是他这块这块这块这个所谓的版本呢,指的是咱们这个工作流程描述文件,或者工作流程配置文件的格式的版本,啊,也就是说你声明2.0,那就相当于告诉他,我用的是你最新版本的工作流程配置文件,能理解吧,啊也是这个内容固定的啊,固定的你就把它记住就行了,然后咱们接下来重点学这个东西。
02:20
咱们重点学它啊,重点学它那这个东西哦,点flow文件后缀名得记住啊,就是描述工作流程的啊好,我们先来看一看这个内容,虽然格式咱们不熟悉对吧?格式不,但是咱们是不是可以先看一看这个内容啊,内容咱们这个单词应该都认识对不对,咱们看看这里边都有啥啊,简单看一下。那首先呢,我们看啊,这是不是有一个nose啊,Nose啥意思,节点的意思,其实这个节点指的是什么呀。什么节点呀?就是我们工作流程当中的工作单元,每个单元它就管它叫一个什么呀,叫一个节点,然后咱们是不是有多个工作单元,所以这有一个啥。No z s对不对,那所以说你这肯定是有多个工作单元的,但是这样呢,我们只有几个呀,咱们刚才也看了,我们是不是只有一个工单元,那工单就是谁,刚才你看是不是有一个什么job a呀,对不对,Job a显示的是不是就是咱们这个内幕字段后边的东西啊,就是这个工作节点的名称啊,那下边还有一个什么type。
03:19
下是什么类型,这个类型指的是什么类型啊,是你这个工作节点的任务的类型,这个任务类型后边有一个值叫做可望的,可望的就是啥,就是命令嘛,啊,就是命令类型,那我们这个阿兹卡曼当中自带的任务类型一共有两个,一个就是咱们这最常用的一个可类型,还有一个呢,是Java process类型,那自带的就这俩,那pro command是执行一个命令对不对?那你说我们大数据当中所有的任务是不是都能通过一条命令去执行啊?是不是你想一想啊,比如说提交MR还个这have任务,Have-1SCHOOL任务,是不是school什么inport等等就可以,呃,那Spark呢,Spark submit或者Spark circle是不是都可以通过这个命令的方式去提交任务啊,对不对?所以说我们呃,如果使用阿卡班去调度咱们大数据当中的任务啊,我们都可以通过这个command来请求调度,或者command呢,也可以执行一个我们自己写的脚本,也是没问题的。
04:18
啊,所以说其实我们基本上所有的任务类型是不是使用啊,Command是不是都可以做呀,都可以做啊,这是command类型,好,那接下来咱们往下看啊,下边这有一个con con是一些配置配置参数啊对吧,那个配呢有一个的。是什么呀,Command是不是echo hello word呀,那刚才咱们执行的任务其实就是啥,是不是就执行了一个这样的一个任务,Echo hello word啊,那echo是不是就打印的意思啊,那所以说我们是不是应该在他刚才打印的日志当中能够找到hello word才对啊,对不对,咱们找一找看能不能找到啊,History first job list log。往后你看找有没有hello的。看到没有,是不是有hello就打印出来的嘛,啊,就这个啊啊,那这其实就是我们这个文件当中的内容啊,所以说这个flow文件的里边这儿只有一个工作节点,那工作节点名字是job a,类型是命令,那真正执行的命令到底是啥呢?就是这个。
05:12
是不是就是这些东西啊啊,那内容就是这么个内容啊,那接下来咱们需要去系统的学一下这个文件的格式,咱们到底怎么去处理,对吧?因为这个文格文件格式看起来是不是稍微有点这个复杂,比如说这这个东西啥意思啊,对不对,咱们需要去了解一下啊好,那我把视频先录一下啊。
我来说两句