前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >大数据-Azkaban实战

大数据-Azkaban实战

作者头像
cwl_java
发布2019-12-30 17:54:22
5870
发布2019-12-30 17:54:22
举报
文章被收录于专栏:cwl_Javacwl_Java

3. Azkaban实战

Azkaba内置的任务类型支持command、java

3.1. Command 类型单一 Job 示例

Step 1: 创建 Job 描述文件

创建文本文件,更改名称为mycommand.job 注意后缀.txt一定不要带上,保存为格式为UFT-8 without bom 内容如下

type=command 
command=echo 'hello world'

Step 2: 将job资源文件打包成zip文件

在这里插入图片描述
在这里插入图片描述

Step 3: 创建project并上传压缩包

通过azkaban的web管理平台创建project并上传job压缩包 首先创建project

在这里插入图片描述
在这里插入图片描述

上传zip包

在这里插入图片描述
在这里插入图片描述

Step 4: 启动执行job

在这里插入图片描述
在这里插入图片描述

3.2. Command 类型多 Job 示例

Step 1: 创建有依赖关系的多个job描述

第一个job:foo.job

type=command 
command=echo 'foo'

第二个job:bar.job依赖foo.job

type=command 
command=echo 'bar' 
dependencies=foo

Step 2: 将所有job资源文件打到一个zip包中

在这里插入图片描述
在这里插入图片描述

Step 3: 在azkaban的web管理界面创建工程并上传zip包

Step 4: 启动工作流flow

3.3. HDFS 操作任务

Step 1: 创建job描述文件fs.job

type=command 
command=/export/servers/hadoop‐3.1.1/bin/hdfs dfs ‐mkdir /azkaban

Step 2: 将job资源文件打包成zip文件

在这里插入图片描述
在这里插入图片描述

Step 3: 通过azkaban的web管理平台创建project并上传job压缩包

Step 4: 启动执行该job

3.4. MapReduce 任务

MR 任务依然可以使用command的job类型来执行

Step 1: 创建job描述文件,及mr程序jar包(示例中直接使用hadoop自带的example jar)

type=command 
command=/export/servers/hadoop‐3.1.1/bin/hadoop jar hadoop‐mapreduce‐ examples‐3.1.1.jar pi 3 5

Step 2: 将所有job资源文件打到一个zip包中

在这里插入图片描述
在这里插入图片描述

Step 3: 在azkaban的web管理界面创建工程并上传zip包

Step 4: 启动job

3.5. Hive 脚本任务

Step 1: 创建job描述文件和hive脚本

Hive脚本: hive.sql

create database if not exists azhive; 
use azhive; 
create table if not exists aztest(id string,name string) row format 
delimited fields terminated by '\t';

Step 2: Job描述文件:hive.job

type=command 
command=/export/servers/apache‐hive‐3.1.1‐bin ‐f 'hive.sql'

Step 3: 将所有job资源文件打到一个zip包中

在这里插入图片描述
在这里插入图片描述

Step 4: 在azkaban的web管理界面创建工程并上传zip包

Step 5: 启动job

3.6. Azkaban 的定时任务

使用azkaban的scheduler功能可以实现对我们的作业任务进行定时调度功能

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
  • */1 * ? * * 每分钟执行一次定时调度任务
  • 0 1 ? * * 每天晚上凌晨一点钟执行这个任务
  • 0 */2 ? * * 每隔两个小时定时执行这个任务
  • 30 21 ? * * 每天晚上九点半定时执行这个任务
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 3. Azkaban实战
    • 3.1. Command 类型单一 Job 示例
      • Step 1: 创建 Job 描述文件
      • Step 2: 将job资源文件打包成zip文件
      • Step 3: 创建project并上传压缩包
      • Step 4: 启动执行job
    • 3.2. Command 类型多 Job 示例
      • Step 1: 创建有依赖关系的多个job描述
      • Step 2: 将所有job资源文件打到一个zip包中
      • Step 3: 在azkaban的web管理界面创建工程并上传zip包
      • Step 4: 启动工作流flow
    • 3.3. HDFS 操作任务
      • Step 1: 创建job描述文件fs.job
      • Step 2: 将job资源文件打包成zip文件
      • Step 3: 通过azkaban的web管理平台创建project并上传job压缩包
      • Step 4: 启动执行该job
    • 3.4. MapReduce 任务
      • Step 1: 创建job描述文件,及mr程序jar包(示例中直接使用hadoop自带的example jar)
      • Step 2: 将所有job资源文件打到一个zip包中
      • Step 3: 在azkaban的web管理界面创建工程并上传zip包
      • Step 4: 启动job
    • 3.5. Hive 脚本任务
      • Step 1: 创建job描述文件和hive脚本
      • Step 2: Job描述文件:hive.job
      • Step 3: 将所有job资源文件打到一个zip包中
      • Step 4: 在azkaban的web管理界面创建工程并上传zip包
      • Step 5: 启动job
    • 3.6. Azkaban 的定时任务
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档