前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >大数据工作流Oozie

大数据工作流Oozie

作者头像
凹谷
发布2020-04-11 10:49:42
4540
发布2020-04-11 10:49:42
举报

因为工作需要用到oozie,但是网上的资料越看越迷茫,经过很大的努力,终于折腾清楚了,这里,做一个总结,帮助后来者更好地进行入门,当然,粗鄙之言,难免疏漏,欢迎交流指正。

提供Hadoop任务的调度和管理,不仅可以管理MapReduce任务,还可以管理pig、hive、sqoop、spark等任务,Oozie就是一个基于hadoop的工作流引擎。

两个主要组件:

工作流定义组件:一系列Action个的列表(Action就是一个任务节点,eg:MapReduce任务、pig任务、hive任务等)

调度器组件:可调度的WorkFlow(workflow就是定义一个DAG的任务图,而调度器可以决定在某个时间或符合条件执行DAG(有向无环图 Direct Acyclic Graph)任务图)

Oozie工作流定义中的两种节点:

控制流节点:用于定义逻辑判断,eg:start、end、控制流程执行路径

动作节点:用户执行任务节点:hadoop任务、Oozie子流程

定义一个完整Oozie工作流需编写3个文件

1、workflow.xml:(必需)定义工作流任务(需放到HDFS上)

2、config-default:(可选) 包括所有工作流共享的属性值

3、job.properties: (必需)针对每个工作流的属性值

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-01-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据与微服务架构 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档