首页
学习
活动
专区
工具
TVP
发布
您找到你想要的搜索结果了吗?
是的
没有找到

大数据调度平台Airflow(一):什么是Airflow

Airflow在2014年由Airbnb发起,2016年3月进入Apache基金会,在2019年1月成为顶级项目。...Airflow采用Python语言编写,提供可编程方式定义DAG工作流,可以定义一组有依赖的任务,按照依赖依次执行, 实现任务管理、调度、监控功能。...另外,Airflow提供了WebUI可视化界面,提供了工作流节点的运行监控,可以查看每个节点的运行状态、运行耗时、执行日志等。...在Airflow中工作流上每个task都是原子可重试的,一个工作流某个环节的task失败可自动或手动进行重试,不必从头开始跑。...Airflow官网:http://airflow.apache.org/,Airflow支持的任务调度类型如下:如何获取栏目资源包通过下面的资源链接进行下载,希望对你的学习有帮助https://download.csdn.net

3.9K42

大数据调度平台Airflow(三):Airflow单机搭建

Airflow单机搭建Airflow是基于Python的,就是Python中的一个包。...单节点部署airflow时,所有airflow 进程都运行在一台机器上,架构图如下:图片1、安装Airflow必须需要的系统依赖Airflow正常使用必须需要一些系统依赖,在mynode4节点上安装以下依赖...Airflow文件存储目录默认在/root/airflow目录下,但是这个目录需要执行下“airflow version”后自动创建,查看安装Airflow版本信息:(python37) [root@node4...airflow后,查看对应的版本会将“AIRFLOW_HOME”配置的目录当做airflow的文件存储目录。...4、配置Airflow使用的数据库为MySQL打开配置的airflow文件存储目录,默认在$AIRFLOW_HOME目录“/root/airflow”中,会有“airflow.cfg”配置文件,修改配置如下

3.5K43

大数据调度平台Airflow(六):Airflow Operators及案例

Airflow Operators及案例Airflow中最重要的还是各种Operator,其允许生成特定类型的任务,这个任务在实例化时称为DAG中的任务节点,所有的Operator均派生自BaseOparator...关于BaseOperator的参数可以参照:http://airflow.apache.org/docs/apache-airflow/stable/_api/airflow/models/baseoperator...在default_args中的email是指当DAG执行失败时,发送邮件到指定邮箱,想要使用airflow发送邮件,需要在$AIRFLOW_HOME/airflow.cfg中配置如下内容:[smtp]#...配置:from datetime import datetime, timedeltafrom airflow import DAGfrom airflow.operators.bash import...==2.0.2#启动airflow(python37) [root@node4 ~]# airflow webserver --port 8080(python37) [root@node4 ~]# airflow

7.3K53

大数据调度平台Airflow(二):Airflow架构及原理

Airflow架构及原理一、Airflow架构Airflow我们可以构建Workflow工作流,工作流使用DAG有向无环图来表示,DAG指定了任务之间的关系,如下图:Airflow架构图如下:Airflow...但是在airflow集群模式下的执行器Executor有很多类型,负责将任务task实例推送给Workers节点执行。...DaskExecutor:动态任务调度,支持远程集群执行airflow任务。...关于不同Executor类型可以参考官网:https://airflow.apache.org/docs/apache-airflow/stable/executor/index.htmlwork:Worker...三、​​​​​​​Airflow工作原理airflow中各个进程彼此之间是独立不互相依赖,也不互相感知,每个进程在运行时只处理分配到自身的任务,各个进程在一起运行,提供了Airflow全部功能,其工作原理如下

5.2K32

大数据调度平台Airflow(四):Airflow WebUI操作介绍

Airflow WebUI操作介绍 一、DAG DAG有对应的id,其id全局唯一,DAG是airflow的核心概念,任务装载到DAG中,封装成任务依赖链条,DAG决定这些任务的执行规则。...二、​​​​​​​Security “Security”涉及到Airflow中用户、用户角色、用户状态、权限等配置。...三、​​​​​​​Browse DAG Runs 显示所有DAG状态 Jobs  显示Airflow中运行的DAG任务 Audit Logs 审计日志,查看所有DAG下面对应的task的日志,并且包含检索...四、​​​​​​​Admin 在Admin标签下可以定义Airflow变量、配置Airflow、配置外部连接等。...五、​​​​​​​Docs Docs中是关于用户使用Airflow的一些官方使用说明文档连接。

1.7K43
领券