首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Apache DolphinScheduler之有赞大数据开发平台的调度系统演进

前言 在不久前的 Apache DolphinScheduler Meetup 2021 上,有赞大数据开发平台负责人宋哲琦带来了平台调度系统从 Airflow 迁移到 Apache DolphinScheduler...刚入职时,有赞使用的还是同为 Apache 开源项目的 Airflow,但经过调研和生产环境测试,有赞决定切换到 DolphinScheduler。 有赞大数据开发平台如何利用调度系统?...在调度节点 HA 设计上,众所周知,Airflow 在 schedule 节点上存在单点问题,为了实现调度的高可用,DP 平台采用了 Airflow Scheduler Failover Controller...以下为对比分析结果: Airflow VS DolphinScheduler DolphinScheduler 价值评估 如上图所示,经过对 DolphinScheduler 价值评估,我们发现其在相同的条件下...架构设计 保留现有前端界面与DP API; 重构调度管理界面,原来是嵌入 Airflow 界面,后续将基于 DolphinScheduler 进行调度管理界面重构; 任务生命周期管理/调度管理等操作通过

2.6K20
您找到你想要的搜索结果了吗?
是的
没有找到

有赞大数据平台的调度系统演进

调度系统升级选型 1、Airflow VS DolphinScheduler 针对这几个痛点问题,我们在今年也有了升级DP调度系统的想法,一开始的想法是直接升级到Airflow2.0版本,但因为脱离了社区版本...,评估下来升级成本有点高,于是也做了其他开源调度组件的调研,然后DolphinScheduler进入了我们的视野,同样都是Apache顶级的开源调度组件项目,我们也基于当前使用的Airflow版本(1.7...社区生态 DolphinScheduler社区在国内整体活跃度较高,经常会有技术交流,技术文档比较详细,版本迭代速度也较快。...经过综合评估后,我们决定接入DolphinScheduler,进行DP调度系统的升级重构。...对接DolphinScheduler API后,因为用户体系是直接在DP Master上进行维护,因此DS平台在用户层面统一使用admin用户。

2.2K20

大数据调度平台分类大对比(OozieAzkabanAirFlowXXL-JobDolphinScheduler)

AirFlow Airflow 是 Airbnb 开源的一个用 Python 编写的调度工具。于 2014 年启动,2015 年春季开源,2016 年加入 Apache 软件基金会的孵化计划。...Airflow 通过 DAG 也即是有向非循环图来定义整个工作流,因而具有非常强大的表达能力。 类型支持 支持Python、Bash、HTTP、Mysql等,支持Operator的自定义扩展。...DolphinScheduler DolphinScheduler是今年(2019年)中国易观公司开源的一个调度系统,在今年美国时间2019年8月29号,易观开源的分布式任务调度引擎DolphinScheduler...Apache DolphinScheduler是一个分布式、去中心化、易扩展的可视化DAG工作流任务调度系统,其致力于解决数据处理流程中错综复杂的依赖关系,使调度系统在数据处理流程中开箱即用。...DolphinScheduler上的用户可以通过租户和hadoop用户实现多对一或一对一的映射关系。无法做到细节的权限管控。

6.3K20

dolphinscheduler添加hana支持

的支持,同时也讲了dolphinscheduler下的datax的配置( ),唯一的缺陷是dolphinscheduler默认只对常规数据库厂商的db做了支持,比如:mysql、oracle、sqlserver...,好了,现在开始~ 一.整体的项目结构 (项目结构) 上图是dolphinscheduler整体代码结构,里面dolphinscheduler-ui是前端页面模块,其下方均为脚本或文档之类,其上方有...3.1 添加hana的jdbc依赖 添加依赖大概有三个地方: 1.dolphinscheduler-2.0.5中主目录下pom文件,建议添加版本以及依赖 2.dolphinscheduler-dao模块下的...pom文件 3.dolphinscheduler-datasource-plugin/dolphinscheduler-datasource-saphana模块下的pom文件(这个模块需要创建) 具体位置如下方截图.../dolphinscheduler-datasource-api -am mvn clean -Dmaven.test.skip=true package -Prelease -pl dolphinscheduler-api

76320

大数据调度平台Airflow(一):什么是Airflow

Airflow在2014年由Airbnb发起,2016年3月进入Apache基金会,在2019年1月成为顶级项目。...Airflow采用Python语言编写,提供可编程方式定义DAG工作流,可以定义一组有依赖的任务,按照依赖依次执行, 实现任务管理、调度、监控功能。...另外,Airflow提供了WebUI可视化界面,提供了工作流节点的运行监控,可以查看每个节点的运行状态、运行耗时、执行日志等。...在Airflow中工作流上每个task都是原子可重试的,一个工作流某个环节的task失败可自动或手动进行重试,不必从头开始跑。...Airflow官网:http://airflow.apache.org/,Airflow支持的任务调度类型如下:如何获取栏目资源包通过下面的资源链接进行下载,希望对你的学习有帮助https://download.csdn.net

4K42

大数据调度平台Airflow(三):Airflow单机搭建

Airflow单机搭建Airflow是基于Python的,就是Python中的一个包。...单节点部署airflow时,所有airflow 进程都运行在一台机器上,架构图如下:图片1、安装Airflow必须需要的系统依赖Airflow正常使用必须需要一些系统依赖,在mynode4节点上安装以下依赖...Airflow文件存储目录默认在/root/airflow目录下,但是这个目录需要执行下“airflow version”后自动创建,查看安装Airflow版本信息:(python37) [root@node4...airflow后,查看对应的版本会将“AIRFLOW_HOME”配置的目录当做airflow的文件存储目录。...4、配置Airflow使用的数据库为MySQL打开配置的airflow文件存储目录,默认在$AIRFLOW_HOME目录“/root/airflow”中,会有“airflow.cfg”配置文件,修改配置如下

3.6K43

助力工业物联网,工业大数据之服务域:AirFlow的介绍【三十一】

Airbnb公司研发,自主分布式、Python语言开发和交互,应用场景更加丰富 开发Python文件 # step1:导包 # step2:函数调用 提交运行 场景:整个数据平台全部基于Python开发 DolphinScheduler...:易观公司研发,国产开源产品,高可靠高扩展、简单易用 小结 回顾任务流调度的需求及常用工具 03:AirFlow的介绍 目标:了解AirFlow的功能特点及应用场景 路径 step1:背景...从清洗,到拼接,只用设置好一套Airflow的流程图。 2016年开源到了Apache基金会。 2019年成为了Apache基金会的顶级项目:http://airflow.apache.org/。...》 放弃安装:请将虚拟机快照恢复到《AirFlow安装完成》 启动测试 删除记录:第二次启动再做 rm -f /root/airflow/airflow-* 启动Redis:消息队列: nohub非挂起...# 以后台进程方式,启动服务 airflow webserver -D airflow scheduler -D airflow celery flower -D airflow celery worker

28410
领券