

最近使用 Apache DolphinScheduler 调度任务,不可避免地使用到【补数据】功能,经过不断尝试,终于成功运行了【补数据】功能,以此帖记录。
"补数据" 在 Apache DolphinScheduler 中指的是 补数据(Complement Data) 功能,用于补充执行历史时间段内的工作流实例。
补数据是工作流执行的一种特殊模式,让用户可以为过去的时间段批量创建和执行工作流实例<cite />。这在以下场景中特别有用:
在工作流启动界面中,补数据功能包含以下配置选项:
whether_complement_data): 开关选项,启用补数据模式 schedule_date): 指定需要补数据的时间范围 :yyyy-MM-dd HH:mm:ss,多个日期用逗号分隔mode_of_execution):parallelism): 当选择并行执行时,可以设置自定义并行度来控制同时执行的任务数量order_of_execution) :首先是工作流的任务配置,见下图

接着,保存工作流,未设置全局变量。上线工作流。
最后,运行工作流,运行参数见下图

点击【工作流实例】,查看运行结果。

点击第1个实例进入,查看日志

结果显示,SQL 运行结果为补数据选择的日期,补数据功能正常可用。
补数据功能是 Apache DolphinScheduler 工作流管理中的重要特性,通过灵活的配置选项(执行方式、并行度、执行顺序等)来满足不同的数据补充需求<cite />。在使用时需要注意合理设置并行度,避免对系统资源造成过大压力。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。