我有一个DAG,它在谷歌云桶中获取脚本的结果,将其加载到Google BigQuery中的一个表中,然后删除存储桶中的文件。
我要DAG在周末每小时检查一次。现在,我正在使用GoogleCloudStoragetoBigQueryOperator。如果文件不在那里,DAG将失败。有什么方法可以将DAG设置为如果文件不存在就不会失败的地方?或者试一试/抓住?
发布于 2021-08-03 00:17:47
您可以使用中的GCSObjectExistenceSensor来验证文件在运行下游任务之前是否存在。
gcs_object_exists = GCSObjectExistenceSensor(
bucket=BUCKET_1,
object=PATH_TO_UPLOAD_FILE,
mode='poke',
task_id="gcs_object_exists_task",
)您可以查看官方示例这里。请记住,此传感器是从BaseSensorOperator扩展而来的,因此您可以定义poke_interval、timeout和mode等参数,以满足您的需要。
https://stackoverflow.com/questions/68628542
复制相似问题