我已经看到,当我们使用MR、Spark或Tez作为执行引擎编写大数据作业时,作业是幂等的。
作业首先将数据写入一个临时目录,即".hivestaging...“
然后,FileOutputCommitter根据以下条件将数据合并到其最终目的地:
我的问题是,为什么我们说工作是幂等的,无论它是成功还是失败?
发布于 2019-06-21 01:29:44
大数据作业有时是幂等的,有时不是幂等的。就像编程的许多方面一样。
从以下URL What is an idempotent operation?
因此,在这种情况下,它不是幂等的。
https://stackoverflow.com/questions/56689575
相似问题