我已经看到,当我们使用MR、Spark或Tez作为执行引擎编写大数据作业时,作业是幂等的。
作业首先将数据写入一个临时目录,即".hivestaging...“
然后,FileOutputCommitter根据以下条件将数据合并到其最终目的地:
我的问题是,为什么我们说工作是幂等的,无论它是成功还是失败?
https://stackoverflow.com/questions/56689575
相似问题