我必须在hadoop 1.0.4中运行许多(可能12个)作业。我希望这五个作业首先并行运行,当所有作业都完成后,并行运行4个其他作业,最后再次运行最后3个作业以并行运行。我如何在hadoop 1.0.4中设置它,因为我看到所有作业都是彼此运行的,而不是并行运行的。
发布于 2013-04-10 12:24:03
JobControl接口可用于MR作业依赖。对于复杂的工作流,建议使用Oozie或Azkaban。Here是Oozie vs Azkaban
https://stackoverflow.com/questions/15925196
复制相似问题