首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使用成功的map计算检索失败的hadoop reduce任务

如何使用成功的map计算检索失败的hadoop reduce任务
EN

Stack Overflow用户
提问于 2013-11-02 15:10:40
回答 1查看 188关注 0票数 0

有一个针对大量数据的hadoop map-red作业。map阶段需要很长时间才能完成(~2-3天)。它完成了。

但在reduce阶段,任务失败的概率约为92%。是否可以检索成功的map任务执行的输出/计算,以便只需要重新运行reduce阶段?

运行hadoop1.2.1,Java7,单节点linux系统。

EN

回答 1

Stack Overflow用户

发布于 2013-11-02 16:49:19

不这不可能。如果您的映射器的逻辑是计算密集型的(而不是IO繁重的),那么您可以使用MultithreadedMapper多线程,或者尝试将作业拆分为两个作业。然后,第二个作业将只“标识映射”运行时间较长的前一个作业的输出。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/19739754

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档