learn from 从0开始学大数据(极客时间)
作业涉及三类关键进程:
JobTracker 进程和 TaskTracker 进程是主从关系:
分布式计算需要将不同服务器上的相关数据合并到一起进行下一步计算,这就是 shuffle
本文分享自 作者个人站点/博客 前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!