首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Hadoop生态系统: Pig/Hive需要的Map Reduce

Hadoop生态系统: Pig/Hive需要的Map Reduce
EN

Stack Overflow用户
提问于 2018-05-03 23:28:55
回答 1查看 77关注 0票数 0

互联网上有一大堆hadoop生态系统的图片,所以我很难理解这些工具是如何协同工作的。

例如,在附图中,为什么猪和蜂巢基于map减少,而其他工具,如spark或storm在纱线上?

你能帮我解释一下这个吗?

谢谢!BR

haddop ecosystem

EN

回答 1

Stack Overflow用户

发布于 2018-05-04 12:09:10

图为PigHiveMapReduce上。这是因为MapReducePigHive使用的分布式计算引擎。PigHive查询作为MapReduce作业执行。使用PigHive更容易,因为它们为使用MapReduce提供了更高级别的抽象。

现在让我们看看图片中YARN上的Spark/Storm/FlinkYARN是一个集群管理器,允许各种应用程序在其上运行。StormSparkFlink都是可以在YARN上运行的应用程序的示例。如图所示,MapReduce也被视为可以在YARN上运行的应用程序。YARN处理资源管理部分,以便多个应用程序可以共享同一集群。(如果您对类似技术的另一个示例感兴趣,请查看Mesos)。

最后,图片的底部是HDFS。这是允许应用程序存储和访问数据的分布式存储层。提供分布式存储、复制、容错等功能。

如果你对更深层次的潜水感兴趣,请查看Apache Projects页面。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50158773

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档