Hive提供了一个抽象层,用于java地图减少作业,因此与相比,它应该存在性能问题。
Do we have any benchmark to compare the performance of Hive Query & Java Map Reduce Jobs ? 使用运行时数据的实际用例场景将是真正的帮助.
谢谢
发布于 2013-01-16 15:02:56
您的前提是“与Java相比,它应该存在性能问题。”错了.
蜂箱(和猪和紧缩以及其他地图/减少抽象)将比一个完全调优的手写地图/减少速度慢。
但是,除非您熟悉Hadoop和map/reduce,否则您编写的映射/减少在非平凡的查询上要慢一些,而不是Hive et。阿尔。就行了
发布于 2013-01-16 09:37:08
一段时间前,我在VM中做了一些小测试,我没有真正注意到任何不同之处。也许Hive有时会慢几秒,但我真的无法判断是由于内存不足而挂起的是Hives性能还是我的VM。我认为要记住的一件事是,Hive将始终决定最快的方法来完成MapReduce工作。现在,当您编写小型MapReduce作业时,您可能会自己找到最快的方法。但是对于大型复杂的工作(有连接等)你总是能和蜂巢竞争吗?
此外,编写多个类和方法的MapReduce作业所需的时间与编写HiveQL查询相比似乎要花费很长时间。
另一方面,我有一种感觉,当我自己写这份工作时,我更容易知道发生了什么。
发布于 2016-01-30 07:53:43
https://stackoverflow.com/questions/14354687
复制相似问题