Hive提供了一个抽象层,用于java地图减少作业,因此与相比,它应该存在性能问题。
Do we have any benchmark to compare the performance of Hive Query & Java Map Reduce Jobs ? 使用运行时数据的实际用例场景将是真正的帮助.
谢谢
发布于 2013-01-16 09:37:08
一段时间前,我在VM中做了一些小测试,我没有真正注意到任何不同之处。也许Hive有时会慢几秒,但我真的无法判断是由于内存不足而挂起的是Hives性能还是我的VM。我认为要记住的一件事是,Hive将始终决定最快的方法来完成MapReduce工作。现在,当您编写小型MapReduce作业时,您可能会自己找到最快的方法。但是对于大型复杂的工作(有连接等)你总是能和蜂巢竞争吗?
此外,编写多个类和方法的MapReduce作业所需的时间与编写HiveQL查询相比似乎要花费很长时间。
另一方面,我有一种感觉,当我自己写这份工作时,我更容易知道发生了什么。
https://stackoverflow.com/questions/14354687
复制相似问题