首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >Hive与HBase相比如何?

Hive与HBase相比如何?
EN

Stack Overflow用户
提问于 2008-08-23 12:22:05
回答 4查看 44K关注 0票数 57

我有兴趣知道最近发布的(http://mirror.facebook.com/facebook/hive/hadoop-0.17/)蜂巢在性能方面与HBase相比如何。Hive使用的类似SQL的接口比我们实现的HBase应用程序接口要好得多。

EN

回答 4

Stack Overflow用户

发布于 2010-06-04 12:38:53

从一个角度来看,Hive由五个主要组件组成:类似SQL的语法和解析器、查询规划器、查询执行引擎、元数据存储库和列式存储布局。它的主要关注点是数据仓库风格的分析工作负载,因此不需要通过键低延迟检索值。

HBase有自己的元数据存储库和列式存储布局。可以在HiveQL表上编写HBase查询,从而允许HBase利用Hive的语法和解析器、查询规划器和查询执行引擎。有关更多详细信息,请参阅http://wiki.apache.org/hadoop/Hive/HBaseIntegration

票数 11
EN

Stack Overflow用户

发布于 2009-06-25 21:38:07

Hive是一个分析工具。就像pig一样,它是为利用map reduce对潜在的海量数据进行临时批处理而设计的。以terrabytes为例。想象一下,在关系数据库中尝试这样做...

HBase是基于BigTable的基于列的键值存储。虽然可以通过HBase运行map reduce作业,但不能执行查询本身。它的主要用例是按键读取行,或扫描行的范围。一个主要的特征是当扫描列的‘族’的行键范围时,能够具有数据局部性。

票数 8
EN

Stack Overflow用户

发布于 2010-06-06 13:09:17

据我所知,蜂巢比猪更有可比性。Hive类似于SQL,而Pig基于脚本。Hive似乎在查询优化和执行引擎方面更加复杂,并且需要最终用户指定模式参数(分区等)。这两种方法都用于处理文本文件或sequenceFiles。

HBase用于键值数据存储,retrieve...you可以扫描或过滤这些键值对(行)。不能对(key,value)行进行查询。

票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/24179

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档