三分钟读懂HBase和Hive的查询处理速度对比

Hive(数据仓库)

实际上, Hive的本质相当于在 Mysql中对 HDFS中已经存储的文件进行映射,以方便使用HQL去管理查询。

用于数据分析、清洗

高延迟的 Hive适用于脱机数据分析和清洗

基于HDFS、MapReduce

Hive存储的数据仍然保存在 DataNode中,编写的 HQL语句最终将被转换成 MapReduce代码来执行。(不要在不需要 MapReduce代码的情况下钻牛角尖如:select * from tableName)

HBase(数据库)

它是一个非关系型、面向列存储的数据库。

用于存储结构化和非结构化的数据

适用于单表非关系型数据的存储,不适合做关联查询,类似JOIN等操作。

基于HDFS

数据持久化存储的体现形式是Hfile,存放于DataNode中,被ResionServer以region的形式进行管理。

延迟较低,接入在线业务使用

面对大量的企业数据,HBase可以直线单表大量数据的存储,同时提供了高效的数据访问速度。

总结:Hive与HBase

“Hive”和“Hbase”是基于 Hadoop的两种不同技术, Hive是类 SQL引擎,运行 MapReduce任务, Hbase是 NoSQL的 Key/vale数据库,位于 Hadoop之上。两者都是可同时使用的工具。正如使用 Google进行搜索、使用 FaceBook进行社交一样, Hive可用于统计查询、 HBase可用于实时查询、数据可从 Hive写入 HBase或从 HBase写入 Hive。

如果觉得对你有所帮助。记得收藏和关注呦!(每日更新各种大数据框架)

如需转载请注明出处(创作不易请见谅)

和巨婴程序猿一起成长。让自己变得更优秀

想了解更多精彩内容,快来关注跟着巨婴去逆袭

我最近一直在思考(大数据通俗讲解)的问题,你的看法是什么呢?关注我快说出来一起交流一下吧~

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20200721A060P300?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券