专栏首页字根中文校对软件Hadoop Hbase适合存储哪类数据?

Hadoop Hbase适合存储哪类数据?

Hadoop Hbase适合存储哪类数据?

        最适合使用Hbase存储的数据是非常稀疏的数据(非结构化或者半结构化的数据)。Hbase之所以擅长存储这类数据,是因为Hbase是column-oriented列导向的存储机制,而我们熟知的RDBMS都是row- oriented行导向的存储机制(郁闷的是我看过N本关于关系数据库的介绍从来没有提到过row- oriented行导向存储这个概念)。在列导向的存储机制下对于Null值得存储是不占用任何空间的。比如,如果某个表 UserTable有10列,但在存储时只有一列有数据,那么其他空值的9列是不占用存储空间的(普通的数据库MySql是如何占用存储空间的呢?)。         Hbase适合存储非结构化的稀疏数据的另一原因是他对列集合 column families 处理机制。 打个比方,ruby和python这样的动态语言和c++、java类的编译语言有什么不同? 对于我来说,最显然的不同就是你不需要为变量预先指定一个类型。Ok ,现在Hbase为未来的DBA也带来了这个激动人心的特性,你只需要告诉你的数据存储到Hbase的那个column families 就可以了,不需要指定它的具体类型:char,varchar,int,tinyint,text等等。         Hbase还有很多特性,比如不支持join查询,但你存储时可以用:parent-child tuple 的方式来变相解决。         由于它是Google BigTable的 Java 实现,你可以参考一下:google bigtable 。         下面3副图是Hbase的架构、数据模型和一个表格例子,你也可以从:Hadoop summit 上 获取更多的信息。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 发布:CtrlC源代码搜索引擎

    CtrlC源代码搜索引擎 是我学习 搜索引擎 的一个试验田,我会把我最新的idea拿出来和大家分享。正如 多么乐 网站建立的初衷一样,有趣的功能是多么乐追求...

    田春峰-JCJC错别字检测
  • apache mod_rewrite 模块使用的几个例子

    当我们在网上冲浪的时候,指引我们前进的路标就是URL。对网站开发者来讲一个合理设计的URL对用户、合作网站的友情连接,链接地址引用以及搜索引擎的抓取都非常重...

    田春峰-JCJC错别字检测
  • 论文校对错别字检测工具

    毕业论文是学习路上的阶段性总结,标志性的报告。如果毕业论文中出现错别字,尽管个别的错别字是可以容忍的,但总会给你自己亲手打造的一块美玉上添加几分不和谐的点缀。

    田春峰-JCJC错别字检测
  • 重温大数据---Hbase部署以及架构分析

    简单的说HBase就是一个分布式的可扩展的大数据量的非关系型数据库(NoSQL)。它具有一般的关系型数据 Oracle/MySQL的基础功能如:

    互扯程序
  • 大数据个人画像存哪儿去了?

    上一篇文章,我们将用户的购物数据用Hive进行了非实时的大数据分析,并为他们打上了标签,某些同学喜欢衣服,某些同喜欢汽车。那这些标签数据究竟存到了哪里,标签数据...

    希望的田野
  • 中小企业IT建设经验谈:如何正确地使用云存储

    我是一家小型企业的IT经理,从创立之初我就加盟了这家公司。从最初的单打独斗到如今带领一个不大的团队,我一直在负责公司IT系统的建设与运维。如今,公司的业务已经步...

    静一
  • 装腔指南:如何优雅地用数据评判餐厅星级

    和挑选酒店一样,选择饭店也是一门可以用数据分析去深究的学问。今天,数据侠就来教大家,如何用点评数据对各等级餐厅来一场多维度分析,实力超越米其林~

    DT数据侠
  • 浅谈FloatingActionButton(悬浮按钮)

    听着music睡
  • Android Data Binding入门

    俞其荣
  • python线程编程

    py3study

扫码关注云+社区

领取腾讯云代金券