前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >图文简述HBase的用途(一)

图文简述HBase的用途(一)

作者头像
希望的田野
发布2019-09-24 14:13:35
1.7K0
发布2019-09-24 14:13:35
举报
文章被收录于专栏:信息化漫谈信息化漫谈

我们平常在存储数据时,会想到用Mysql关系型数据库、大硬盘文档存储等。但是,面临互联网自媒体时代的出现,采用Mysql来存储微信类评论数据、零碎图片、零碎视频,采用Mysql的数据库,已经力不从心。表现在:1、Mysql数据库字段固定。2、Mysql字段存储内容无法任意增加或删除。3、Mysql数据库水平扩展麻烦(分库分表依靠人手管理,非常麻烦),海量的数据存取存在瓶颈。因此,面临此类问题,Apache在HDFS的基础上推出了HBase的NoSQL数据库,解决此类问题。

HBase的表结构与传统关系型数据库相比,发生了巨大变化,因内容复杂,我们将HBase分为多个章节进行讲解。今天先带大家入门,讲第一章。

上表为HBase的典型存储逻辑结构。粗一看,大家发现,好像没有什么变化。但实际变化非常之大。

一、HBase的column-family-1是一个列族,比如为人员基本信息。而column-A可能姓名,column-B可能为性别。而column-family-2可能是人员学籍信息。

二、每个cell没有字段类型,而且里面可以任意增删数据。我们可以在同一个cell中按时间戳进行任意的数据增加,就像上表。t2:hk,51:jy,他们放入了同一个cell中。甚至可以放个视频、图像等大文件。

三、HBase按column-family进行自动分裂,存放不同的服务器的HDFS文件中,支持大容量的水平自动扩展。

四、HBase可以按RowKey进行自动分裂,可以设置手动、自动分裂。通过第三、第四的自动化扩展,HBase可以在廉价的pc服务器上存储大量的数据文件。

五、HBase对于null空的column不会进行数据存储,相比存在cell类型的Mysql而言,可以大量节省存储空间。

六、HBase可以自动进行join操作,相比Mysql跨库、跨表后复杂的join联结操作,程序员可以非常简便地进行数据查询计算。

今天HBase的第一章讲到这里,明天为大家带来HBase后台的存储原因。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-01-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 信息化漫谈 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
TDSQL MySQL 版
TDSQL MySQL 版(TDSQL for MySQL)是腾讯打造的一款分布式数据库产品,具备强一致高可用、全球部署架构、分布式水平扩展、高性能、企业级安全等特性,同时提供智能 DBA、自动化运营、监控告警等配套设施,为客户提供完整的分布式数据库解决方案。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档