前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Hbase 整理

Hbase 整理

作者头像
小石头
发布2022-11-10 21:27:59
2980
发布2022-11-10 21:27:59
举报
文章被收录于专栏:小石头

Hbase简介

  • HBase是一个开源的非关系型分布式数据库( NoSQL),它参考了谷歌的BigTable建模,实现的编程语言为 Java
  • HBase是一个分布式存储系统,具有高可靠性、高性能、面向列、可伸缩(增加或减少硬件的数量)的特点。

高可靠:1.底层文件存储采用的是HDFS,具有副本机制。

高性能:1.分布式系统,通过并行度提高性能

2.通过表的切分,实现与store的存储

3. HBase利用Hadoop HDFS作为其文件存储系统

  • HBase适合具有如下需求的应用:
    • 海量数据( TBPB
    • 高吞吐量
    • 需要在海量数据中实现高效的随机读取
    • 需要很好的性能伸缩能力
    • 能够同时处理结构化和非结构化的数据
    • 不需要完全拥有传统关系型数据库所具备的ACID特性
计算机生成了可选文字:
部署架构一架构
乪0塹D
S篡津@F閣
F的
囗
囗
,叶的
囗
囗
工囗
囗
囗囗
计算机生成了可选文字: 部署架构一架构 乪0塹D S篡津@F閣 F的 囗 囗 ,叶的 囗 囗 工囗 囗 囗囗

Hbase 逻辑模型

  1. 基本结构
    • 表(table) 字符串
    • 行(row) 行由行健(rowkey)唯一标识
    • 列族(column failmy)行的数据按列族分组cf,创建表的时候定义,不轻易修改
    • 列限定符(column qualifier)列里面的数据定位通过列限定符
    • 单元(cell)行健,列族和列限定符一起确定一个单元,value
    • 时间版本(vesion)单元值有时间版本,用时间戳来标识默认1个。
  2. 主键(Row Key)
    • 用来检索记录的主键。
    • 主键为任意字符串,最大长度为64kb,按字典顺序存储,在HBase内部保存为字节数组
    • 访问HBase 表中的行,只有三种方式

– 通过单个Row Key访问  

– 通过Row Key的range 

– 全表扫描

  1. 列族(Column Family)
  • 列族在创建表的时候声明,一个列族可以包含多个列,列中的数据都是以二进制形式存在,没有数据类型。
  • 列族是一些列的集合。
  • 一个列族所有列成员是有着相同的前缀。比如,列courses:history 和 courses:math都是 列族 courses的成员.冒号(:)是列族的分隔符,用来区分前缀和列名
  1. 时间戳与存储单元(Timestamp and Cell)
  • HBase中通过row和columns确定的为一个存贮单元称为cell。每个 cell都保存着同一份数据的多个版本。
  • 在写入数据时,时间戳可以由HBase自动赋值(当前系统时间精确到毫秒),也可以显示赋值。
  • 每个cell中,不同版本的数据按照时间的倒序排序。

    {row, column, version}元组就是一个HBase中的一个 cell。

计算机生成了可选文字:
行
键
时间戳
t8
列族contents
contents:html—"<html>..
contents:html="<html>..
contents:html="<html>..
列族anchor
anchor:cnnsi.com/'CNN"
anchor:my.look.ca=
"CNN.com/
列族nume
com.cnn.www"
t6
巧
t3
计算机生成了可选文字: 行 键 时间戳 t8 列族contents contents:html—"<html>.. contents:html="<html>.. contents:html="<html>.. 列族anchor anchor:cnnsi.com/'CNN" anchor:my.look.ca= "CNN.com/ 列族nume com.cnn.www" t6 巧 t3
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2020-11-27 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Hbase简介
  • Hbase 逻辑模型
相关产品与服务
TDSQL MySQL 版
TDSQL MySQL 版(TDSQL for MySQL)是腾讯打造的一款分布式数据库产品,具备强一致高可用、全球部署架构、分布式水平扩展、高性能、企业级安全等特性,同时提供智能 DBA、自动化运营、监控告警等配套设施,为客户提供完整的分布式数据库解决方案。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档