前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >技术干货 | Hbase的数据坐标

技术干货 | Hbase的数据坐标

作者头像
加米谷大数据
发布2018-04-02 15:20:03
1.1K0
发布2018-04-02 15:20:03
举报
文章被收录于专栏:加米谷大数据

Hbase在表里存储数据使用的是四维坐标系统。分别是:行健、列族、列限定符和时间版本。

如:

代码语言:javascript
复制
列族A

行健  列限定符(name) 列限定符(email)           列限定符C(password)
aaa  单元(value1) 单元(value4)   单元(value7)
bbb  单元(value2) 单元(value5)   单元(value8)
ccc  单元(value3) 单元(value6)   时间版本1:单元(value9),时间版本2:单元(value10)

行健按照字典排序,一行具有一个行健,唯一且一行具有多个列族,每个列族下有一个或多个列限定符,每个列限定符下有多个单元,每个单元默认具有3个时间版本的值。

单元的新建、修改和删除都会留下新时间版本,当没有设定时间版本时,HBase以毫秒为单位使用当前时间,所以版本数字用长整型long表示。单元里数据的每个版本提交一个KeyValue实例给Result。

可用方法getTimestamp()来获取KeyValue实例的版本信息。如果一个单元的版本超过了最大数量,多出的记录在下一次大合并时会扔掉。

除了删除整个整个单元,你也可以删除一个或介个特定的版本。deleteColumns() (带s)处理小于指定时间版本的所有KeyValue,不指定则为当前时间now,则相当于删除了该单元,而方法

deleteColumn()只删除一个时间版本。

把所有坐标视为一个整体,Hbase可看做一个键值数据库,可把单元数据看做值。当使用Hbase API检索数据时,不需提供全部坐标,如果在GET命令中省略了时间版本,将返回多个时间版本的映射集合。

可以在一次操作中,获取多个数据,按坐标的降序列。

如果是全维度坐标,将得到指定单元值。去掉时间版本后,得到一个从时间戳列值的映射。再继续去掉列限定符,得到一个指定列族下的所有列限定符的映射。最后去掉列族,将得到一行的映射。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-01-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 加米谷大数据 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档