技术干货 | Hbase的数据坐标

Hbase在表里存储数据使用的是四维坐标系统。分别是:行健、列族、列限定符和时间版本。

如:

列族A

行健  列限定符(name) 列限定符(email)           列限定符C(password)
aaa  单元(value1) 单元(value4)   单元(value7)
bbb  单元(value2) 单元(value5)   单元(value8)
ccc  单元(value3) 单元(value6)   时间版本1:单元(value9),时间版本2:单元(value10)

行健按照字典排序,一行具有一个行健,唯一且一行具有多个列族,每个列族下有一个或多个列限定符,每个列限定符下有多个单元,每个单元默认具有3个时间版本的值。

单元的新建、修改和删除都会留下新时间版本,当没有设定时间版本时,HBase以毫秒为单位使用当前时间,所以版本数字用长整型long表示。单元里数据的每个版本提交一个KeyValue实例给Result。

可用方法getTimestamp()来获取KeyValue实例的版本信息。如果一个单元的版本超过了最大数量,多出的记录在下一次大合并时会扔掉。

除了删除整个整个单元,你也可以删除一个或介个特定的版本。deleteColumns() (带s)处理小于指定时间版本的所有KeyValue,不指定则为当前时间now,则相当于删除了该单元,而方法

deleteColumn()只删除一个时间版本。

把所有坐标视为一个整体,Hbase可看做一个键值数据库,可把单元数据看做值。当使用Hbase API检索数据时,不需提供全部坐标,如果在GET命令中省略了时间版本,将返回多个时间版本的映射集合。

可以在一次操作中,获取多个数据,按坐标的降序列。

如果是全维度坐标,将得到指定单元值。去掉时间版本后,得到一个从时间戳列值的映射。再继续去掉列限定符,得到一个指定列族下的所有列限定符的映射。最后去掉列族,将得到一行的映射。

原文发布于微信公众号 - 加米谷大数据(DtinoneBD)

原文发表时间:2018-01-02

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Django中文社区

创建 Django 博客的数据库模型

设计博客的数据库表结构 博客最主要的功能就是展示我们写的文章,它需要从某个地方获取博客文章数据才能把文章展示出来,通常来说这个地方就是数据库。我们把写好的文章永...

3086
来自专栏ytkah

如何让dedecms文章点击量增加一定的数值

  用dedecms建站都知道有一个文章点击量这个参数,我们可不可以用这个浏览量做些延伸扩展呢?比如加上一个固定值变成另外一个指标。很多朋友已经想到了,如下图,...

8036
来自专栏网络

HTML 正文内容提取库 Boilerpipe

Boilerpipe 是一个能从 HTML 中剔除广告和其他附加信息,提取出目标信息(如正文内容、发布时间)的 Java 库。 授权协议:Apache 开发语言...

3366
来自专栏机器学习从入门到成神

2015百度校招笔试真题以及解析(一)

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/sinat_35512245/articl...

1781
来自专栏人工智能LeadAI

在TensorFlow中使用pipeline加载数据

前面对TensorFlow的多线程做了测试,接下来就利用多线程和Queue pipeline地加载数据。数据流如下图所示: ? 首先,A、B、C三个文件通过Ra...

4433
来自专栏AI科技大本营的专栏

十图详解TensorFlow数据读取机制(附代码)

作者 | 何之源 在学习TensorFlow的过程中,有很多小伙伴反映读取数据这一块很难理解。确实这一块官方的教程比较简略,网上也找不到什么合适的学习材料。今天...

39011
来自专栏我的技术专栏

ImportError: No module named 'BaseHTTPServer':解决方案

2473
来自专栏程序小工

PHP实现无限级分类 -- Path标识

在实际项目中经常要用到无限级分类,如多级分类、导航表等。PHP 实现无限级分类通常有两种实现方式,一种是利用path字段(pid+id)标识当前层级;另一种是利...

3952
来自专栏CSDN技术头条

面向机器智能的TensorFlow实践:产品环境中模型的部署

在了解如何利用TesnsorFlow构建和训练各种模型——从基本的机器学习模型到复杂的深度学习网络后,我们就要考虑如何将训练好的模型投入于产品,以使其能够为其他...

4696
来自专栏python3

tkinter -- Label之bitmap使用方法

1042

扫码关注云+社区

领取腾讯云代金券