首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

一脸懵逼学习HBase的搭建(注意HBase的版本)

3:hbase集群中的角色:   (1)、一个或者多个主节点,Hmaster;   (2)、多个从节点,HregionServer; 1:由于HBase依赖hdfs,所以下载的时候注意HBase的版本...3:配置HBase集群,要修改3个文件(首先Zookeeper集群已经安装好了哟):   注意:要把hadoop的hdfs-site.xml和core-site.xml 放到HBase/conf下; [...5:现在可以启动HBase了,不过启动HBase之前需要将HDFS启动起来(hdfs启动过程省略,之前启动好多次了),因为HBase在hdfs下面创建一个目录叫做hbase,自己配置的:   注:如果浏览器访问不了...现在呢,一个HBase已经启动起来了,如果想启动两个HBase,第一个HBase启动不会自动启动第二个HBase,所以现在手动启动第二个HBase,操作如下所示:   注:为保证集群的可靠性,要启动多个...8:使用HBase的命令行客户端操作一下HBase(测试使用,真实环境使用Java操作): 1 进入hbase的shell:hbase shell 2 退出hbase的shell:quit 3 页面

1K60

设计HBase RowKey需要注意的二三事

除了根据业务和查询需求来设计之外,还需要注意以下三点。 1. 打散RowKey HBase中的行是按照RowKey字典序排序的。...控制RowKey长度 在HBase中,RowKey、列族、列名等都是以byte[]形式传输的。 RowKey的最大长度限制为64KB,但在实际应用中最多不会超过100B。...设计短RowKey有以下两方面考虑: 在HBase的底层存储HFile中,RowKey是KeyValue结构中的一个域。...HBase中设计有MemStore和BlockCache,分别对应列族/Store级别的写入缓存,和RegionServer级别的读取缓存。...HBase官方不推荐使用3个以上列族,因此实际上列族命名几乎都用一个字母,比如‘c’或‘f’。 3. 保证RowKey唯一性 这个就是显而易见的了,不再赘述。

1.3K51
您找到你想要的搜索结果了吗?
是的
没有找到

关于Hbase多版本存储的一个注意

我们知道hbase是一个多版本的管理系统,在0.96的版本之前默认每个列是3个version,在hbase 0.96之后每个列是1个version,所谓的version其实就是同一条数据插入不同的时间戳来实现的...注意,在上面的api中Put和Delete的第二个方法都是带时间戳的,大家不要误解,这个时间戳不是rowkey的,它这个时间戳是给下面的column用的,也就是说如果插入一行数据,这行数据中有多个列簇,...总结: hbase的多版本存储特性是一个强大的功能,在使用的时候应该注意尽量不要修改默认取当前时间戳的逻辑,如果修改了那么在其他添加,删除,更新的时候都应该考虑当前的时间戳是否大于第一次插入时的时间戳,...如果不是,那么本次修改就不会生效,所以某一天当你删除一行hbase数据时,发现它并没有被删除掉,不要惊讶,在代码没有问题的情况下,最大的可能就是当前时间戳小于库里数据的时间戳,这一点需要特别注意,最后再重复一遍...,尽量不要在向hbase插入数据的时候设置自定义的时间戳,除非业务场景需要。

2.3K160

HBaseHBase之what

来加速Hbase的访问,比如cache的.META.元数据的信息。...流程 老的Region寻址方式 在Hbase 0.96版本以前,Hbase有两个特殊的表,分别是-ROOT-表和.META.表,其中-ROOT-的位置存储在ZooKeeper中,-ROOT-本身存储了...(3)Hlog数量上限 前面说到Hlog为了保证Hbase数据的一致性,那么如果Hlog太多的话,会导致故障恢复的时间太长,因此Hbase会对Hlog的最大个数做限制。...注意10G是压缩后的大小,如果使用了压缩的话。 如果1个表一直不拆分,访问量小也不会有问题,但是如果这个表访问量比较大的话,就比较容易出现性能问题。这个时候只能手工进行拆分。还是很不方便。...通过hbase.hregion.majorcompaction参数的值加上或减去hbase.hregion.majorcompaction参数的值乘于一个随机分数的值就确定下一次大合并的时间区间。

3.3K40

HBaseHBase之how

HBase Shell 常用命令: 注意HBase在linux命令行下操作时,区分大小写 HBase API HBase 提供Java方式的原生接口,其中需要注意的有: (1)创建Connection...HBase Rest Gateway HBase附带的REST服务器,该服务器将HBase表,行,单元和元数据作为URL指定的资源公开。...HBase到Hive 将HBase的数据作为数据源,建立Hive外部表关联到HBase,利用Hive的HQL查询HBase数据,更进一步,将Hive的元数据同步到Impala,利用Impala的SQL...这是HBase二级索引出现的背景。即二级索引是为了让HBase能够提供更多维度的查询能力。...注意HBase原生并不支持二级索引方案,但基于HBase的KeyValue数据模型与API,可以轻易地构建出二级索引数据。

3.2K20

Hbase(四):Hbase原理

Hbase(四):Hbase原理 Hbase的工作方式 region的分裂和结构 hbase表中的数据按照行键的字典顺序排序 hbase表中的数据按照行的的方向切分为多个region 最开始只有一个...写入数据到hdfs的过程其实是不断追加hfile的过程 Hbase写入数据 数据写入hbase时 先在hlog中记录日志 再修改memstore 直接返回成功 这样 不需要真正等待写入hdfs的过程 所以很快...如果没有在内存中找到数据,就去查找region对应的hfile,注意不是将所有hfile中的数据恢复到内存,而是查找每个hfile的Trailer,通过trailer找到Data Block Index...由于hbase中的数据天然排序 再加上索引 整个查询也可以非常的快 Hbase中的region的寻址 在hbase中有一个hbase:meta表,其中存放了 表和region和regionSever 之间的对应关系信息...​ 支持增、删、读、改、顺序扫描操作 ​ 牺牲了一部分读的性能换取了高效写入能力 Hbase系统架构 hbase中的老大叫hmaster 小弟叫hregionServer 客户端叫Client

3.9K10

Hbase入门(一)——初识Hbase

本文将介绍大数据的知识和Hbase的基本概念,作为大数据体系中重要的一员,Hbase弥补了Hadoop只能离线批处理的不足,支持存储小文件,随机检索。...而这种特性使得Hbase对于实时计算体系的事件存储有天然的较好的支持。这使得Hbase在实时流式计算中也扮演者重要的角色。 ?...Hbase使用Java编写,还是一种NoSQL数据库,这些特性决定了Hbase独特的应用场景。...的表模型与关系型数据库的表模型不同: ​ Hbase的表没有固定的字段定义; ​ Hbase的表中每行存储的都是一些key-value对; ​ Hbase的表中有列族的划分,用户可以指定将哪些kv...通过将数据增量的存入Hbase,并在流式处理中实时查询Hbase,结合历史得到最终的分析结果。

3.1K30

Hbase(二)Hbase常用操作

Hbase(二):Hbase常用操作 常用shell命令 hbase shell命令 描述 alter 修改列族(column family)模式 count 统计表中行的数量 create 创建表 describe...行,列对应的值,另外也可以指定时间戳的值) deleteall 删除指定行的所有元素值 disable 使表无效 drop 删除表 enable 使表有效 exists 测试表是否存在 exit 退出hbase...shell get 获取行或单元(cell)的值 incr 增加指定表,行或列的值 list 列出hbase中存在的所有表 put 向指向的表单元添加值 tools 列出hbase所支持的工具 scan...通过对表的扫描来获取对用的值 status 返回hbase集群的状态信息 shutdown 关闭hbase集群(与exit不同) truncate 重新创建指定表 version 返回hbase版本信息

3.1K10

使用 HBase - HBase Shell 命令

下面的操作以《初识 HBase - HBase 基础知识》3.2 节中的数据为基础进行。 图1:HBase Shell 操作基础数据 注意:数据会根据需要进行调整。...> [ts1, ts2]} get 'datamanroad:Performance', '0001', {TIMERANGE => [1639274251787,1639280895182]} 注意...指定列族、列标识、时间戳范围、数据版本等参数方式与 get 命令相似,但需要注意的是,scan 命令指定条件参数时,必须用大括号将参数包含起来,不能像 get 命令一样直接指定列族、列标识参数值。...删除命名空间 删除命名空间不需要跟删除表一样先进行禁用操作,但要注意的是,删除的命名空间必须是空的,其下没有表,否则会删除失败。...使用值过滤器需要注意返回单元格数据与返回逻辑行数据的区别。 3.4 其他滤器 3.4.1.

10.5K31

HBase漫谈 | HBase技术选型准则

HBase 的主要特性 HBase包含很多特性,这里列举了HBase的一些关键特性: 强一致性读写:HBase并不是最终一致性,而是强一致性的系统,这使得HBase非常适合做高速的聚合操作。...什么时候使用 HBase HBase作为一款NoSQL数据库,前面也提及了并不能解决所有问题。...3、能够容忍NoSQL短板 前面提及了NoSQL并不能解决所有问题,HBase也是一样,如果业务场景是需要事务支持、表与表的关联查询等,不建议使用HBase。...4、数据分析需求并不多 虽然说HBase是一个面向列的数据库,但它有别于真正的列式存储系统比如Parquet、Kudu等,再加上自身存储架构的设计,使得HBase并不擅长做数据分析,或者说数据分析是HBase...HBase 的使用场景 由于HBase丰富的特性,加上自身的海量数据存储能力与超大规模并发访问能力,使得HBase应用非常广泛。

3.2K10

HBase

16 HBase集群安装注意事项?   ...③ 注意HBase与Hadoop的版本兼容性;   ④ 注意hbase-env.sh配置文件和hbase-site.xml配置文件的正确配置;   ⑤ 注意regionservers配置文件的修改;...  ⑥ 注意集群中的各个节点的时间必须同步,否则启动HBase集群将会报错; 17 如何解决HBase中region太小和region太大带来的冲突?   ...查询数据时,HBase 会首先使用二级索引表定位符合条件的行键,然后使用行键查找原始表中的数据。 值得注意的是,HBase 的二级索引需要额外的存储空间,并且在写入和更新数据时需要维护索引表。...例如,可以将常用的数据放在一个单独的列族中,提高查询性能;同时,也需要注意避免表结构复杂和列族数量过多,影响查询性能。

27530

Hbase-2.0.0_04_Hbase原理 1.1. Hbase特性:

参考博客:Hadoop HBase概念学习系列 参考博客:Hadoop HBase概念学习系列之HBase里的Zookeeper(二十一) 参考博客:Hadoop HBase概念学习系列之HBase里的客户端和...HBase集群建立连接(详细)(十四) 参考博客:Hadoop HBase概念学习系列之META表和ROOT表(六) 参考博客:Hadoop HBase概念学习系列之HBase里的HRegion(五)...参考博客:Hadoop HBase概念学习系列之HLog(二) 参考博客:Hadoop HBase概念学习系列之HRegion服务器(三) 参考博客:Hadoop HBase概念学习系列之HMaster...服务器(四) 参考博客:ZooKeeper 原理及其在 Hadoop 和 HBase 中的应用 参考博客:HBase介绍和工作原理 参考博客:深入了解HBASE架构(转) 1....MapReduce: HBase支持通过MapReduce进行大规模并行处理,将HBase用作source和sink。 Java客户端API: HBase支持易于使用的Java API进行编程访问。

2.1K30

扫码

添加站长 进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

    运营活动

    活动名称
    广告关闭
    领券