首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

HBaseregion管理

管理拆分 通常HBase 是自动处理region拆分的:一旦它们达到了既定的阈值,region将被拆分成两个,之后它们可以接收新的数据并继续增长。这个默认行为能够满足大多数用例的需求。...用户可以从HBase Shell 或者使用HBaseAdmin 类中的API,并通过move()函数显式地把region从一个region服务器移动到另一个region服务器。...如果用户将region 预拆分的太小,可以通过增加hbase.hregion.majorcompaction 的值来加大major合并的间隔。...在默认的情况下,均衡器每五分钟运行一次,这是通过hbase.balancer.period属性设置的。一旦均衡器启动,它将会尝试均匀分配region 到所有region 服务器。...例如,用户删除大量数据并且想减少每个服务器 管理的region 数目。 HBase 集成了一个工具能够让用户在集群没有工作时合并两个相邻的region

1.8K70
您找到你想要的搜索结果了吗?
是的
没有找到

浅谈HBase region的单点问题

因为region只在一台RS上assign,那这台RS直接决定了这个region的服务质量,RS发生的任何问题或多或少都会对region产生影响。...导致抖动的原因包括: 非人为因素(不可预期的) GC问题:GC一直是java应用的老大难问题,尤其是对HBase这种高吞吐的后台系统,更是需要优化到极致 网络问题:TCP重传,丢包,closewait过多...考虑到HBase的设计目标是少量的大表,一个大表通常有很多的region(少则数百,多则几十万),单个region的吞吐被影响对于整体而言,通常不会导致明显的流量波动。...虽然HBase能够在宕机时能够自动恢复,但宕机带来的影响是确实存在的,对于业务来说,往往几分钟的不可用时间就足以带来困扰(比如网络游戏,服务器卡一下你都不能忍,更不要说卡几分钟了)。...但双集群部署会增加额外的成本,所以,HBase 1.x系列提供了单集群的冗余策略,region replica方案,即一个region同时在多个RS上打开,有主备,一写多读。

1.2K30

HBase填坑记2:Region无故损坏

HBaseRegion损坏后果很严重,会导致整个HBase异常,数据不能用。修复Region需要花费时间,当出现大面积的Region损坏的时候,后果几乎是致命的。...这里会详细讲解我们在开发过程中发现的Region损坏情况和解决思路。...问题描述:我们在做大量数据写入的时候,突然发生Region Server重启,重启后,出现大量的Region损坏,下面是检查发现的问题。 ?...通过分析,首先确认导致Region Server重启的原因,应该就是Full GC导致的,当时正在做大量的写入,QPS非常高,整体内存使用率也很高,这本身就容易导致RS重启。...另外,我们发现我们每台Region Server的Region个数非常大,超过1000个。

71910

HBase官方文档 之 Region的相关知识

HBase是以Region为最小的存储和负载单元(这里可不是HDFS的存储单元),因此Region的负载管理,关系到了数据读写的性能。...先抛开Region如何切分不说,看看Region是如何分配到各个RegionServer的吧。 更多内容参考——我的大数据学习之路 RegionHBase中的角色 ?...server 请求进行重试;超时会请求其他的节点 Region的状态机 Hbase中每个Region自己维护其在hbase:meta表中的信息。...Region的切分 HBase会配置一个切分的阈值,当到达阈值后,就会执行region的切分。Master不会参与Region的切分,切分由Region Server独立完成。...下面是Hbase shell中合并的例子: $ hbase> merge_region 'ENCODED_REGIONNAME', 'ENCODED_REGIONNAME' $ hbase> merge_region

73300

hbase的预region分区 脚本 经典 转

RegionHBase中分布式存储和负载均衡的最小单元。不同Region分布到不同RegionServer上,但并不是存储的最小单元。...HBase通过将region切分在许多机器上实现分布式。也就是说,你如果有16GB的数据,只分了2个region, 你却有20台机器,有18台就浪费了。...二、hbase预分区示例 步骤: 1.规划hbase预分区 首先就是要想明白数据的key是如何分布的,然后规划一下要分成多少region,每个region的startkey和endkey是多少,然后将规划的...三、hbase预分区方案   在HBase中,表会被划分为1...n个Region,被托管在RegionServer中。...如果知道Hbase数据表的key的分布情况,就可以在建表的时候对hbase进行region的预分区。这样做的好处是防止大数据量插入的热点问题,提高数据插入的效率。

1.9K20

Hbase Region Split compaction 过程分析以及调优

region的hfile达到一定大小的时候hbase会对该region进行split以达到自动分散热点的目的,下面将会就hbase的compact和split进行源码分析以便如何了解设置该部分的功能参数来满足业务需要...当 region 数达到 2 个时,2 2 128M = 512M。 当 region 数达到 3 个时,3 3 128M = 1152M。...,参数为:hbase.regionserver.region.split.policy,默认为IncreasingToUpperBoundRegionSplitPolicy。...Split Hbase 的 split 主要实现在类 SplitTransactionImpl,中默认的分裂点是当前 region 的中间 key 一分为而,当一个 splitrequest 加入到...,执行 split 的线程数,默认为 1, hbase.regionserver.regionSplitLimit 当前 regionserver 的 region 个数最大值,如果当前 regionserver

4.7K11

HBase最佳实践 | 合理的Region数量与大小

Region数量 通常较少的region数量可使群集运行的更加平稳,官方指出每个RegionServer大约100个regions的时候效果最好,理由如下: HBase的一个特性MSLAB,它有助于防止堆内存的碎片化...从HBase读入数据进行处理的mapreduce程序,过多Region会产生太多Map任务数量,默认情况下由涉及的region数量决定。...计算集群region数量的公式: ((RS Xmx) * hbase.regionserver.global.memstore.size) / (hbase.hregion.memstore.flush.size...监控Region Server中所有Memstore的大小总和是否达到了上限(hbase.regionserver.global.memstore.size * hbase_heapsize,默认 40%...注意:通过HBase的UI控制台都可以监控到region的数量&大小指标!!! wxlogo2.png

4.8K10

HBASE 技术细节 读取与写入 Region Split与合并介绍

HbaseRegion介绍 Hbase Rowkey CF 架构 概述 预分区及Rowkey设计 学习笔记介绍了Region类似于数据库的分片和分区的概念,每个Region负责一小部分Rowkey范围的数据的读写和维护...这部分主要介绍Region实例以及Region的寻找路径: 1.1 region实例 [img] 上图模拟了一个Hbase的表是如何拆分成region,以及分配到不同的RegionServer中去。...Region的拆分 5.1 Hbase Region的三种拆分策略 Hbase Region的拆分策略有比较多,比如除了3种默认过的策略,还有DelimitedKeyPrefixRegionSplitPolicy...7.2.3 预分区 在HBase中数据是分布在各个Region中的,每个Region都负责一个起始RowKey和结束Rowkey的范围,在向HBase中写数据的时候,会根据RowKey请求到对应的Region...7.2.13 Split优化 hbase.hregion.max.filesize表示HBaseRegion的文件总大小的最大值。当Region中的文件大于该参数时,将会导致Region分裂。

1.8K41

HBase Region自动切分的所有细节都在这里了

Region主动切分是HBase可以或许拥有优胜扩大性的最重要身分之一,也必定是所有分布式体系寻求无穷扩大性的一副良药。...HBase体系中Region主动切分是若何实现的,这琅绫擎涉及很多常识点,比如Region切分的触发前提是什么、Region切分的切分点在哪里、若何切分才能最大年夜的包管Region的可用性、若何做好切分过程中的异常处理...、切分过程中要不要将数据移动等,这篇文┞仿将会对这些细节进行根本的解释,一方面可以让大年夜家对HBaseRegion主动切分有加倍深刻的懂得,另一方面如不雅想实现类似的功能也可以参考HBase的实现筹划...父region决裂为两个子region后,将daughter A、daughter B拷贝到HBase根目次下,形成两个新的region。...7. parent region通知修改 hbase.meta 表后下线,不再供给办事。

99400
领券