一个列族触发flush时,其它列族也会进行flush,导致io压力增加
会形成更多小文件,增加hdfs压力
查询CF时,会出现跨多个region,查询效率变低
多个CF会有多个Memstore,内存占用增大....
07
—
Bloomfilter的合理设置
Bloomfilter过滤器的思想为:当一个元素被加入集合时,通过K个散列函数将这个元素映射成一个位数组中的K个点,把它们置为1。...它会告诉你在这个HFile文件中是否可能存在待检索的KV,如果不存在,就可以不用消耗IO打开文件进行seek。...散列原则,将数据分散到不同region中....hbase中的大忌
这里汇总了常见的几种负载均衡的调优方式:
1、观察,出现问题首先要先观察服务的监控和日志信息,观察每个regionserver的qps,看看是否有读写不均衡的现象.
2、rowkey散列化处理