首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

插入数据后HBase表大小不变

HBase是一种开源的分布式列式数据库,通常用于存储大规模数据。当插入数据后,HBase表大小不会立即改变,这是由于HBase的存储机制所导致的。

HBase采用了LSM(Log-Structured Merge)树的存储结构。在HBase中,数据以分块的形式进行存储,每个分块称为一个HFile。当新的数据被插入到HBase表中时,它首先被写入内存中的MemStore,然后定期(或根据设置的阈值)将MemStore中的数据刷新到磁盘上的一个或多个HFile。这个过程被称为写入操作的“flush”。

在进行flush操作时,HBase会将MemStore中的数据按照键排序后写入到新的HFile中,并将该HFile添加到已有的HFile集合中。由于插入数据后需要进行flush操作,所以HBase表的大小不会立即改变。

另外,HBase还有一个后台线程负责定期合并和清理HFile,将小的HFile合并成大的HFile,并删除不再需要的数据,以减小存储空间的占用。这个过程被称为“compaction”。

综上所述,插入数据后HBase表大小不变是因为新的数据首先被写入到内存中的MemStore,然后定期进行flush操作,生成新的HFile并添加到已有的HFile集合中。同时,HBase还通过后台线程定期进行compaction操作,对HFile进行合并和清理,以减小存储空间的占用。

推荐的腾讯云产品:TcaplusDB(链接:https://cloud.tencent.com/product/tcplusdb),它是腾讯云提供的一种NoSQL数据库产品,基于HBase技术,具有高性能、高可用、高扩展性等特点,适用于大数据场景下的数据存储和查询需求。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

  • Phoenix优化

    hbase-site.xml: <property> <name>hbase.master.maxclockskew</name> <value>45000000</value> </property> <property>    <name>hbase.rpc.timeout</name> <value>36000000</value>    </property> <property>    <name>hbase.client.scanner.timeout.period</name> <value>36000000</value>    </property> <property>    <name>mapreduce.task.timeout</name> <value>1200000</value>    </property> <property>    <name>zookeeper.session.timeout</name> <value>1200000</value>    </property> <property> <name>hbase.client.write.buffer</name> <value>20971520</value> </property> <property> <name>hbase.balancer.period</name> <value>300000</value> </property> <property> <name>hbase.regionserver.wal.codec</name> <value>org.apache.hadoop.hbase.regionserver.wal.IndexedWALEditCodec</value> </property> 组合主键: create table "test_keys2" ( "V_1" decimal(24,8), "V_2" varchar, "YEAR" INTEGER not null , "PERIOD" INTEGER not null ,"ACCOUNT" INTEGER not null , "ENTITY" INTEGER not null , "SCENARIO" INTEGER not null , "CURRENCY" INTEGER not null , "VERSION" INTEGER not null , "CST_DIM_02217" INTEGER not null, "CST_DIM_30453" INTEGER not null, "CST_DIM_47894" INTEGER not null , "CST_DIM_61310" INTEGER  not null , "CST_DIM_81981" INTEGER not null , "CST_DIM_01216" INTEGER not null, "CST_DIM_25287" INTEGER  not null, "CST_DIM_41183" INTEGER not null constraint pk primary key("YEAR" ,  "PERIOD" , "ACCOUNT" ,"ENTITY" , "SCENARIO" , "CURRENCY" , "VERSION","CST_DIM_02217" ,"CST_DIM_30453" ,"CST_DIM_47894" , "CST_DIM_61310","CST_DIM_81981" ,"CST_DIM_01216" , "CST_DIM_25287" ,"CST_DIM_41183")); upsert插入数据有问题 二级索引: 同步创建索引 CREATE INDEX ifact1 ON C1_FACT("diminfo".YEAR) INCLUDE("diminfo"."V_1","diminfo".V_2 ,  "diminfo".PERIOD ,  "diminfo".ACCOUNT , "diminfo".ENTITY , "diminfo".SCENARIO , "diminfo".CURRENCY , "diminfo".VERSION ,"diminfo"."CST_DIM_02217" , "diminfo"."CST_DIM_30453" , "diminfo"."CST_DIM_47894" , "diminfo"."CST_DIM_61310", "diminfo"."CST_DIM_81981" ,

    01
    领券