HBase的Bulk Load批量加载操作
一、Bulk Load 基本介绍
很多时候,我们需要将外部的数据导入到HBase集群中,例如:将一些历史的数据导入到HBase做备份。...我们之前已经学习了HBase的Java API,通过put方式可以将数据写入到HBase中,我们也学习过通过MapReduce编写代码将HDFS中的数据导入到HBase。...Bulk Load就是直接将数据写入到StoreFile(HFile)中,从而绕开与HBase的交互,HFile生成后,直接一次性建立与HBase的关联即可。..., 传统做法, 按照上述流程, 一步步将数据最终写入Hfile中, 此时整个region集群会经历大量的写入请求操作,HBase集群需要调度大量资源来满足本次的数据写入工作,如果这个时候, 又出现大量的读取数据请求也去访问这个表...存储到HBase中 , 数据量比较的庞大
数据所在位置: HDFS中,
数据格式为: CSV 分割符号为逗号
三、准备工作
1、在hbase中创建名称空间, 并创建hbase的表
# 创建名称空间