当我使用shell命令将数据批量加载到hbase时,如下所示。
hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.columns=HBASE_ROW_KEY,cf1:val1,cf1:val2,cf1:val3 so_table /tmp/example/我创建了一个文件并加载到hdfs中,比如/tmp/example/。每一行的每个成分都用空格分隔。我认为这个分隔符-空格-结果所有行看起来都像是坏行。有没有办法使用带空格的分隔符?
发布于 2015-10-07 02:05:38
ImportTsv有两种用法。一个是普通的put,另一个是批量加载。上面给出的命令是用于常规Put的。但在问题中,您将其指定为批量加载。请选择正确的选项。
因此,一旦决定了用法,接下来就是分隔符部分了。'-Dimporttsv.separator=" "'是如何使用分隔符的。默认值为制表符分隔。查看here以了解ImportTsv的正确用法
https://stackoverflow.com/questions/32975255
复制相似问题