hbase 中文文档_hbase中文文档_hbase官方中文文档 - 腾讯云开发者社区

、、

我最近从汇合4.0.1升级到了5.0.1汇合。服务器的版本是Kafka 1.0。在我的HBaseSink连接器中，我将新特性“errors.deadletterqueue.topic.name”配置为： {“名称”：“kafka-hbase4 4”，"config"：{ "connector.class"："com.xxxx.hbase.sink.HBaseSinkConnector"，."zookeeper.quorum"："xxxx:2181"，“主题”："oplog_demo.hbase_test1

浏览 1提问于2018-11-26得票数 1

1回答

如何通过nutch查看存储在hbase中的hbase数据

、、、

我使用apache在hbase中存储数据，hbase使用hdfs作为其文件系统。我想知道它存储在hbase中的哪些文档。如何读取hbase中的数据，例如，一些pdf存储在hbase中。我想读一读。我会怎么做。请指引我？

浏览 2提问于2014-09-22得票数 0

回答已采纳

1回答

& Solr :未找到数据

、、

我目前正在使用hbase在solr中索引hbase。当我执行愚弄命令检查索引器时， hbase-indexer$ bin/hbase-indexer list-indexers --zookeeper 127.0.0.1:2181 其结果是： myindexer + Lifecycle state: ACTIVE + Incremental indexing state: SUBSCRIBE_AND_CONSUME + Batch indexing state: INACTIVE + SEP subscription ID: Indexer_myindexer + SEP subscript

浏览 4提问于2017-01-24得票数 2

回答已采纳

1回答

使用HBase运行Hadoop的配置

、、、、

我正在尝试使用scala代码探索scala API，所以我想按照中的引用设置一个简单的独立HBase项目(使用SBT)。这是我的build.sbt name := "hbase-sandbox" version := "1.0" scalaVersion := "2.10.4" resolvers += "Apache HBase" at "https://repository.apache.org/content/repositories/releases" resolvers += "Thrift

浏览 0提问于2016-05-26得票数 0

1回答

如何避免solr中的重复文档？

、、、

我正在尝试使用MapReduceindexer工具来索引hbase数据。我正在使用下面的命令成功地索引 hadoop jar /usr/lib/hbase-solr/tools/hbase-indexer-mr-1.5-cdh5.3.0-job.jar --hbase-indexer-zk localhost --hbase-table-name indexdemo-user --hbase-indexer-name mynewindexer --hbase-indexer-file /home/cloudera/indexdemo-indexer.xml --collection c

浏览 0提问于2015-07-13得票数 2

1回答

使用火花流分隔行中的键和值

、

我有一个文件流，每个文件包含由key:value组成的行--例如，文件如下： key1:value1 key2:value2 key3:value3 因此，我使用Spark来检测HDFS中文件的到达，我需要做的是将这些行的每个值放到HBase中( HBase的列由键组成)，如果行的类型是"String“，将键和值分隔开来很容易，但是如果我应用了DStream.flatmap(_.split(":"))，我就会得到单词，而我无法做到： val separated = String.split(":") val key = separated(0) val

浏览 0提问于2016-04-05得票数 0

回答已采纳

1回答

在SpotFire中显示来自HBase的图像

、、

我已经转换了我的图像并以字节的形式存储在HBase上。现在我想要SpotFire从hbase读取图像(作为字节)并显示它。我知道我可以使用Phoenix连接器从SpotFire连接到HBase，但如何在SpotFire中渲染图像(在HBase中存储为字节)？

浏览 1提问于2017-05-08得票数 2

1回答

HORTONWORKS -Hbase/菲尼克斯- WALEditCodec -失踪

、、、、

在Hbase之上运行菲尼克斯时，我收到以下错误：异常#1: 2017-11-07 12:40:12,620 WARN [RS_LOG_REPLAY_OPS-XXX:16020-0] regionserver.SplitLogWorker: log splitting of WALs/XXX.XXX.XXX.XXX,16020,1507179047656- splitting/XXX.XXX.XXX.XXX%2C16020%2C1507179047656.default.1507179049782 failed, returning error java.io.IOException:

浏览 5提问于2017-11-07得票数 0

2回答

以HBase为数据源计算文档的TF-IDF

、、、

我想要计算存储在HBase中的文档的TF (词频)和IDF (逆文档频率)。我还想将计算的TF保存在一个HBase表中，也将计算的IDF保存在另一个HBase表中。你能引导我通过吗？我已经看过Mahout 0.4上的BayesTfIdfDriver了，但我并没有领先一步。

浏览 3提问于2012-06-09得票数 1

1回答

使用齐柏林飞艇上的Spark读取HBase表

、、、

我有一段代码可以读取HBase表，使其格式化良好，然后将其转换为DataFrame： import org.apache.spark._ import org.apache.spark.rdd.NewHadoopRDD import org.apache.hadoop.hbase.{HBaseConfiguration, HTableDescriptor} import org.apache.hadoop.hbase.client.HBaseAdmin import org.apache.hadoop.hbase.mapreduce.TableInputFormat import org.ap

浏览 0提问于2016-09-30得票数 1

1回答

hbase无法连接到zookeeper？

、、

我使用start-hbase.sh运行hbase，但日志文件输出异常如下： 2015-09-12 18:39:37,935 WARN [RS:0;roger-ubuntu:54809-SendThread(localhost:2181)] zookeeper.ClientCnxn: Session 0x14fc12354a40004 for server null, unexpected error, closing socket connection and attempting reconnect java.net.ConnectException: 拒绝连接 at sun.ni

浏览 14提问于2015-09-12得票数 1

3回答

无法让HBase连接到Hadoop

、

编辑:我能够让它正常工作。我创建了一个教程来展示如何操作：当我设置hbase-site.xml属性时，我可以让HBase正常工作： <name>hbase.rootdir</name> <value>file:///app/hbase/hbase/</value> 这工作得很好，它按照预期将数据存储在目录中，但是我希望它现在连接到我正在运行的hadoop实例，而不是使用本地文件。我将其设置为 <value>hdfs://localhost:9000/</value> 而不是本地文件，它将无法工作。我需要在hadoop端做

浏览 0提问于2012-06-29得票数 4

2回答

Hadoop-火花-HBase错误: org.apache.hadoop.hbase.DoNotRetryIOException

、、、、

试图运行作业以通过spark从HBase表中提取数据时出错。任何帮助都是非常感谢的。错误： org.apache.hadoop.hbase.DoNotRetryIOException: java.lang.IllegalAccessError:尝试从类org.apache.hadoop.hbase.zookeeper.MetaTableLocator访问方法com.google.common.base.Stopwatch.()V Hadoop Version: 3.1.1 HBase Version: 2.1.6 SPARK Version: 2.3.2 spark-submit -

浏览 5提问于2021-02-07得票数 0

1回答

winutils和HBase之间的关系是什么？

、

HBase Java client API连接Hbase，我知道如何解决这个问题： java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries. at org.apache.hadoop.util.Shell.getQualifiedBinPath(Shell.java:382) ~[hadoop-common-2.7.7.jar:?] 但是我想知道，为什么HBase关心依赖于系统的二进制代码，为什么不用HBase代码直接连接，以及为什么没有官方文档提到这一点

浏览 0提问于2019-08-13得票数 0

1回答

读取hbase表时挂起Mapreduce作业

、、、、

我有这样一个4节点hadoop分布式集群(包括hbase)。 node1- namenode + hbase主+动物园管理员 node2-资源分析器 node3- datanode1+hbase regionserver1+nodemanager node4- datenode2+hbase regionserver2+nodemanager 集群的设置似乎还不错，因为所有的WEB (hbase、namenode、资源管理器)都即将出现。现在，当我试图提交一个读/写hbase表的mapreduce作业时，它会被挂起。如果我在mapreduce代码中显式地提到hbase凭

浏览 7提问于2015-10-02得票数 0

回答已采纳

1回答

使用Hue时用Pig存储Hbase错误的数据

、、、

我的CDH版本是5.1.2，我的Hbase版本是0.98.1，我的Hue版本是3.6.0。我执行了这个pig脚本来从Hue中的Hbase加载数据。 c = LOAD 'hbase://analyze_block_v1' USING org.apache.pig.backend.hadoop.hbase.HBaseStorage('d:*', '-loadKey true'); dump c; 我发现了一个错误： ERROR org.apache.pig.tools.grunt.Grunt - ERROR 2998: Unhandled inte

浏览 0提问于2014-11-13得票数 2

回答已采纳

2回答

如何配置hbase写入文件系统？

、

我已经把hbase安装在suse linux机器上了。 hbase-site.xml文件如下所示： <configuration> <property> <name>hbase.rootdir</name> <value>file:///app/data.1/dashboard/hbase</value> </property> <property> <name>hbase.zookeeper.property.dataDir</name>

浏览 1提问于2015-07-20得票数 0

1回答

运行openTSDB时出错

、

按照openTSDB指南设置一个集群hbase：然后要运行TSD守护进程，我按照文档中指定的命令创建表： env COMPRESSION=NONE HBASE_HOME=path/to/hbase-0.94.X ./src/create_table.sh 它给出了以下错误： create 'tsdb-meta', {NAME => 'name', COMPRESSION => 'NONE', BLOOMFILTER => 'ROW'} ERROR: java.io.IOException: Table

浏览 0提问于2014-09-08得票数 2

1回答

如何通过C#应用程序使用HBase实现分页？

、、、

我见过通过控制台查询使用HBase实现分页的示例。使用C#，很可能是通过RESTful调用访问HBase，如何实现这一点？谢谢。

浏览 1提问于2015-07-29得票数 0

1回答

如何获得mapr表的大小？

、

下面是创建mapr表的步骤： $ pwd /mapr/cluster1/user/project $ls bin src $ maprcli volume create -name project-tables-vol -path /user/project/tables \ -quota 100G -topology /data/rack1 $ ls bin src tables $ hbase shell HBase Shell; enter 'help<RETURN>' for list of supported commands

浏览 4提问于2016-01-14得票数 2

回答已采纳

2回答

org.apache.hadoop.hbase.io.ImmutableBytesWritable异常在HBase中

、

我们尝试测试以下访问HBase表的示例代码(Spark-1.3.1、HBase-1.1.1、Hadoop-2.7.0)： import sys from pyspark import SparkContext if __name__ == "__main__": if len(sys.argv) != 3: print >> sys.stderr, """ Usage: hbase_inputformat <host> <table> Run with ex

浏览 0提问于2015-10-14得票数 4

1回答

Nutch和HBase配置错误

、、

我正在尝试让nutch和hbase基于这个docker镜像工作：我在尝试插入URL文件时遇到异常： InjectorJob: starting at 2017-12-19 20:49:45 InjectorJob: Injecting urlDir: urls Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/hadoop/hbase/HBaseConfiguration org.apache.gora.hbase.store.HBaseStore.initialize(HBaseSt

浏览 3提问于2017-12-20得票数 0

1回答

如何连接到Hbase托管动物园管理员

、

我使用伪分布式模式创建了一个hbase测试ENV，并且我没有设置独立的动物园管理员，我想知道如何连接到由Hbase管理的动物园管理员？我在hbase安装文件夹中找不到zkCli.sh。非常感谢。

浏览 4提问于2016-05-26得票数 2

回答已采纳

6回答

org.apache.hadoop.hbase.PleaseHoldException:主机正在初始化

、、

我正在尝试设置Hbase的多节点集群。当我在slave上执行jps时，我得到 5780 Jps 5558 HQuorumPeer 5684 HRegionServer 1963 DataNode 2093 TaskTracker 同样，在master上我得到了 4254 SecondaryNameNode 15226 Jps 14982 HMaster 3907 NameNode 14921 HQuorumPeer 4340 JobTracker EVerything运行正常。但是当我尝试在hbase shell上创建表时。它会给出一个错误 ERROR: org.apache.hadoop.h

浏览 1提问于2013-06-11得票数 17

回答已采纳

2回答

在哪个版本的HBase中集成了spark API？

、

我阅读了spark和hbase的文档：我可以看到HBase的最后一个稳定版本是，但我也看到apidocs在版本上，并且是空的。我很困惑，为什么apidocs和HBase版本不匹配？我的目标是使用Spark和HBase (bulkGet，bulkPut..etc)。我如何知道这些函数是在哪个HBase版本中实现的？如果有人有关于这方面的补充文档，那就太棒了。我在hbase-0.98.13-hadoop1上

浏览 5提问于2015-12-03得票数 5

2回答

用于查看快照的HBase命令

我已经为我的hbase表创建了一些快照。有没有办法查看在HBASE中创建的所有快照？像list snapshots这样的东西？

浏览 60提问于2017-02-27得票数 0

回答已采纳

1回答

我已经安装了Hbase，但是当我在cmd "hbase shell“中键入逗号时，它会显示以下错误

、、

以下是输入"hbase shell“时的错误 *:\hbase-2.5.0\hbase-config.cmd"' is not recognized as an internal or external command, operable program or batch file. \Java\jdk1.8.0_261\lib\tools.jar was unexpected at this time. 当我输入"start-hbase.sh“时，又出现了另一个错误 The file does not have an app associated with i

浏览 11提问于2022-10-22得票数 0

1回答

Hbase CopyTable错误

、

我想复制一个Hbase表。由于':'的原因，我在执行以下命令时出错。我希望将此':'保留在表名中。有人能帮我解决这个问题并成功复制Hbase表吗？ hbase org.apache.hadoop.hbase.mapreduce.CopyTable --new.name=grp:test1_bkp grp:test1 Error: SyntaxError: (hbase):4: syntax error, unexpected tSYMBEG 谢谢。

浏览 0提问于2016-09-07得票数 0

1回答

Sqoop不将空值导入HBase。

、、

我有以下命令从Oracle导入到Hbase： sqoop-import -Dsqoop.hbase.add.row.key=true -Dhbase.zookeeper.quorum=zk.localdomain --verbose --connect jdbc:oracle:thin:@127.0.0.1:1521:xe --username admin --password admin --query "select * from table WHERE \$CONDITIONS" --hbase-table hbase_table --column-fa

浏览 3提问于2017-11-09得票数 0

回答已采纳

1回答

如何在Scala中从Spark中检索和更新HBase表

、、、、

似乎没有合适的资源或文档或书籍来访问HBase表，就像我们有HIve一样，我正在创建Hbase配置和sacnning，并试图放置，但缺少一些链接如何做到这一点(只是从论坛和github复制粘贴，但无法理解)，谁能发布一个端到端的代码，以检索和更新Hbase表的细节？？或推荐从spark访问的任何Hbase书籍/博客

浏览 0提问于2016-01-29得票数 1

1回答

扫描器缓存和ResultScanner接口中的下一步方法

这是一本书的摘录，HBase in Action，用于扫描缓存。 ResultScanner接口还有一个next(int)调用，您可以使用它请求它从扫描中返回下n行。这是一种API方便，与客户机调用HBase以获取这些n行的次数无关。在这个框架下，ResultScanner进行尽可能多的RPC调用以满足请求；每个RPC调用返回的行数完全取决于为扫描器配置的缓存值。我对上述各点有两点疑问：如果下一个(Int)方法与客户端对HBase的RPC调用数量没有任何关系，那么它解决了什么目的，以及它应该如何和在哪里使用？最后一句说，ResultScanner发出满足请求所需的多少RP

浏览 4提问于2016-07-27得票数 2

2回答

如何在Hbase中解决ThrottlingException问题

、、

我正在使用map-reduce作业来阅读hbase，有时我会收到 Error: org.apache.hadoop.hbase.quotas.ThrottlingException: org.apache.hadoop.hbase.quotas.ThrottlingException: request size limit exceeded - wait 0.00sec at 由于整个map reduce作业被终止，有没有办法告诉hbase读取速度变慢？或者告诉它等待并重试？

浏览 5提问于2016-08-26得票数 0

1回答

如何在HBase中启用安全性？

我想在HBase中启用身份验证和授权。我阅读了他们的文档，其中指出可以使用Kerberos启用它，但我仍然无法找到实现它的正确方法。我使用的是HBase Java API。请建议如何使用HBase的安全功能。

浏览 0提问于2015-04-03得票数 1

1回答

基于时间戳的蜂巢HBase表数据访问

、、、、

我创建了一个HBase，它将默认版本提到为10 create 'tablename',{NAME => 'cf', VERSIONS => 10} 并插入两行(row1和row2) put 'tablename','row1','cf:id','row1id' put 'tablename','row1','cf:name','row1name' put 'tablename','row2',

浏览 4提问于2015-03-31得票数 1

2回答

如何在HBase中更新数据

我将用户数据存储在HBase中，我有c#客户端，它使用HBase REST API将数据存储在HBase表中。有可能通过多个线程更新用户数据。如何更新表中的行，以及如何对行应用锁定系统。注意：-我使用的是HBase REST API。

浏览 1提问于2012-12-13得票数 0

1回答

了解哨兵-Provider.ini文件语法

sentry-provider.ini [groups] # Assigns each Hadoop group to its set of roles engineer = engineer_role ops = ops_role dev_ops = engineer_role, ops_role hbase_admin = hbase_admin_role [roles] # The following grants all access to source_code. # "collection = source_code" can also be used as sy

浏览 3提问于2016-09-23得票数 0

回答已采纳

1回答

如何为hbase指定RPC服务器端口？

我在码头容器中启动hbase，希望客户端代码能够连接到hbase rpc服务器端口。问题是:它总是不同的(从临时端口范围随机选择)。通过查看hbase代码(第1078行中的"hbase.regionserver.port“，bindAddress )，我发现我可以通过设置"hbase.master.port".或来覆盖端口我尝试在HBASE-conx.xml中设置这些，但是没有任何效果-端口仍然是随机的，就好像这些属性被解析为0一样。我该怎么改变呢？

浏览 3提问于2017-04-20得票数 1

回答已采纳

1回答

如何在build.sbt中添加依赖项目以运行sbt编译

我是新来的sbt建筑。我想将依赖项目的java文件(比如Proj )添加到我的编译项目(Proj )中。在Proj中运行sbt编译会引发相关项目的java包/类找不到的错误。我浏览了链接：，但我不清楚添加这个依赖项以使其工作。我试着在build.sbt中添加一行，但是它没有工作。懒惰的val projB = project.dependsOn(/projA) 已更新 build.sbt of projB： organization := "com.org" name := "projB" version := "1" resolvers

浏览 1提问于2019-08-27得票数 0

回答已采纳

1回答

为什么Hbase stoprow在扫描中是独一无二的？

有没有办法(除了重建hbase jars之外)让hbase scan(startRown，endRow)构造函数包含在endRow端？我的行键是一个字符串。

浏览 2提问于2017-08-17得票数 1

2回答

用于获取特定表大小的HBase外壳命令

、

如何从HBase外壳中获取特定HBase表的大小？

浏览 19提问于2017-02-16得票数 2

3回答

在ubuntu中部署Hbase独立模式的问题

我是Hbase的初学者。我完全遵循了中的快速启动文档，我希望在独立模式下运行Hbase。我稍微修改了hbase-site.xml： <configuration> <property> <name>hbase.rootdir</name> <value>file://home/archer/HbaseData</value> </property> </configuration> 然后进入Hbase shell并输入命令： create 'test', &

浏览 6提问于2012-03-11得票数 1

回答已采纳

1回答

使用HBase REST API从URL解析响应是正确的方式吗？

我没有找到任何HBase REST客户端的示例来放置GET POST request.So，而不是这个。我正在做的是，我只是使用Hbase REST URL，将它放在我的java代码中，并以正确的方式使用SAX parser..Is解析响应(bcoz我没有使用GET request..我没有在HBase REST客户端上找到使用GET post的示例)，谢谢……

浏览 0提问于2012-09-07得票数 0

1回答

HBase中的Geomesa属性索引

、、

HBase不支持二级索引，但是将数据存储在HBase之上的Geomesa支持属性索引。那件事怎么可能？

浏览 1提问于2019-04-02得票数 0

回答已采纳

3回答

Phoenix 4.8版本

我有Phoenix 4.8和hbase 1.2；我已经在hbase/lib文件夹中复制了jar: phoenix-core-4.8.0-HBase-1.2.jar和phoenix-4.8.0-HBase-1.2-client.jar。在启动.sqlline.py时，我收到以下错误：错误:错误2007 (INT09)：过期的jars。以下服务器需要将更新的主机名放入jars的类路径中：,1470746624029.8eaa1de436397c886fd7c5e4009c1a82.，phoenix.jar =HBase-n310u，16201,1471850762175，region=SYSTE

浏览 47提问于2016-08-22得票数 0

1回答

Hbase性能调优

、

我的6节点Hbase集群有以下硬件配置(1主-5从) 每个节点的配置 2.4 CPU，48核Intel CPU 256 RAM 1 1Gb/ps网络连接 30个SSD磁盘(JBOD设置) 操作系统: RHEL 6.6 Hbase版本:1.2.0 CDH分布: 5.7.0 我在Hbase中调整了以下参数： hbase.client.write.buffer: 64MB hbase.regionserver.handler.count: 64 master_region_java_heapsize: 125GB hbase.client.scanner.caching: 10000

浏览 3提问于2016-06-18得票数 0

4回答

HBase连接异常

、

我尝试在伪分布式模式下运行HBase。但是在我设置hbase-site.xml之后，它就不起作用了。每当我试图在hbase shell中运行一个命令时，我都会得到以下错误： org.apache.hadoop.hbase.ZooKeeperConnectionException: org.apache.hadoop.hbase.ZooKeeperConnectionException: org.apache.zookeeper.KeeperException$ConnectionLossException: KeeperErrorCode = connectionLoss for /hbas

浏览 5提问于2011-01-22得票数 8

回答已采纳

2回答

Zookeeper错误连接丢失异常

、、、、

我正在亚马逊EC2实例上运行SeqWare VM，并尝试使用SeqWare查询引擎从VCF文件中查询数据。当我第一次启动该实例并按照说明导入数据时，它工作得很好，并且一直工作到我停止该实例为止。当我重启它的时候。它不会让我导入任何东西，也不会创建一个新的工作区。它总是返回下面的错误。我查看了进程，发现没有一个所需的节点正在运行，所以我登录到根目录，转到etc/init.d目录并重新启动所有内容，此时，当T尝试导入数据时，我甚至没有收到错误，我必须停止该进程。 [seqware@master target]$ java -classpath seqware-distribution-0.13.6

浏览 1提问于2013-07-09得票数 1

回答已采纳

1回答

在码头堆叠间共享体积？

、、、

我有两个不同的码头堆叠，一个是HBase的，另一个是火花的。我需要把HBase罐子放进火花道。我可以这样做的一个方法，不需要修改火花容器是使用一个卷。在用于HBase的docker-compose.yml中，我定义了指向HBase主目录的卷(它恰好是/opt/hbase-1.2.6)。是否可以与火花堆栈共享该卷？现在，由于服务名称不同(两个不同的坞-组合文件)，卷被加在前面(hbase_hbasehome和spark_hbasehome)，导致共享失败。

浏览 0提问于2018-05-22得票数 3

回答已采纳

2回答

使用ls命令作为shell脚本的输入

、、、、

我的文件在Hadoop文件系统中；我需要在每个文件系统上运行凤凰批量导入。现在，我的shell脚本如下所示： test.sh： HADOOP_CLASSPATH=/usr/lib/hbase/lib/hbase-protocol-1.1.2.jar:/etc/hbase/conf hadoop jar /usr/lib/phoenix/lib/phoenix/phoenix-1.2.0-client.jar org.apache.phoenix.mapreduce.CsvBulkLoadTool --table NETWORK_HEALTH --input $1 hdfs dfs -

浏览 1提问于2016-04-06得票数 2

回答已采纳

1回答

Spark Streaming:通过接收到的流密钥从HBase读取？

、、、、

将Spark Streaming中接收的数据与HBase中的现有数据进行比较的最佳方式是什么？我们从kafka接收数据作为DStream，在将其写到HBase之前，我们必须根据从kafka接收到的密钥扫描HBase中的数据，进行一些计算(基于每个密钥的新数据和旧数据)，然后写到HBase。因此，如果我收到record (key，value_new)，我必须从HBase (key，value_old)获取，这样我就可以比较value_new和value_old。所以逻辑是：来自Kafka的数据流-> Query HBase by Dstream keys -> Some c

浏览 32提问于2021-02-09得票数 1

回答已采纳