spark hbase_hbase spark_SPARK to HBase编写 - 腾讯云开发者社区

scala、apache-spark、apache-spark-sql、hbase

我想通过Spark从HBase加载数据，我使用hbase-spark 并引发NullPointerException 我的build.sbt文件是： name := "proj_1" version := "0.1" scalaVersion := "2.11.12" libraryDependencies ++= Seq( "org.apache.spark" % "spark-core_2.11" % "2.3.1", "org.apache.spark" % &

浏览 0提问于2018-09-17得票数 2

1回答

如何使用spark 2访问hbase。*

scala、apache-spark、hbase

我写了一个使用spark 1.6和spark- HBase -connecotr ( sbt依赖："it.nerdammer.bigdata“%”spark-hbase-hbase_2.10“% "1.0.3")访问连接器的程序。但在使用spark 2时不起作用。*。我对这个问题进行了搜索，得到了一些结论： spark使用spark连接hbase有多个连接器 Top.dir>1.6.0</ - hbase-spark. hbase-spark is provided by HBase official [website](https://github.com

浏览 41提问于2017-02-14得票数 4

回答已采纳

1回答

Spark - Getting exception org.apache.spark.Logging未找到

apache-spark、cloudera、cloudera-cdh

我们正在使用Spark 2.3.0创建一个基于Spark的应用程序。我们的Spark作业与HBase交互。在创建JAR时，我们得到以下编译时异常异常: ERROR class file for org.apache.spark.Logging not found此异常发生在代码中，即从HBase表中读取数据。使用下面的jar配置/版本，我们能够成功地将数据写入HBase表。我们在pom.xml中使用以下配置 <property> <org.apache.spark.version>2.3.0</org.apache.spark.version> <

浏览 1提问于2018-09-21得票数 0

2回答

带有org.apache.hadoop.mapreduce.InputSplit.getLocationInfo错误的火花读取HBase :java.lang.NoSuchMethodError错误

scala、apache-spark、hadoop、hbase

我想通过Spark使用scala读取Hbase，但是我得到了错误： Exception in thread "dag-scheduler-event-loop" java.lang.NoSuchMethodError: org.apache.hadoop.mapreduce.InputSplit.getLocationInfo()[Lorg/apache/hadoop/mapred/SplitLocationInfo; 但是我已经添加了依赖项，这个问题困扰着我。我的环境如下： scala: 2.11.12 火花: 2.3.1 HBase:也许2.1.0(我不知道)

浏览 0提问于2018-11-02得票数 1

回答已采纳

1回答

Spark 2连接到HBase

apache-spark、hbase

尝试将代码从Spark 1.6，Scala 2.10迁移到Spark 2.4，Scala 2.11。无法获取要编译的代码。下面显示了依赖项版本、最小示例和编译错误。 // Dependencies , "org.apache.spark" %% "spark-core" % "2.4.0" , "org.apache.spark" %% "spark-sql" % "2.4.0" , "org.apache.hbase" % "hbase-server" % &#

浏览 35提问于2020-01-08得票数 0

回答已采纳

1回答

当使用spark时，我得到了一个org.apache.hadoop.hbase.spark.SparkSQLPushDownFilter :ClassNotFoundException

scala、apache-spark、hbase

谢谢你的帮忙! 当我试图阅读Hbase，我有例外！我试图设置-罐子和设置spark.sparkContext.addJar("./hbase-spark-1.0.0.jar")，，但它不起作用；我也试着保持hbase和sbt相同的版本，它也不起作用；我的sbt代码： "org.apache.hbase.connectors.spark" % "hbase-spark" % "1.0.0", "org.apache.hbase" % "hbase" % "2.1.

浏览 6提问于2021-09-10得票数 2

回答已采纳

1回答

查询星系团以HBase引发"java.lang.IllegalStateException:未读块数据“异常

apache-spark、hbase

我们的Spark设置在3台服务器上，所有人都可以看到HBase集群服务器。我正在使用Hadoop2.7.3、HBase 1.2.6和Spark2.1.3。我连接到星火 /opt/spark/bin/spark-shell --master spark://master:7077 并运行以下命令 import org.apache.hadoop.hbase.util.Bytes import org.apache.hadoop.hbase.client.{HBaseAdmin, Result, Put, HTable} import org.apache.hadoop.hbase.{ HBa

浏览 1提问于2018-07-17得票数 0

回答已采纳

1回答

java.lang.ClassNotFoundException:未能找到数据源: org.apache.hadoop.hbase.spark时读入hbase表

apache-spark、pyspark、hbase

我使用pyspark将hbase表读入数据，但它出现了一些错误： sc = SparkContext(master="local[*]", appName="test") spark = SparkSession(sc).builder.getOrCreate() df = spark.read.format('org.apache.hadoop.hbase.spark') \ .option('hbase.table', 'h_table') \ .option('hbase.column

浏览 9提问于2020-01-06得票数 1

1回答

如何在Hadoop + Yarn上配置应用程序从HBase中读取

scala、hadoop、apache-spark、sbt、hbase

星星之火，Hbase上的Hadoop + Yarn，我想读和写HBase从一个Scala应用程序，建立在SBT。我不能创建一个HBase Scala应用程序： /usr/local/sparkapps/HBaseWordCount/src/main/scala/com/mydomain/spark/hbasewordcount/HbaseWordCount.scala package com.mydomain.spark.hbasewordcount import org.apache.spark._ import org.apache.spark.streaming._ impo

浏览 6提问于2016-04-14得票数 0

回答已采纳

1回答

使用火花提交设置火花作业的HBase属性

apache-spark、hadoop、hbase

在Hbase数据迁移过程中，我遇到了一个java.lang.IllegalArgumentException: KeyValue size too large 长期 : 我需要将/etc/hbase/conf/hbase-site.xml中的属性/etc/hbase/conf/hbase-site.xml(从1048576增加到10485760)，但是我现在不能更改这个文件(我需要验证)。短期 : 我成功地使用命令导入数据： hbase org.apache.hadoop.hbase.mapreduce.Import \ -Dhbase.client.keyvalue.maxsize=1

浏览 2提问于2020-02-04得票数 1

回答已采纳

1回答

错误:将pyspark dataframe写入Habse时

apache-spark、pyspark、hbase、pyspark-sql

我正在尝试将pyspark数据帧写入Hbase。面对下面的错误。我的集群上的Spark和Hbase版本是： Spark版本: 2.4.0 Hbase版本: 1.4.8 Spark提交 spark-submit --jars /tmp/hbase-spark-1.0.0.jar --packages com.hortonworks:shc-core:1.1.1-2.1-s_2.11 --repositories http://repo.hortonworks.com/content/groups/public/ --files /etc/hbase/conf/hbase-site.xml

浏览 1提问于2020-03-30得票数 0

2回答

Hadoop-火花-HBase错误: org.apache.hadoop.hbase.DoNotRetryIOException

scala、maven、apache-spark、hadoop、hbase

试图运行作业以通过spark从HBase表中提取数据时出错。任何帮助都是非常感谢的。错误： org.apache.hadoop.hbase.DoNotRetryIOException: java.lang.IllegalAccessError:尝试从类org.apache.hadoop.hbase.zookeeper.MetaTableLocator访问方法com.google.common.base.Stopwatch.()V Hadoop Version: 3.1.1 HBase Version: 2.1.6 SPARK Version: 2.3.2 spark-submit -

浏览 5提问于2021-02-07得票数 0

1回答

线程"main“java.lang.NoClassDefFoundError: org/apache/hadoop/ Hbase /HBaseConfiguration中的异常使用java运行spark

apache-spark、hbase

我正在运行简单的应用程序，以便使用java从HBase in Spark中获取数据。运行火花-提交命令。 bin/spark-submit --master spark://192.168.43.75:7077 --class com.scry.NLPAnnotationController --driver-class-path /usr/lib/hbase/hbase-0.98.22-hadoop2/conf:$SPARK_HOME/lib_managed/jars/*.jar:$HBASE_CLASSPATH/*.jar --jars $SPARK_HOME/lib_managed/j

浏览 3提问于2016-10-06得票数 0

3回答

如何使用火花提交的包指定多个依赖项？

apache-spark、hbase、spark-streaming

我有以下命令行启动火花流作业。 spark-submit --class com.biz.test \ --packages \ org.apache.spark:spark-streaming-kafka_2.10:1.3.0 \ org.apache.hbase:hbase-common:1.0.0 \ org.apache.hbase:hbase-client:1.0.0 \ org.apache.hbase:hbase-serv

浏览 9提问于2015-11-25得票数 27

回答已采纳

1回答

对象hbase不是包org.apache.spark.sql.execution.datasources的成员。

maven、apache-spark、hbase

我正在尝试使用从HBase获取数据。 import org.apache.spark.sql.execution.datasources.hbase._ 错误是 object hbase is not a member of package org.apache.spark.sql.execution.datasources 在我的本地.m2存储库中已经存在.jar of org.apache.hbase.hbase-spark.我真的想知道这个包在哪里(我想在这个包中使用的对象是HBaseTableCatalog) pom.xml的一部分是 <dependency> <

浏览 0提问于2018-06-08得票数 1

回答已采纳

1回答

未找到hbase火花模块

maven、apache-spark、hbase

我正试着从火花中获取hbase。 spark = ( SparkSession.builder.master("yarn") .appName(app_name) .config("spark.jars.packages", "org.apache.hbase:hbase-spark:1.2.0-cdh5.16.2") .getOrCreate() ) 但我知道错误是：模块未找到:org.apache.hbase#hbase-spark；1.2.0cdh5.16.2 该页存在于maven：上。有什么问题

浏览 5提问于2020-07-07得票数 0

回答已采纳

2回答

Spark找不到Hbase类

spark-streaming

我正在尝试使用Spark流将数据从HDFS加载到Hbase表。我将数据放在HDFS目录运行时，并使用textFileStream函数读取数据。由于spark在类路径中没有hbase jars，所以即使在火花外壳中导入Hbase jars时也会给我一个错误。 scala> import org.apache.hadoop.hbase.mapred.TableOutputFormat <console>:10: error: object hbase is not a member of package org.apache.hadoop import org.ap

浏览 3提问于2014-11-02得票数 5

2回答

使用HBase写入PySpark表时出错

apache-spark、pyspark、apache-spark-sql、spark-dataframe、pyspark-sql

我正在尝试使用pySpark写入hbase表。到目前为止，我还能读到hbase的数据。但是当写入hbase表时会出现异常。 from pyspark.sql import SparkSession from pyspark import SparkContext from pyspark.sql.types import * properties = { "instanceId" : "hbase", "zookeepers" : "10-x-x-x.local:2181,10-x-x-x.local:2181,10-x-x-x

浏览 2提问于2017-10-25得票数 0

回答已采纳

1回答

Spark和Hbase客户端的版本兼容性

apache-spark、hbase、hbase-client

我正试着写一个火花批次作业。我想把它包装到一个罐子，并使用它与火花提交。我的程序在shell中工作得很好，但是当我尝试使用submit运行它时，我会得到以下错误： Exception in thread "main" java.lang.NoSuchMethodError: scala.Predef$.$conforms()Lscala/Predef$$less$colon$less; at HBaseBulkload$.saveAsHFile(ThereInLocationGivenTimeInterval.scala:103) at HBaseBulkloa

浏览 6提问于2016-11-30得票数 1

回答已采纳

1回答

当我尝试使用NullPointerException从hbase表中提取数据时，newAPIHadoopRDD出现了

apache-spark、hbase

Exception in thread "main" java.lang.RuntimeException: java.lang.NullPointerException at org.apache.hadoop.hbase.client.RpcRetryingCaller.callWithoutRetries(RpcRetryingCaller.java:208) at org.apache.hadoop.hbase.client.ClientScanner.call(ClientScanner.java:320) at org.apache.hado

浏览 6提问于2017-08-29得票数 2

回答已采纳

1回答

无法通过API访问HBase

apache-spark、pyspark、hbase

我在三个节点上安装了hbase。我正在尝试加载hbase通过火花与以下代码的帮助。 from __future__ import print_function import sys from pyspark import SparkContext import json if __name__ == "__main__": print ("*******************************") sc = SparkContext(appName="HBaseOutputFormat") host = sys

浏览 17提问于2017-07-09得票数 0

1回答

将HBase中的数据作为RDD直接查询到Spark中，还是通过Phoenix作为数据帧进行查询？

amazon-web-services、apache-spark、hbase

我正在尝试查询存储在HBase中的数据，以便在AWS EMR中使用Spark ML。我应该将数据作为RDD提取(如下所示)，还是应该使用Phoenix将数据作为Dataframe进行查询？我已经尝试过通过HBase RDD和Phoenix将数据导入到Spark中。然而，我在使用这两种方法时都遇到了问题。 import org.apache.hadoop.hbase.{ HBaseConfiguration, HColumnDescriptor, HTableDescriptor } import org.apache.hadoop.hbase.client.{ HBaseAdmin, P

浏览 24提问于2019-06-21得票数 0

1回答

使用Spark连接到Hbase时出现异常

scala、maven、apache-spark、apache-spark-sql、hbase

我正在使用Spark连接到Hbase。我已经添加了所有的依赖项，但是我仍然得到了这个异常。请帮助我，我需要添加哪个JAR来解决这个问题。 SPARK_MAJOR_VERSION is set to 2, using Spark2 SLF4J: Class path contains multiple SLF4J bindings. SLF4J: Found binding in [jar:file:/usr/hdp/2.6.5.0-292/spark2/jars/slf4j-log4j12

浏览 2提问于2018-09-17得票数 0

1回答

如何在SBT中导入hbase-testing-util？

scala、sbt、hbase、pom.xml、hbasetestingutility

以下是我的项目的依赖项： libraryDependencies ++= Seq( "org.jpmml" % "pmml-evaluator" % "1.2.1", "org.apache.kafka" %% "kafka" % "0.8.2.1", "org.apache.spark" %% "spark-core" % "1.2.0", "org.apache.spark" %% "spark-stream

浏览 8提问于2015-08-25得票数 3

1回答

spark hbase连接器在连接时抛出异常

apache-spark、apache-spark-sql、hbase、spark-streaming

尝试根据Hbase提供的以下文档使用spark连接到Hbase。 https://hbase.apache.org/book.html#_sparksql_dataframes 代码： val cat = s"""{ |"table":{"namespace":"test", "name":"data_inv"}, |"rowkey":"key", |"colu

浏览 14提问于2019-05-14得票数 0

1回答

PySpark: saveAsNewAPIHadoopDataset()可以用作HBase的批量加载吗？

python、hadoop、apache-spark、hbase、bulkloader

我们目前使用saveAsNewAPIHadoopDataset()通过Spark RDDs (pyspark)将数据导入到HBase表中。此函数是否通过mapreduce使用HBase批量加载功能？换句话说，直接导入到HBase的saveAsNewAPIHadoopDataset()是否等同于使用saveAsNewAPIHadoopFile()将Hfiles写入HDFS，然后调用org.apache.hadoop.hbase.mapreduce.LoadIncrementalHFiles加载到HBase？以下是我们的HBase加载例程的示例片段： conf = {"hbase.zo

浏览 5提问于2015-08-24得票数 3

1回答

错误:单元格计数为1，但在索引0处未返回单元格: row=XXX

hbase

以前有没有人见过这种异常？环顾四周，什么也找不到。我在执行Increment时遇到了这个异常。很难准确地调试为什么会在特定的情况下发生这种情况，因为它只会在BufferedMutation操作的后期发生，在该操作中，会同时批处理许多增量。我唯一的怀疑是，也许值的总和超过了max Integer？但我对此表示怀疑。下面是堆栈跟踪的相关部分： : 1 time, org.apache.hadoop.hbase.DoNotRetryIOException: Cell count of 1 but at index 0 no cell returned: row=c0f68942ce3b6545

浏览 10提问于2019-07-30得票数 0

0回答

多个spark上下文错误

scala、hadoop、apache-spark

我有下面的spark代码： import org.apache.hadoop.hbase.client._ import org.apache.hadoop.hbase.{ HBaseConfiguration, HTableDescriptor } import org.apache.hadoop.hbase.mapreduce.TableInputFormat import org.apache.hadoop.hbase.io.ImmutableBytesWritable import org.apache.hadoop.hbase.util.Byt

浏览 1提问于2016-07-02得票数 0

回答已采纳

1回答

如何将写入HBase？

scala、apache-spark-sql、hbase

我正在尝试将Spark Dataframe写到HBase中，并跟踪了其他几个博客，其中一个是，但它不起作用。但是，我可以成功地将HBase中的数据读取为Dataframe。还有一些帖子使用了org.apache.hadoop.hbase.spark格式，还有一些文章使用了org.apache.spark.sql.execution.datasources.hbase格式。我不知道该用哪一种。Spark - 2.2.2；HBase - 1.4.7；Scala - 2.11.12和Hortonworks SHC 1.1.0-2.1-s_2.11来自。守则如下： case class UserM

浏览 0提问于2018-09-11得票数 0

1回答

基于Spark2的Hbase分布式扫描问题

apache-spark、nosql、hbase

当我试图以编程方式从spark/scala文件执行hbase操作时观察我们刚刚从spark 1.6版本迁移到2.3版本，HBASE1.2版本在这两种情况下都是相同的。但是现在我们在做hbase分布式扫描操作时面临着这个问题。获取误差 Exception in thread "main" org.apache.hadoop.hbase.DoNotRetryIOException: /0.0.0.0:60020 is unable to read call parameter from client ; java.lang.UnsupportedOperationExcepti

浏览 0提问于2018-11-12得票数 0

2回答

java.lang.ClassNotFoundException: org.apache.hadoop.hbase.HBaseConfiguration

scala、exception、configuration、apache-spark、hbase

我想使用scala示例创建我的第一个scala程序，该示例在Sparkd 1.4.1中提供。目标是连接到HBase并完成一些基本工作，例如计数行或扫描行。然而，当我试图执行程序时，我得到了一个错误。看来斯派克找不到HBaseConfiguration类。假设我们找到了我的项目HBaseTest2 /usr/local/Cellar/spark/programs/HBaseTest2的根路径。下面是一些例外的详细信息： ./src/main/scala/com/orange/spark/examples/HBaseTest2.scala package com.orange.spark.exam

浏览 3提问于2015-08-18得票数 2

2回答

spark-hbase连接器过期票证kerberos

apache-spark、hbase、spark-streaming、cloudera

我有一个CDH为5.8.4的集群。我运行在一个spark streaming应用程序中，它通过使用cloudera spark-hbase连接器，即HBaseContext，从HBase读写数据。当我启动应用程序时，我将主体和kinit提供给spark-submit脚本。我发现应用程序在7天后崩溃，并显示与HBase上下文相关的票证kerberos过期错误。下面是executors日志中的错误： ERROR executor.Executor: Exception in task 0.0 in stage 544265.0 (TID 1149098) org.apache.hadoop.hba

浏览 0提问于2017-10-27得票数 1

1回答

Spark程序大容量删除hbase行抛出AbstractMethodError

scala、apache-spark、hbase、bulk-delete

下面是火花应用程序中的代码块，用于从hbase表中删除行键集(rePartitionedRowKeys)， hbaseContext.bulkDelete[Array[Byte]](rePartitionedRowKeys, TableName.valueOf(hbaseTableName), putRecord => new Delete(putRecord), batchSize) pom.xml中的相关依赖关系是， <dependency> <groupId>org.apache.hbase</groupId&g

浏览 1提问于2017-11-13得票数 1

回答已采纳

1回答

hbase的sbt依赖关系管理问题-测试-实用程序

unit-testing、testing、sbt、hbase

我试图使用scalatest执行单元测试，使用hbase测试实用程序来本地测试开发代码。sbt中hbase测试实用程序的设置是目前的挣扎。当我编译时，我会得到以下错误： [warn] module not found: org.apache.hbase#${compat.module};1.2.1 [warn] ==== local: tried [warn] /root/.ivy2/local/org.apache.hbase/${compat.module}/1.2.1/ivys/ivy.xml [warn] ==== public: tried [warn] https://r

浏览 2提问于2016-04-29得票数 3

回答已采纳

1回答

如何从pyspark连接到hbase

python、apache-spark、hbase、pyspark

我在azure中有两个集群，一个用于spark 2.0，另一个用于hbase。我可以完美地填充和使用hbase，现在我想将spark连接到hbase并进行一些计算。我想使用python，因为我不知道scala。我的第一个问题是:做这件事的最好方法是什么？spark -> hive -> hbase还是spark直接到hbase？我能有一个很好的插入和查询的例子吗？谢谢?

浏览 0提问于2016-11-10得票数 0

2回答

SparkSQL+Hive+Hbase+HbaseIntegration不起作用

hadoop、apache-spark、hive、hbase、apache-spark-sql

当我试图在spark中连接蜂巢表(它是通过HbaseIntegration创建的)时，我遇到了错误。我遵循的步骤：Hive表创建代码： CREATE TABLE test.sample(id string,name string) STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler' WITH SERDEPROPERTIES ("hbase.columns.mapping" = ":key,details:name") TBLPROPERTIES ("hba

浏览 1提问于2016-09-02得票数 2

1回答

如何在不使用javaRDD的情况下通过dataframe从hbase获取数据

java

如何在不使用javaRDD的情况下使用dataframe(spark sql)从Hbase获取数据。代码：- SparkConf sconf = new SparkConf().setMaster("local").setAppName("Test"); Configuration conf = HBaseConfiguration.create(); JavaSparkContext jsc = new JavaSparkContext(sconf); try { HBaseAdmin.checkHBaseAvaila

浏览 4提问于2017-05-12得票数 0

1回答

尝试从Spark查询HBase上的数据时出现NoSuchMethodError

apache-spark、hadoop、hbase、cloudera

我正在尝试使用SparkSQL/DataFrames查询加载到HBase表中的数据。我的集群基于Cloudera CDH 6.2.0 (Spark版本2.4.0和HBase版本2.1.0)。遵循指南，我在Spark Service的HBase服务属性中选择了我的HBase服务。此操作将以下jars添加到我的Spark类路径中： /opt/cloudera/parcels/CDH-6.2.0-1.cdh6.2.0.p0.967373/lib/hbase/bin/../lib/client-facing-thirdparty/audience-annotations-0.5.0.jar /opt

浏览 2提问于2019-11-06得票数 2

1回答

com.pepperdata.spark.metrics.PepperdataSparkListener流-找不到类- HDFS文件流- java.lang.ClassNotFoundException: Spark

apache-spark、spark-streaming

我已经使用纱线集群模式提交了spark streaming作业。但是我得到了下面的错误。 SparkSubmit命令： export SPARK_CLASSPATH=/usr/hdp/current/hbase-client/lib/hbase-common.jar:/usr/hdp/current/hbase-client/lib/hbase-client.jar:/usr/hdp/current/hbase-client/lib/hbase-server.jar:/usr/hdp/current/hbase-client/lib/hbase-protocol.jar:/usr/hdp/c

浏览 0提问于2018-03-12得票数 0

1回答

独立的HBase和火花，HBaseTest.scala给出了错误

scala、hadoop、apache-spark、hbase

嗨，我使用的是独立的hbase，我想测试它的火花。我的机器上没有hadoop。当我试图使用HBaseTest.scala (在scala示例中)获取表的计数时，我得到以下错误： ERROR TableInputFormat: java.io.IOException: java.lang.reflect.InvocationTargetException at org.apache.hadoop.hbase.client.HConnectionManager.createConnection(HConnectionManager.java:416) at org.apache.

浏览 0提问于2015-04-30得票数 0

回答已采纳

1回答

因hbase-spark对ClassNotFoundException的依赖而导致的Spark phoenix读取中断: org.apache.hadoop.hbase.client.HConnectionManager

apache-spark、hbase、phoenix

我正在写一个简单的火花程序从Phoenix读取和写入Hbase使用spark -Hbase-连接器。我成功地分别从Phoenix读取和使用SHC写入Hbase。但是，当我将所有东西放在一起(具体添加hbase-spark依赖项)时，管道在Phoenix read语句处中断。代码： import org.apache.spark.sql.SparkSession import org.apache.spark.sql.datasources.hbase.HBaseTableCatalog object SparkHbasePheonix { def main(args: Array[St

浏览 136提问于2020-05-19得票数 0

1回答

Hbase-cloudera中的Spark连接器问题: java.lang.AbstractMethodError

apache-spark-sql

我正在尝试将Spark数据帧写入Hbase，但当我在同一数据帧上执行任何操作或写入/保存方法时，它会给出以下异常： { java.lang.AbstractMethodError at org.apache.spark.Logging$class.log(Logging.scala:50) at org.apache.spark.sql.execution.datasources.hbase.HBaseFilter$.log(HBaseFilter.scala:121) at org.apache.spark.sql.execution.dat

浏览 11提问于2019-02-21得票数 1

1回答

shc-核心: NoSuchMethodError org.apache.hadoop.hbase.client.Put.addColumn

apache-spark、hbase、hortonworks-data-platform

我尝试使用shc保存火花数据到hbase通过火花.我的版本： hbase: 1.1.2.2.6.4.0-91 火花: 1.6 scala: 2.10 shc: 1.1.1-1.6-S2.10 hdp: 2.6.4.0-91 配置如下所示： val schema_array = s"""{"type": "array", "items": ["string","null"]}""".stripMargin def catalog: Stri

浏览 1提问于2018-09-09得票数 0

回答已采纳

1回答

从火花加载HBASE时出现的问题:加载转换器失败: org.apache.spark.examples.pythonconverters

python、apache-spark、pyspark

在从PySpark加载HBASE时，我得到以下错误消息。 “负载转换器失败: org.apache.spark.examples.pythonconverters.StringToImmutableBytesWritableConverter” 我正在使用spark 2.0和Hbase 1.1.2.2.5.0.0-1245 使用以下步骤加载Hbase datamap=temp_rdd.map( lambda (x,y): (str(x),[str(x),"cf1","a",y])) host='xyz' table='test'

浏览 5提问于2017-09-18得票数 1

回答已采纳

1回答

在spark 2.4中读取hbase 1.2.5表时出错

scala、apache-spark、hbase

火花版本- 2.4.0 hbase版本- 1.2.5 scala版本。所有东西都是在本地VM中设置的。进口包装软件包com.hortonworks:shc-core:1.1.1-2.1-s_2.11，org.apache.hadoop:hadoop-公共:2.7.3，org.apache.hbase:hbase-公共:1.2.5，org.apache.hbase:hbase-client:1.2.5，org.apache.hbase:hbase-协议:1.2.5，org.apache.hbase:hbase-hadoop2-compat:1.2.5，Org.apache.hbase:hb

浏览 1提问于2019-12-08得票数 0

1回答

无法访问hbase，但能够使用java代码访问

java、hadoop、apache-spark、hbase、apache-zookeeper

我使用的火花1.3.0与hbase 1.0。一周后。使用java代码成功运行Hbase。但当使用Hbase与火花给予错误。我还检查了hbase外壳是否工作正常。这个错误发生了很长时间，否则也可以用火花工作。我已经检查了hadoop和hbase集群的健康状况。在火花用户界面 Caused by: java.io.IOException: Enable/Disable failed at org.apache.hadoop.hbase.client.ZooKeeperRegistry.isTableOnlineState(ZooKeeperRegistry.java:110)

浏览 6提问于2015-06-05得票数 4

1回答

无法加载HBase的spark sql数据源

hbase、apache-spark-sql

我想使用Spark SQL从HBase表中获取数据。但我在创建DataFrame时获得了classNotFoundException。以下是我的例外。 Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/spark/sql/types/NativeType at org.apache.hadoop.hbase.spark.DefaultSource$$anonfun$generateSchemaMappingMap$1.apply(DefaultSource.scala:127)

浏览 1提问于2016-03-30得票数 1

1回答

Spark Streaming + Hbase: NoClassDefFoundError: org/apache/hadoop/hbase/spark/HBaseContext

hadoop、apache-spark、sbt、streaming、hbase

我在试着把Spark Streaming和Hbase连接起来。我对我的代码真正做的就是使用这个，但是我得到了一个奇怪的运行时错误： Exception in thread "streaming-job-executor-8" java.lang.NoClassDefFoundError: org/apache/hadoop/hbase/HBaseConfiguration at buri.sparkour.HBaseInteractor.<init>(HBaseInteractor.java:26) at buri.sparkour.JavaCustomReceiv

浏览 28提问于2017-07-16得票数 0

2回答

无法使用Spark脚本将Spark数据集写入HBase

apache-spark、nullpointerexception、hbase

我正在尝试使用Spark来写入HBase表。我正在使用来自link的HBase火花连接器的例子。我使用spark-shell调用启动以下命令 $ spark-shell --jars /opt/cloudera/parcels/CDH/jars/hbase-spark-2.1.0-cdh6.2.1.jar,/opt/cloudera/parcels/CDH/jars/hbase-client-2.1.0-cdh6.2.1.jar 代码： val sql = spark.sqlContext import java.sql.Date case class Person(name: Strin

浏览 19提问于2021-02-03得票数 1

回答已采纳

1回答

火花-hbase-连接器: ClusterId在ZooKeeper中读取为空

scala、apache-spark、hbase

我试图运行一个简单的程序，将rdd的内容复制到Hbase表中。我是使用火花-hbase-连接器由新阻尼器.我正在运行代码，在我的机器上的本地集群上使用spark submit。火花版本为2.1。这是我正在尝试运行的代码： import org.apache.spark.{SparkConf, SparkContext} import it.nerdammer.spark.hbase._ object HbaseConnect { def main(args: Array[String]) { val sparkConf = new SparkConf()

浏览 0提问于2017-11-22得票数 3

回答已采纳