Apache Spark Scala -数据分析-错误

、

#naive-bayes 为此，我无法加载示例数据 import org.apache.spark.ml.classification.NaiveBayes import org.apache.spark.ml.evaluation.MulticlassClassificationEvaluator("data/mllib/sample_libsvm_data.txt") 上面的代码抛出了这个错误- org.apache.

浏览 12提问于2018-12-27得票数 0

1回答

、

我是新手/仍在学习Apache Spark/Scala。我正在尝试分析一个数据集，并已将该数据集加载到Scala中。但是，当我尝试执行基本分析时，例如最大值、最小值或平均值，我得到一个错误- error: value select is not a member of org.apache.spark.rdd.RDD我在一个组织的云实验室上运行Spark。<em

浏览 25提问于2020-04-15得票数 0

1回答

org/apache/spark/TaskOutputFileAlreadyExistException :java.lang.NoClassDefFoundError

、、、

我读过HDFS中的数据。我分析了它，但我在写作时得到了这个错误。错误的延续 at org.apache.sp

浏览 0提问于2020-05-15得票数 0

回答已采纳

1回答

将数据中的一行解析为类时出错。星星之火

、、

我已经实现了这个代码：import org.apache.spark.rdd.RDDscala> import org.apache.spark.util.IntParam import org.apache.

浏览 1提问于2016-08-24得票数 0

回答已采纳

1回答

Java中的SparkNLP情感分析

、、、、

我想使用默认的训练模型在column1列上的spark数据集上使用SparkNLP进行情感分析。$2.apply(params.scala:780)at org.apache.spark.ml.param.Params$class.getOrDefault(params.scala:779) at org.apache.

浏览 31提问于2019-09-20得票数 4

回答已采纳

3回答

火花-提交失败与纱母，错误要求在scala.Predef失败

、、

$.require(Predef.scala:221) at org.apache.spark.deploy.yarn.Client.createContainerLaunchContext(Client.scala:727) at org.

浏览 2提问于2017-03-15得票数 0

回答已采纳

1回答

在快活的工作中随机获得java.lang.ClassCastException

、

有趣的是，这个错误是在强制转换同一个类时抛出的。到目前为止，还没有发现任何模式。在工作中，我们从hbase获取数据，使用Dataframe使用分析元数据丰富数据，并将其推送到SnappyData中的表中。我们使用的是Snappydata 1.2.0.1。(BlockManager.scala:936)在org.apache.spark。(BlockManager.scala:700) at org.apache.<e

浏览 14提问于2019-01-18得票数 0

回答已采纳

1回答

java.lang.IllegalArgumentException:字段"label“使用SparkML不存在

、、、、

我使用Spark和Scala进行时间序列分析。我有一个来自Cassandra数据库的数据集，如下所示：root 如果我省略了时间戳，并且在VectorAssembler中只使用了一列，它将再次引发一个错误。(StructType.sc

浏览 3提问于2017-08-05得票数 2

1回答

火花数据集- NumberFormatException:零长度BigInteger

、、

当我试图创建一个数据集并简单地从其中收集数据时，我将面临一个奇怪的异常。(LocalTableScanExec.scala:67) at org.apache.spark.sql.Dataset$$anonf

浏览 0提问于2019-03-18得票数 1

回答已采纳

1回答

如何解决DataFrame函数在PySpark - Py4JJavaError中的问题

、、

我试图在PySpark和笔记本中创建和分析数据。下面是我在朱庇特笔记本上的代码。，dataframe，但不知何故，当我试图在df1.show()中使用数据帧函数时，我得到了错误消息。org.apache.spark.api.python.PythonWorkerFactory.create(PythonWorkerFactory.scala:97) at org.apache.spark.SparkEnv.createPythonW

浏览 0提问于2019-01-25得票数 1

1回答

群集wso2应用编程接口管理器网关不向wso2发布统计信息

、

我遵循以下文档，通过UI为API管理器启用分析。我还按照本文档手动启用了对网关工作节点的分析。安装完成后，我重新启动了所有服务器，一切似乎都很正常。(CompressionCodec.scala:60) at org.<e

浏览 2提问于2017-06-01得票数 1

1回答

在不同的机器上运行相同的JAR，在一台机器上使用火花提交崩溃。

、、、

local[*] --deploy-mode client --class com.ibm.cmdwldap.executable.Test <jar-name>.jar at org.apache.spark.deploy.SparkSubmit$.org$apache$spark$deploy$SparkSubmit$$r

浏览 4提问于2019-11-27得票数 0

1回答

为什么LogisticRegression在"IllegalArgumentException: IllegalArgumentException“中失败？

、、、

我得到了这个错误:我试图包含各种语言来解决问题，但这并不是解决问题。at org.apache.spark.sql.types.StructType$$anonfun$apply$1.apply(StructType.scala:264) at scala.collection.AbstractMap.getOrElse(Map.scala:58

浏览 7提问于2017-06-30得票数 2

1回答

svd (单机)上的spark* mllib内存错误*

、、

我有一个很大的数据文件(大约4 GB)，我在一台pc上使用spark分析它。scala> xres27: Long = 302529

浏览 3提问于2015-03-30得票数 1

1回答

将SQLserver jdbc驱动程序连接到Dataproc集群

、、

我正在研究分析航空数据的PySpark应用程序。数据库是MS SQLServer DB。同时连接到服务器上的数据库。我得到一个错误“没有合适的驱动程序”。$$anonfun$7.apply(JDBCOptions.scala:84) at org.apache.spark.sql.execution.datasources.jdbc.JDBCOptions$$anonfun$7.apply(JDBCOptions.scala:

浏览 0提问于2018-11-26得票数 1

3回答

Apache火花多节点聚类

、、、

我目前正在使用apache进行记录器分析。我是阿帕奇·斯派克的新手。我尝试过使用apache独立模式。我可以通过在客户机上提交具有部署模式的jar来运行我的代码。但是我不能运行多节点集群。$.org$apache$spark$util$Utils$$copyRecursive(Utils.scala:514)

浏览 3提问于2015-10-20得票数 0

1回答

org.apache.parquet.column.values.dictionary.PlainValuesDictionary$PlainDoubleDictionary GCP UnsupportedOperationException

、、、、

3月份以来，这2列现在都是双数据类型的。 #i.e. read all the data we have').load(path)我们得到以下错误。(请注意，如果我们执行df.count(

浏览 4提问于2021-06-09得票数 0

1回答

数据库作业失败

、、

我在中有一个工作，当它在azure datalake中保存数据时，会给我一个超时错误。该作业从path1读取新数据。进行一些查询以比较数据并获得最后更新，将这些过滤后的新数据与历史数据进行比较，以获得更多的最新数据，并将结果保存在datalake中。此作业每天运行，因此数据保存在按处理日期划分的数据中。错误是： Py4JJavaError: An error occurred while calling o3507.

浏览 3提问于2022-09-06得票数 0

4回答

由于AbstractMethodError，spark* scala avro写入失败*

、

我正在尝试从avro读取数据，按字段重新划分数据并将其保存为avro格式。下面是我的示例代码。在调试过程中，我不能在我的数据帧上显示(10)。它会失败，并显示以下错误。partitioning_column").format("avro").save("s3://test-bucket/processed/processed.avro") 显示和写入都失败，并显示以下错误(Dataset.scala

浏览 40提问于2019-11-27得票数 0

1回答

java.lang.IllegalStateException:读取增量文件时出错，使用kafka触发结构化流

、、、

在我们的项目中，我使用结构化流+ Kafka进行实时数据分析。我用的是火花2.2，卡夫卡0.10.2。at scala.Option.getOrElse(Option.scala:121) at org.apache.spark.sql.execution.streaming.stat

浏览 7提问于2017-10-12得票数 5

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何在本地使用Scala加载Spark ML的样本数据？