将模型输出写入文本文件spark scala_将scala/spark信息写入MongoDB_Spark Scala将数据帧写入MongoDB - 腾讯云开发者社区

scala、apache-spark、apache-spark-mllib

我使用spark MLlib拟合了以下逻辑回归模型 val df = spark.read.option("header","true").option("inferSchema","true").csv) val predictionAndLabels = results.select("prediction","label").as[(Double, Double)].rdd 最后，我得到了这些模型

浏览 14提问于2020-04-13得票数 0

回答已采纳

1回答

如何将模型的结果保存到文本文件中？

scala、apache-spark、apache-spark-mllib

我试图将从模型生成的频繁项目集保存到文本文件中。代码是Spark库中FPGrowth示例的一个示例。import org.apache.spark.rdd.RDD val d

浏览 0提问于2016-03-13得票数 3

回答已采纳

1回答

Spark scala输入/输出目录

scala、maven、apache-spark

我是Spark/Scala编程的新手，我能够使用maven进行设置，并能够运行示例字数统计程序。我这里有两个问题，这两个问题都是在spark环境/ Windows本地运行的:1. scala程序是如何识别输入的。2.如何将输出写入文本文件。以下是我的代码import org.apache.spark.SparkContext i

浏览 0提问于2016-04-29得票数 0

1回答

Spark-Scala在文本文件中写入输出

scala、apache-spark

我正在执行spark中的wordcount程序，并试图将结果存储在一个文本文件中。Loading /opt/spark-2.0.2-bin

浏览 0提问于2017-10-10得票数 0

1回答

有关创建jar文件的错误: Spark Scala

scala、apache-spark、intellij-idea

我已经内置了使用Apache spark Scala进行逻辑回归的代码。现在，我将使用IntelliJ IDEA创建一个jar文件。但是我得到了一些错误。首先，我使用CSV文件导入数据。然后我拟合了logistic回归模型。之后我对模型进行了评估。最后，我需要将模型评估结果保存到一个文本文件中。当我尝试将模型评估结果写入文件时出现错误。下面是我的jar文件： import org.apache.spark.

浏览 9提问于2020-04-10得票数 0

1回答

将saveAsTextFile()写入多个文件，而不是一个

scala、apache-spark

我现在正在笔记本电脑上使用Spark和Scala。我的代码是： myRDD.map(x => x._1 + "," + x._2).saveAsTextFile("/path/to/output

浏览 4提问于2016-02-17得票数 5

回答已采纳

2回答

如何使用FileFormat格式的更新输出模式？

scala、apache-spark、spark-structured-streaming

我正在尝试在更新输出模式下使用spark structured写入文件。我找到了，只要配置了控制台格式，它就能正常工作。但如果我将输出模式更改为： .writeStream .format("json")(DataSource.scala:279) at org.apache.spark.sql.stre

浏览 12提问于2018-02-28得票数 3

1回答

如何在python中将spark数据帧的输出作为结构化输出写入日志文件

python、apache-spark、pyspark、pyspark-sql、pyspark-dataframes

我已经在pyspark中创建了一个spark dataframe，我想要将过滤后的输出数据写入日志文件或文本文件。让我们把下面的代码看作df df=spark.sql(select * from tbl1) 我希望以下命令的输出为文本文件或日志文件 df.select("col1").show(5) 我试过下面的方法with open("output.txt","a") as f: f.write(t

浏览 27提问于2020-04-16得票数 0

2回答

预加载脚本和在星火壳中解析‘`args`’

scala、apache-spark

我有一个测试脚本来读取作为参数提供的文本文件，如下所示：$ cat test.scalatest2我需要在命令行中运行scala，如下所示：我希望test.txt被识别为args(0)，但我看到的输出如下更新： cat test.sca

浏览 0提问于2019-02-06得票数 2

1回答

scala文件中的RDD处理

scala、apache-spark、apache-spark-sql、rdd

我已经加载了两个csv文件，将RDD转换为DF，并编写了一些连接条件来对它们执行操作。我已经为这些使用了火花壳。现在，我想将所有这些命令放入/捆绑到一个.scala文件中，并通过spark-submit作业运行。目前，我没有使用任何IDE来做这件事，我想从终端运行。我需要为此使用main方法吗？

浏览 0提问于2018-06-06得票数 0

1回答

Spark Streaming :通过从一个HDFSdir读取到另一个来将数据写入到HDFS

scala、apache-spark、hadoop、hdfs

我正在尝试使用火花流将数据从一个HDFS位置读取到另一个HDFS位置下面是我在spark-shell上的代码片段但是我看不到在HDFS输出目录上创建的文件，您能否指出如何在HDFS上加载这些文件scala> sc.stop() scala> import org.apache.spark.streamingscala&g

浏览 12提问于2018-12-21得票数 1

回答已采纳

1回答

使用hive优化hive数据聚合

apache-spark、optimization、hive、distributed-computing、bigdata

我有一个带有followig模式(event_id，country，unit_id，date)的hive表(8,000,000条记录)，我需要将这些数据导出到一个文本文件中，满足以下要求:1- event_id使用spark完成这项工作的最佳性能明智解决方案是什么？注意:这应该是一个批处理作业。

浏览 6提问于2017-05-05得票数 0

1回答

使用spark和scala进行文本提取

scala、apache-spark、spark-streaming、text-extraction

我在scala中有一个文本提取算法，我想在它上面使用spark。我不能理解如何使用它，因为我对spark和scala都是新手，我的算法是这样的 val algoobejct = new ObjectExtract{ save instances to texFile我可以在这里有多个文本文件，这些文本文件很多。有人能

浏览 0提问于2017-03-19得票数 0

1回答

如何将每个输入流中的数据集组合为一个

scala、apache-spark、spark-streaming

如何在应用转换之前将每个火花输入流中的数据集组合为一个。arrEle.show }}现在，它将所有记录写入输出文件。有什么帮助吗？(ClosureCleaner.scala:298) at o

浏览 2提问于2016-08-08得票数 0

1回答

使用spark和scala将ListBuffer[List[Any]]值写入CSV

scala、apache-spark、hadoop、hdfs

创建scala ListBuffer，Spark并将其转换为RDD：import scala.collection.mutable.ListBufferscala.collection.mutable.ListBuffer[List[Any]] = ListBuffer() scala> var src_policy_df = spark

浏览 1提问于2018-11-28得票数 0

回答已采纳

2回答

无法使用Spark结构化流在Parquet文件中写入数据

scala、apache-spark、spark-structured-streaming

我有一个星火结构的流： .readStream .option("kafka.bootstrap.servers.option("endingOffsets", "latest") .load() 我想使用FileSystem将数据写入只有_s

浏览 5提问于2017-05-25得票数 4

回答已采纳

1回答

星星之火MLLIB TFIDF文本聚类Python

python、apache-spark、apache-spark-mllib、tf-idf

我是Spark的新手，我试图使用Python中的Spark将新闻文章作为集群进行集群。新闻文章已经被抓取并存储在本地文件夹/input/中。它包含大约100个小文本文件。htf=HashingTF()现在，我想分开每个文本文件，并输出每个文件的TF-以色列国防军。<init>(PythonRDD.scala:174) at org.apache.s

浏览 3提问于2015-02-19得票数 0

回答已采纳

1回答

Sparkr将DF写入csv/txt文件

r、apache-spark、sparkr

嗨，我在做纱线模式的sparkR。我看到有write.df，但是它会写拼花文件。RdataFrame<-collect(SparkRDF)但是我在contextCleaner上收到了很多警告和一些错误。

浏览 5提问于2016-01-21得票数 2

回答已采纳

1回答

spark Scala读取Avro并保存

scala、apache-spark

我使用下面的代码在spark scala中读取avro文件。val buf = scala.collection.mutable.ListBuffer.empty[GenericRecord] } 我想将此输出保存在文本文件中。

浏览 2提问于2017-09-21得票数 1

2回答

将具有字符串列的数据集写入teradata时获取SQLException

apache-spark、spark-dataframe、teradata

当我试图将数据集从spark写到teradata时，同时在数据集中有一些字符串数据时，我得到了下面的错误： at org.apache.spark.sql.execution.QueryExecution.toRdd(QueryExecution.scala:92) 如何确保数据被正确地写入我正在将csv文件从HDFS读取到dataset

浏览 25提问于2018-01-02得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云