使用不带Databricks的scala将spark 3.0 sql数据帧写入CSV文件时出错_Scala --使用表达式的求值将数据帧写入csv文件 - 腾讯云开发者社区

scala、export-to-csv、azure-databricks

团队成员，我正在处理Azure databricks，我可以使用以下选项将数据帧写入CSV文件： df2018JanAgg.option("header", "true") .save("dbfs:/FileStore/out

浏览 28提问于2019-10-04得票数 1

1回答

使用不带Databricks的scala将spark 3.0 sql数据帧写入CSV文件时出错

python、scala、apache-spark、jupyter-notebook

我正在使用Apache spark 3.0进行开发。我正在从txt文件中读取数据，并在生成rdd之后将其转换为dataframe。我的数据量很大，所以我从dataframe中提取了100个值，并使用模式生成了新的dataframe。在我尝试将这个文件写成csv文件后，我得到了下面的错误。我不想在这里使用databrick。的代码

浏览 22提问于2020-10-01得票数 0

3回答

在spark 1.6中将csv读取为数据帧

scala、apache-spark

我使用的是Spark 1.6，正在尝试将csv (或tsv)文件读取为数据帧。以下是我采取的步骤：scala> import sqlContext.implicits._ scala> val df

浏览 12提问于2016-07-27得票数 2

2回答

Sparkr java错误

java、r、csv、sparkr

当我试图在R中加载数据时：我在使用java时出错。(DefaultSource.s

浏览 8提问于2015-10-20得票数 2

回答已采纳

1回答

从文件系统中填充Properties对象

scala、dataframe、apache-spark、apache-spark-sql、databricks

TL:DR或者，是否有一种方法可以将星火数据帧行转换为一组文本键/值对( Scala会理解)？全面问题：属性文件不是本地的，它位于Databricks集群上。尝试从"dbfs:/“或"/dbfs”读取文件时，在使用</e

浏览 4提问于2020-12-29得票数 1

回答已采纳

2回答

在Pyspark (Spark* 2.1.1)中，将数据帧写入磁盘花费了不现实的长时间*

apache-spark、pyspark、spark-dataframe

我在一台有多个CPU的服务器上运行Pyspark。除了写入磁盘之外，所有其他操作(读取、联接、过滤、自定义UDF)都可以快速执行。我尝试保存的数据帧的大小约为400 gb，具有200个分区。sc.getConf().getAll()我正在尝试使用以下命令进行保存： df.repartition(1).write.csv("out.csv&qu

浏览 1提问于2017-11-28得票数 1

1回答

如何使用scala将RDD[某个case类]转换为csv文件？

scala、csv、apache-spark

我有一个csv case类，我想把它转换成RDDsome文件。我使用的是spark 1.6和scala 2.10.5。stationDetails.toDF.coalesce(1).write.format("com.databricks.spark.csv").save("data/myData.csv") 给出错误:148) at org

浏览 38提问于2019-06-28得票数 0

4回答

databricks:将spark数据帧直接写入excel

databricks

有没有办法把spark数据帧直接写成xls/xlsx格式？但是我想使用spark dataframe来处理我的数据。有什么想法吗？

浏览 0提问于2019-11-29得票数 5

2回答

火花1.6.1上的火花csv读数问题

apache-spark、apache-spark-sql

当我试图使用spark 1.6.1读取CSV文件.I m时遇到错误，下面是我的代码 .format("com.databricks.spark.csv<init>(package.scala:27) at com.databricks.spark.csv</e

浏览 4提问于2016-11-21得票数 1

回答已采纳

2回答

使用sparkR合并大型数据集

r、apache-spark、sparkr

我想知道与“常规R”相比，sparkR是否可以更容易地合并大型数据集？我有12个csv文件，大约500,000行乘40列。这些文件是2014年的月度数据。我想为2014年创建一个文件。这些文件都有相同的列标签，我想按第一列(年份)合并。但是，某些文件的行数比其他文件多。当我运行以下代码时： setwd("C:\\Users\\Anonymous\\Des

浏览 2提问于2016-01-12得票数 1

1回答

如何在数据帧中指定缺少的值

csv、apache-spark、apache-zeppelin、spark-dataframe

我正在尝试使用Apache Zeppelin笔记本使用spark-csv 1将CSV文件加载到Spark数据框中，当加载一个没有值的数值字段时，该行的解析器失败，并且该行被跳过。我原本希望行被加载，数据帧中的值加载行，并将值设置为NULL，这样聚合就会忽略该值。/data.csv") df

浏览 4提问于2015-07-21得票数 6

3回答

用Scala* API将TSV读入Spark Dataframe*

scala、apache-spark

我一直在尝试使用databricks库来读取CSV。我正在尝试使用scala api将hive创建的TSV读取到spark数据帧中。下面是一个可以在spark shell中运行的示例(我公开了示例数据，以便它可以为您工作)import org.apa

浏览 0提问于2015-11-24得票数 29

回答已采纳

1回答

在Server中将CSV文件中的多行数据转换为单行数据

sql-server、csv、pyspark、databricks

我在Databricks平台上使用Scala将一些数据从CSV文件写入SQLMI。问题是，此多行数据写入SQL时位于一行中，格式(换行符)没有保留。This is Multiline data having many lines of text.在SQL Ser

浏览 1提问于2022-08-23得票数 0

1回答

如何在pyspark中将重复列名的数据帧写入csv文件

apache-spark、pyspark、apache-spark-sql、apache-spark-2.0

如何在join操作后将具有相同列名的数据帧写入csv文件。目前，我正在使用以下代码。dfFinal.coalesce(1).write.format('com.databricks.spark.csv').save('/home/user/output/',header = 'true')将在“&#x

浏览 0提问于2018-10-03得票数 6

1回答

无法在spark中写入csv文件

scala、csv、apache-spark、spark-dataframe

我正在尝试使用spark 1.6.1编写csv文件。文件，如下所示：1990,2,2,11992,1,2,2spark-shell --packages(0,4)) df.groupBy("year").pivot("category").agg("category&q

浏览 3提问于2016-08-15得票数 3

回答已采纳

1回答

如何在databricks中使用pyspark将所有行数据从spark* dataframe获取到文件*

python、pyspark、apache-spark-sql、azure-databricks

我正在尝试从spark dataframe中获取所有行数据到databricks中的一个文件中。我能够用很少的计数将df数据写到文件中。假设我在df中得到的计数是100，那么在文件中它的计数是50，所以它跳过了data.How。我可以在不跳过数据的情况下，将完成的数据从dataframe加载到

浏览 1提问于2020-09-30得票数 0

1回答

Spark在RDD中查找字段的重复记录

apache-spark、duplicates、rdd

我有如下数据集: 10，"Name",2016，"Country“11，"Name1",2016，"country1”10，"Name",2016，"Country“10，"Name",2016，"Country”12，"Name2",2017，"Country2“ 我的问题陈述是，我必须按年查找总计数和重复计数。我的结果应该是(年份，总记录，重复) 2016,4,3 2017,1,0。._1

浏览 15提问于2016-08-03得票数 0

1回答

将配置单元表卸载到。使用Spark或pyspark或python的dat文件

python、pyspark、apache-spark-sql、hiveql

我目前正在使用hql将数据从配置单元表卸载到文本文件中。因为它花费了太多的时间。我想去spark或pyspark.I。我是spark/ please的新手。你能帮我解决这个问题吗?我正在使用下面的查询来卸载 beeline --outputformat=dsv --silent=true - e 'select * from <tablename>' > /dir/s

浏览 11提问于2019-10-04得票数 0

1回答

如何用数据库将CSV编写到Azure存储Gen2 (Python)

azure-databricks

我想写reqular文件到存储，但我得到的是文件夹"sample_file.csv“和它下面的4个文件。如何从数据帧创建正常的csv文件到Azure存储Gen2？我很高兴有任何建议或链接到文章。df.coalesce(1).write.option("header"，"true").csv(TargetDirectory + "/

浏览 0提问于2020-12-01得票数 1

1回答

当csv抛出错误时，Spark保存df

apache-spark、spark-csv

我正在使用pyspark并加载了一个数据帧。当我尝试将其另存为CSV文件时，出现以下错误。我这样初始化spark：错误： df.write.save("/mnt/disk/df.csv", 'c

浏览 0提问于2016-05-17得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在Scala中将SQL表直接写入文件

使用不带Databricks的scala将spark 3.0 sql数据帧写入CSV文件时出错

在spark 1.6中将csv读取为数据帧

Sparkr java错误

从文件系统中填充Properties对象

在Pyspark (Spark* 2.1.1)中，将数据帧写入磁盘花费了不现实的长时间*

如何使用scala将RDD[某个case类]转换为csv文件？

databricks:将spark数据帧直接写入excel

火花1.6.1上的火花csv读数问题

使用sparkR合并大型数据集

如何在数据帧中指定缺少的值

用Scala* API将TSV读入Spark Dataframe*

在Server中将CSV文件中的多行数据转换为单行数据

如何在pyspark中将重复列名的数据帧写入csv文件

无法在spark中写入csv文件

如何在databricks中使用pyspark将所有行数据从spark* dataframe获取到文件*

Spark在RDD中查找字段的重复记录

将配置单元表卸载到。使用Spark或pyspark或python的dat文件

如何用数据库将CSV编写到Azure存储Gen2 (Python)

当csv抛出错误时，Spark保存df

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐