Spark写入具有自定义扩展名的文件

文章/答案/技术大牛

发布

1回答

、

我有一个包含单行文本的DataFrame。我需要写，而每个文件(来自每个DataFrame分区)都有自定义的扩展名.XYZ。目前，我使用以下代码来编写文件： dataFrame.write.text(outputPath) 但是，此代码使用默认扩展名写入文件。目前，我通过在写完文件后重新命名文件来控制扩展名，我想通过写带有所需扩展名的文件

浏览 43提问于2020-02-01得票数 0

回答已采纳

4回答

在VBscript中写入/读取具有自定义扩展名的外部文件

、

如何使用VBscript写入或读取具有自定义扩展名的外部文件(例如，它可能具有.cyc扩展名而不是.txt扩展名)？我不知道是怎么回事，似乎也搞不明白。对于读取文件，是否可以只读取文件的一部分？在我的文件中，我的脚本如何只读取string1行，以及它如何将文本值分配给vbscript文件中的

浏览 3提问于2009-06-20得票数 2

回答已采纳

1回答

写入时对数据进行分区的自定义文件格式

您好，我想将我的spark数据帧保存到一个具有自定义文件格式的文件中，以便它在写入文件时将数据分区到不同的文件中。此外，我需要为每个分区关键字的单一部分文件。我已经尝试扩展TextBasedFileFormat和change writer来满足我的需求。在没有随机写入文件的情况下对数据进行分区

浏览 16提问于2019-05-29得票数 0

回答已采纳

1回答

将文件名输出到pyspark中的最终文件夹

、

我想要将数据写入输出文件夹，而不使用标准格式spark： ? 有没有办法输出只有一个特定的文件名和扩展名(json)的数据？提前感谢您的帮助！

浏览 19提问于2019-12-10得票数 1

回答已采纳

2回答

Spark SQL如何读取压缩的csv文件？

、、

我曾尝试使用spark.read.csv接口读取扩展名为bz或gzip的压缩csv文件。啊，真灵。但在源代码中，我找不到任何可以声明codec类型的选项参数。即使在这个中，也只有写入端的codec设置。谁能告诉我或者给我显示spark 2.x版本如何处理压缩的csv文件的源代码的路径。

浏览 1提问于2017-06-28得票数 5

1回答

使用Apache解析亚马逊S3中的文件

、、、

我正在使用Apache，我必须解析亚马逊S3中的文件。在从亚马逊S3路径获取文件时，我如何知道文件扩展名？

浏览 4提问于2017-04-27得票数 1

回答已采纳

1回答

如何在完成写入后下载SFTP中的文件

、

我如何知道该文件仍在写入过程中。由于我正在轮询文件夹位置以搜索存在的任何文件，因此仅当下载完成时才下载文件。我正在通过JSCH java使用SFTP。

浏览 0提问于2017-07-13得票数 1

1回答

如何在多个节点之间划分Spark* Dataframe，每个节点都有唯一的密钥*

、、

我是Spark Dataframe的新手。我有一个很大的Dataframe，在Spark集群中有一个键列，有4个节点。对于每个键，我在Dataframe中有几条记录；因此，只要内存有容量，我希望在每个节点中都有具有相同键的记录。如果节点内存已满，则将剩余数据移至另一节点。你能指导我怎么做吗？我曾经研究过用partionBy编写pair RDD上刚刚使用的Spark自定义分区。它将每个唯一组合的数据写入</e

浏览 17提问于2021-09-16得票数 0

1回答

SparkContext无法读取存储在HDFS中的文件，但命令"hadoop fs -text“可以正确读取。

、

如前所述，有些文件存储在HDFS中。有什么帮助吗？

浏览 0提问于2016-06-08得票数 0

1回答

、

我有一个使用命令行写入文本文件的文件列表(提取的具有特定扩展名的文件列表)。我希望将这些文件写入zip文件，但不是将所有文件写入根目录，而是维护目录结构。

浏览 4提问于2022-04-07得票数 -2

回答已采纳

1回答

Jmeter中的自定义文件类型的Mime类型

、

我正在尝试通过Jmeter文件上传来上传具有我们自己的文件扩展名的自定义文件类型。我的自定义文件类型带有自定义扩展名，实际上是一个包含各种xml和其他文件的zip归档文件。我不确定我应该为自定义文件使用的mime类型。但是，我尝试使用application&

浏览 41提问于2019-05-02得票数 0

1回答

如何读取数据库中安装的dbc文件？

、、、、

我尝试读取databricks中的dbc文件(从s3桶中挂载)，文件路径是：df=spark.read.parquet(file_location)AnalysisException: Unable to infer schema for

浏览 11提问于2022-02-25得票数 1

1回答

正在读取某个其他程序仍在写入/复制的文件

、

我有一个文件监视器应用程序，当在文件夹中创建新文件时，它会通知我的java类。我有一个cronjob，它会在文件准备就绪时复制文件夹中的文件。这些文件很大(3000万行)，所以复制文件需要一段时间才能完成。但是我的文件监视器应用程序会在文件创建后立即通知，所以在这种情况下，下面的代码会抛出IOException BufferedReader br = new Bu

浏览 0提问于2014-07-10得票数 0

1回答

读取gzipped CSV文件时的奇怪字符

、、、、

我试图读取一个CSV文件，我保存为UTF-8编码文件。当我尝试用Pandas读取文件时，需要很长时间，但我得到了所需的输出。在Spark中执行几乎相同的操作，从HDFS读取完全

浏览 0提问于2021-01-11得票数 0

回答已采纳

1回答

如何读取带有textBox自定义扩展名的文件

、、、

有没有办法读取带有textBox自定义扩展名的文件？有没有到一些支持的格式的转换？我需要读取具有自定义扩展名的文件，如text.blahblahblah。

浏览 2提问于2011-08-09得票数 2

回答已采纳

1回答

如何在遍历文件夹和子文件夹时找到具有预定义扩展名的文件？

、、、

你能告诉我如何循环通过文件夹和它的子文件夹，以便将路径写入到具有预定义扩展名的文件。文件扩展名将作为数组。文件路径最好也保存在数组中。

浏览 1提问于2017-01-09得票数 0

回答已采纳

1回答

PostgreSQL日志的目的地

我几乎像告诉那样调优了服务器的变量，但是log_destination是'csvlog‘。之后，在数据目录中：将日志写入<

浏览 1提问于2013-08-27得票数 2

回答已采纳

1回答

如何使用Dropbox sync Api将Android手机中的图片文件夹同步到Dropbox

、

如何使用Dropbox sync Api将Android手机中的整个图片文件夹同步到Dropbox？03-04 20:38:42.010: W/libDropboxSync.so(thr)(23160): util.cpp:124: int dropbox_wait_for_first_synclibDropboxSync.so(ERR)(23160): DROPBO

浏览 1提问于2014-03-04得票数 0

2回答

正在将文件写入临时位置

我有一个要求写一个文件作为PHP脚本的一部分(具有自定义文件扩展名的XML内容)，然后一旦文件已被保存，然后附加到电子邮件，我将使用PHP邮件发送。发送电子邮件的部分很好，但我以前从来没有用PHP写过文件。该文件仅在脚本持续时间内需要，不需要永久保留。处理完文件后，我需要清理临时位置吗？如果是这样的话，是怎么做

浏览 0提问于2012-02-15得票数 8

4回答

AWS Glue-如何以.txt文件的形式在S3中编写动态框架，并使用'|‘作为分隔符

、、、

我想将动态框架作为文本文件写入S3，并使用'|‘作为分隔符。如何修改下面的代码，使Glue将帧保存为.txt文件，并使用'|‘作为分隔符。

浏览 0提问于2021-04-08得票数 0

点击加载更多