文章/答案/技术大牛

发布

社区首页 >问答首页 >如何为CSV文件指定名称，我用Scala保存到S3中

问如何为CSV文件指定名称，我用Scala保存到S3中
EN

Stack Overflow用户

提问于 2022-01-11 10:10:29

回答 2查看 786关注 0票数 1

当我试图将DataFrame保存为CSV到S3时，将使用Scala生成的名称创建该文件。例如-

  file.coalesce(1).write.option("header", "true").csv(bucket + "/fileName.csv")

使用名为fileName.csv的文件在bucket中创建一个名为part-00000-955faf13-9fc3-4ccc-b0df-fb91cd701901-c000.csv的目录

如何更改文件名或使用特定名称保存文件？

scala

apache-spark

aws-glue

回答 2

Stack Overflow用户

回答已采纳

发布于 2022-01-12 19:27:30

这就是文件保存后对我起作用的原因-

val src = new Path(s"s3a://$bucketName/$pathToDir")
val fs = src.getFileSystem(sc.hadoopConfiguration)
val status = fs.listStatus(src)
status.foreach(filename => {
  fs.rename(new Path(s"s3a://$bucketName/$pathToDir/${filename.getPath.getName}"),
    new Path(s"s3a://$bucketName/$pathToDir/$newFileName"))
})

票数 0

Stack Overflow用户

发布于 2022-01-12 16:09:11

Spark的write方法不能直接控制所写文件的名称。它只能控制目录的名称，而不能控制文件本身。但是，可以在处理后更改文件名：

import org.apache.hadoop.fs._
FileSystem.get(sc.hadoopConfiguration).rename(
new Path("dir/oldName.csv/part-0000"), 
new Path("dir/newName.csv"))

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/70664946

复制

相似问题

问如何为CSV文件指定名称，我用Scala保存到S3中
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何为CSV文件指定名称，我用Scala保存到S3中EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何为CSV文件指定名称，我用Scala保存到S3中
EN