问AWS glue镶木地板转换为s3
EN

Stack Overflow用户

提问于 2018-02-07 01:18:46

回答 1查看 2.2K关注 0票数 0

我们正在使用aws等作业将s3 Json或CSV转换为parquet格式，并将结果保存在nnew s3中。此作业正在定期运行。我们正面临着一个问题，例如，如果我们每次运行都有10json文件，那么它就会创建新的10parquet文件，因此它变成了10 20 30 40....and，因此我们只想看到10个文件。有没有什么方法可以覆盖现有的拼图文件，.We只使用胶水生成的Python脚本。我们可以只转换已更新的文件，还是可以转换所有过期的文件？

etl

aws-glue

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-02-07 01:57:14

如果要使用python覆盖拼图文件，则可以使用df.write.mode('overwrite').parquet("/output/folder/path")。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/48648532

复制

相似问题

问AWS glue镶木地板转换为s3
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问AWS glue镶木地板转换为s3EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问AWS glue镶木地板转换为s3
EN