我有一堆拼图文件,带有不同格式的时间戳字段。我想在将数据加载到红移表中时统一格式。但是下面的语法不起作用,它会抛出错误TIMEFORMAT argument is not supported for PARQUET based COPY
。
有什么解决办法吗?我只能想到一个解决方案,那就是统一所有的时间戳格式,同时创建拼花file.Since我必须加载2-3年的拼花文件,所以这个解决方案很耗时。如果你在下面的语法中有任何其他的解决方案或者遗漏了什么,可以告诉我吗
语法:
COPY redshift_table_name
FROM 's3://path/to/files'
IAM_ROLE '*****'
TIMEFORMAT AS 'YYYY-MM-DDTHH:MI:SS'
FORMAT AS PARQUET
发布于 2019-07-09 12:59:48
如果可以使用Pyarrow库,请加载拼花面板,然后使用use_deprecated_int96_timestamps
参数执行write them back out in Parquet format。红移将正确地识别这些。我没有任何幸运,让它正确地识别任何其他时间戳格式时,加载拼图。
https://stackoverflow.com/questions/54671944
复制相似问题