首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >将不同类型的文件从Azur Azur湖复制到具有属性的Azur Gen2湖(类似于上次更新)

将不同类型的文件从Azur Azur湖复制到具有属性的Azur Gen2湖(类似于上次更新)
EN

Stack Overflow用户
提问于 2020-09-21 00:44:43
回答 2查看 108关注 0票数 1

我需要将我所有的数据从Azur数据湖Gen1迁移到Gen2湖。在我的湖里,我们有不同类型的混合文件(.txt,.zip,.json和许多其他)。我们想把他们按原样搬到GEN2湖。此外,我们还希望维护所有文件的最后更新时间作为GEN1湖。

我希望在这个用例中使用ADF。但是为此,我们需要定义数据集,并且为了定义数据集,我们必须定义数据格式(Avro、json、xml、二进制等)。由于我们混合了不同类型的数据,我尝试使用二进制格式。但是对于二进制格式,目地处的所有文件都具有内容类型"application/octate-stream“。也不能保留文件更新时间。

EN

回答 2

Stack Overflow用户

发布于 2020-09-21 11:15:16

正如您所说,当文件被复制到Data Lake Gen2时,所有文件的属性都将更改,例如‘上次修改’时间。

像文件上传一样,这些文件是在Gen 2中新创建的,Azure将为它们创建新的属性。这就是为什么我们不能在Gen 1中保留旧的财产。

当使用二进制格式作为数据集时,所有的内容类型都是application/octate-stream,我们也不能改变它。

Gen1和Gen 2之间的属性差异(我将文件从Gen 1复制到Gen 2):

除非我们下载'word.csv‘文件并重新上传,否则内容类型将更改为application/vnd.ms-excel

HTH。

票数 0
EN

Stack Overflow用户

发布于 2020-10-09 23:32:38

最后修改时间是表示文件系统/容器中的修改的系统元数据,且它不能被更新。添加用户元数据以从源捕获元数据是一种变通方法,powershell/.net/java sdk可用于更新其他属性。下面的解决方法是在PowerShell中实现的

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63981373

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档