我对雪花很陌生,所以如果答案是显而易见的,请原谅我。
我正在使用data将数据从on加载到Azure中,然后使用副本将数据装入雪花中。但是,我需要启用一些转换后的数据对其他平台的访问,这意味着如果我在雪花中执行转换,我需要在Azure中创建一个外部表(实际上是将这些数据推回Azure,以便其他平台可以访问它)。
由于我们并不特别想引入一个新工具,所以对于我们的基本转换,我有两个选择:
除了增加存储成本之外,备选方案2还有什么主要缺点吗?
我试图权衡以下几点:维护工作(我们团队的技能在于SQL而不是ADF)、成本和性能。
如有任何建议,将不胜感激。
发布于 2021-01-05 21:45:07
正如问题中所述,这个场景有很多可能的答案--我最喜欢的是第二个方案(“在SQL脚本中执行雪花转换,然后创建一个外部表,以便其他团队可以使用其他工具访问数据”)。
如果您需要在Azure存储上提供这些转换的结果,Azure Data就支持这一点:
或者您可以使用ADF使用的相同的COPY INTO来管理雪花内部。
让我在雪花网站上添加几张截图:“数据仓库还是数据湖?如何在一个平台上实现这两种功能”:



https://stackoverflow.com/questions/65585594
复制相似问题