我使用的是数据库2.0模型。这里我们不应该在表中使用UPDATE。在RDBMS中,通常采用更新和插入策略来实现SCD-2 .但在我的例子中,我只能使用INSER策略。我的源代码是Kafka输入,它被加载到雪花中(作为avro格式),我正在将它压平并加载到另一个RDBMS格式的表中。
我的问题是:谁能帮我实现SCD类型-2逻辑而不用更新?只有插入策略,我才能做到这一点。
我也应该保留历史。例如,如果我在间隔-a和间隔-b中得到了rec-1,那么我需要加载目标中的所有三条记录,最后一条记录将是最新的记录。
发布于 2022-01-18 14:56:18
您的卫星密钥需要由哈希键+加载日期时间戳组成。然后每个版本都会有一个新的主键,因此可以插入到卫星中。通过查询最新的时间戳,您将得到最新的版本。
您可以在这里找到一个示例脚本:https://simplesqlbi.home.blog/2019/06/29/part-3-data-vault-for-beginners/
https://stackoverflow.com/questions/70757410
复制相似问题