我们有一个Azure数据工厂管道,它执行一个简单的数据流,它接收来自cosmosdb的数据,并在DataLake中进行汇。作为目标优化逻辑,我们使用分区类型作为密钥,使用唯一值分区作为cosmosdb 标识符。目标Dataset还具有压缩类型,即gzip和压缩级别 to (最快<code>E 221</code>)数据按预期进行分区,但我们没有看到所创建的文件的压缩。这是预
目前在CosmosDB中存储来自多个客户(公司)的遥测数据。由于某些安全遵从性,我们至少必须坚持客户数据的“逻辑”分区。因此,作为guid的客户"corporationId“对我们的分区密钥来说是最有意义的。在我们的应用程序代码中,每当我们执行查询时,我们必须始终包括分区键,这确保了我们不会在客户之间意外地查询数据(并提高查询性能)。
CosmosDB目前有一个20 ha